何书艺 发表于 2025-11-11 11:45:03

GEO单细胞数据建立Seurat对象全过程与错误修复示例

进行单细胞转录组分析,有时候用到公共数据集,尤其是从GEO下载的10X数据,很多研究者常常会遇到一个令人头疼的问题——数据明明能读入,却无法正常创建Seurat对象。本文通过一个真实案例,带大家一起排查并解决这一问题。
这次遇到的问题发生在对数据集“GSM533785HC2”进行分析时。和往常一样,首先加载Seurat包,然后使用CreateSeuratObject()函数创建Seurat对象:
library(Seurat)
SeuratObject =CreateSeuratObject(counts = Read10X('GSM533785HC2',gene.column = 2),
                     project = 'GSM533785HC2', min.cells = 3,
                     min.features = 200)结果报错Error: No feature overlap between existing object and new layer data.

但是有运行的一些信息
10X data contains more than one type and is being returned as a list containing matrices of each type.Warning: Feature names cannot have underscores ('_'), replacing with dashes ('-')
说明数据已经能读取,但是并不能建立seruat对象,查看matrix矩阵信息与features信息、barcodes细胞数据是否一致,细胞数量,基因数量都对应上了,matrix第一列基因,第二列细胞,也都对应上了,到底哪里出了问题?



经过查看features文件,在文件末尾发现基因类型不一样,正常情况下都是Gene Expression,多出了Antibody Capture.

既然前面发现了数据能读取,那么先使用Read10X读取文件。

查看一下counts,发现counts是一个list,并不是创建seurat对象的矩阵文件,当中有Gene Expression和Antibody Capture两个矩阵,问题就是这里了。


那么接下来从counts中提取Gene Expression矩阵进行创建即可
SeuratObject =CreateSeuratObject(counts = counts$`Gene Expression`,
                                 project = 'GSM533785HC2', min.cells = 3,
                                 min.features = 200)运行结果没问题,并且能正常的NormalizeData。

从这个案例可以看出,Seurat读取10X数据时会自动识别不同类型的数据层,如果数据中既包含RNA表达量,又包含抗体捕获信号或其他组学类型,就会返回一个list结构而不是单一矩阵。若不加注意直接传入CreateSeuratObject,就会触发“feature不匹配”的报错。
因此,在处理公共数据或多模态数据时,建议在创建对象之前,始终先用str()或names()查看Read10X()的返回结构,明确其中包含哪些数据类型,再提取合适的那一部分用于构建Seurat对象。 
下载GEO或ArrayExpress中的单细胞数据时都会遇到类似困扰。错误信息中的“feature overlap”通常意味着输入数据结构与Seurat期望的矩阵格式不符,当Read10X()输出为list时,一定要注意手动提取Gene Expression矩阵。
 
 
 

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

赀倦 发表于 2025-11-18 21:05:23

东西不错很实用谢谢分享

党新苗 发表于 2025-12-4 20:32:23

感谢,下载保存了

辉伫 发表于 2025-12-9 11:56:00

感谢,下载保存了

上官泰 发表于 2025-12-16 13:15:10

东西不错很实用谢谢分享

普料飕 发表于 2025-12-20 19:27:19

过来提前占个楼

高小雨 发表于 2025-12-21 15:59:20

过来提前占个楼

钤凑讪 发表于 2025-12-25 00:54:41

东西不错很实用谢谢分享

挫莉虻 发表于 2025-12-25 14:54:22

鼓励转贴优秀软件安全工具和文档!

申屠梓彤 发表于 2025-12-26 16:55:55

很好很强大我过来先占个楼 待编辑

匡菲 发表于 2026-1-12 01:57:50

谢谢楼主提供!

裆趾针 发表于 2026-1-14 02:47:12

感谢,下载保存了

缑莺韵 发表于 2026-1-15 20:12:10

新版吗?好像是停更了吧。

赘暨逢 发表于 2026-1-21 06:44:53

前排留名,哈哈哈

徙办 发表于 2026-1-21 08:13:02

新版吗?好像是停更了吧。

谭皎洁 发表于 2026-1-21 20:51:51

谢谢楼主提供!

劳怡月 发表于 2026-1-28 09:57:50

感谢分享,下载保存了,貌似很强大

赴忽 发表于 2026-1-30 06:06:53

东西不错很实用谢谢分享

挽幽 发表于 2026-2-3 06:45:52

收藏一下   不知道什么时候能用到

尹疋 发表于 2026-2-4 07:16:59

鼓励转贴优秀软件安全工具和文档!
页: [1] 2
查看完整版本: GEO单细胞数据建立Seurat对象全过程与错误修复示例