基因测序

CN
您现在的位置: 首页 /  资讯

Science | 卡罗林斯卡学院与华大等团队联合发表人类、猪、小鼠大脑中的蛋白编码基因图谱

时间:2020-03-06作者:华大智造阅读数:521分享

大脑是哺乳动物体内最复杂的器官,具有多种多样的生理机能,错综复杂的细胞结构以及极为丰富的基因表达。在不同脑区、细胞和亚细胞层面鉴定大脑的分子构成,必将推进我们对正常和患病状态下大脑功能的认识和理解。


美国时间3月5日,由卡罗林斯卡学院、瑞典皇家理工学院和华大等团队共同完成的一项题目为“人类、猪、小鼠大脑中的蛋白编码基因图谱”的研究发表于Science(影响因子41)。该研究基于多种转录组学方法和抗体图谱技术,对大脑不同区域进行了全面、深入的分子解析,并且提供了高质量的蛋白编码基因的分子图谱,为进一步研究提供了有力的武器。


人类蛋白图谱(The Human Protein Atlas,HPA)是一个大规模研究项目,旨在结合转录组学与蛋白组学,探索不同细胞、组织和器官的转录本和蛋白质的空间表达水平。目前,HPA下的组织图谱(The Tissue Atlas)仅仅包含有限的几个人类大脑区域(大脑皮层、海马、尾状核和小脑)的数据。正因如此,我们迫切需要更加深入的研究,从而增进对于中枢神经系统的细胞动力学背后复杂的分子过程的理解。


该研究成功地构建了哺乳动物大脑的基因图谱,是对现有的若干个大脑图谱项目的重要补充。为了确定大脑在不同系统发育顺序上的差异和相似性,研究涵盖了三个物种的表达谱:灵长类动物(人),偶蹄目(猪)和啮齿目动物(小鼠)。研究的重要部分之一是将蛋白图谱和转录组数据相结合,对小鼠大脑多个区域的特定蛋白进行了深入研究。所有数据——包括高分辨率图像和元数据——全部公开以便后续研究。


研究团队首先对GTEx、CAGE和HPA数据库的人转录组数据,以及猪和小鼠的转录组数据进行了归一化,从而消除批次效应,便于进行比较分析。团队利用UMAP(The Uniform Manifold Approximation and Projection,一种降维算法)分析不同脑区间的基因表达模式,并借助现有的HPA脑图谱数据,将猪和小鼠的转录组数据一对一地对应到人的同源基因上。三个物种的大脑均被划分成10个区域,分别是嗅球、大脑皮质、海马体、杏仁核、基底核、下丘脑、丘脑、中脑、脑桥和延髓,以及小脑。聚类结果显示,三个物种的脑干区(中脑、丘脑、脑桥和延髓)的基因表达较为接近,与下丘脑的差异也较小,而大脑皮质、海马体和杏仁核互相之间更为接近。为了确定不同脑区的分子特征,研究团队根据基因表达特异性进行了分类。在三个物种中,小脑都是包含最多特异性上调基因的脑区。为了进一步分析不同物种间上调基因的差异,研究人员按大脑结构进行了划分:大脑、下丘脑、脑干和小脑。围绕这些上调的基因,分层树分析支持了先前的大脑结构理论,下丘脑和小脑被聚类到了一起,与此同时脑干和大脑也聚类到一起。


图1.三个物种不同脑区的基因表达特征


研究团队鉴定出537个不同脑区高表达的基因,包括人们较为熟知的甘丙肽、催产素、加压素编码基因(下丘脑),TBR1, SATB2和NEUROD6等转录因子(大脑),Hox基因(脑干)等,也有一些高表达基因的功能尚待进一步的探索。对这些基因的表达进行物种间的比较带来了许多新发现,比如,由中间神经元细胞表达的转录因子TFAP2B在三个物种间有着相似的表达,而促泌素(secretagogin,SCGN),一种在嗅球中表达的钙结合蛋白,在人小脑的星状细胞中也有表达,而在猪和小鼠中则没有。这些差异表达基因可能与大脑的某些功能相关联。


图2.物种间的基因表达比较


大脑功能的实现有赖于不同类型的、具有不同“化学表型”的神经元构成的复杂回路。研究人员分析了三个物种细胞识别基因的分布情况,包括:1053个转录因子;与神经递质生成、运输和清除相关的63个相关基因;以及118个已知的神经递质和神经肽的受体的基因。某些转录因子在物种间是高度保守的,如EMX1和BHLHE22。而某些则在物种间差异较大,如NEUROD1作为小鼠小脑发育的关键基因之一,不仅在小脑,而且在猪和小鼠的视网膜细胞中也有表达,人视网膜细胞则没有。


围绕神经递质产生和运输的相关基因,研究人员发现负责合成神经递质的酶在三个物种的分布较为相似,体现出哺乳动物大脑构成的保守性,而少数例外情况,也即不同物种间的差异,可能会为神经药理学研究提供一些线索。比如和目前至少30%处方药的作用机制密切相关的G蛋白偶联受体(GPCRs)的相关基因,在三个物种间的表达模式存在差异,因此在新药研发的动物实验中应该加以考虑。



图3.哺乳动物大脑中细胞识别基因的表达谱


研究人员对大脑相对于全身其他组织/器官的基因表达进行了比较分析,分为脑组织上调基因、其他组织上调基因和低组织特异性基因。对于公认的420个神经元、星形胶质细胞、少突胶质细胞和小胶质细胞的特征基因(signature gene)的分析表明,这些基因在其他组织也可能有高表达,在相关的研究中应该采取更为全面与整体性的视角。


图4.大脑中特征基因在全身各组织的表达


总而言之,该研究结合转录组学、蛋白图谱等多维度数据,对人、猪、小鼠脑中的编码基因进行了深入、细致的解析。人类大脑图谱(Human Brain Atlas,http://www.proteinatlas.org/brain)的构建,将为全世界研究者提供更为丰富的数据资源,以利于对哺乳动物大脑的基因组学研究和进一步探索。


华大智造测序平台


本项研究基于华大智造MGISEQ-2000和BGISEQ-500测序平台完成。据悉,MGISEQ-2000是华大智造基因测序仪的主力机型,单机运行数据产出达75-1440GB, 支持多种读长,满负荷PE150最快仅需38小时,支持科研、医学临床、司法、农业等领域应用。


华大智造MGISEQ-2000测序平台


该测序仪以华大智造独有的DNBSEQTM技术为核心,是一款全面灵活型的大通量测序平台,可灵活支持多种不同的测序模式,能在较短时间内完成完整的测序流程。其数据产出具有高准确性、低重复序列率和低标签跳跃的优势(MGISEQ-2000在部分海外国家产品名称切换为DNBSEQ-G400)。