利用整合的组学网络重构玉米发育图谱
发布时间:2018-05-03         浏览人次:         发布人:

英文标题:Integration of omic networks in a developmental atlas of maize

中文标题:利用整合的组网络重构玉米发育图谱

作者:Justin W. Walley, Ryan C. Sartor, Zhouxin Shen, Robert J. Schmitz, Kevin J. Wu, Mark A. Urich, Joseph R. Nery, Laurie G. Smith, James C. Schnable, Joseph R. Ecker, Steven P. Briggs

第一单位:University of California San Diego

发表杂志:Science, 2016, 353 (6301) :814-818

解读人:韩乃博士


摘要

共表达网络和基因调控网络能够系统地预测单个基因功能。为了进行网络重建,作者建立了一个大规模的与玉米发育过程相关的基因表达谱,其中涉及62547个 mRNA,17862修饰蛋白,以及拥有31595个磷酸化修饰位点的6227个磷蛋白。研究发现基于mRNA表达量而构建共表达网络与基于蛋白表达量网络存在较大差异,仅有15%的高度互连核心节点在RNA和蛋白网络中是保守尽管如此基于不同类型数据构建的网络仍然能够富集到相似的本体论类别,并且能够有效预测已知的基因调控关系组学mRNA、蛋白质磷蛋白)的整合分析能够极大提高基因调控网络的预测能力。


正文

系统地预测基因功能是生物学领域的一个复杂挑战。目前随着高通量测序技术的成熟以及成本的速下降,大量的转录组数据被用于构建基因组范围的基因调控网络(GRNs)共表达网络。然而,mRNA并不能完全代表蛋白丰度,众多研究显示mRNA丰度蛋白丰度仅存在较弱的正相关这意味着加入蛋白数据可能会极大的改善仅基于转录组基因调控网络质量。因此在本研究中,作者建立了玉米发育过程23组织的转录组、蛋白质组和磷蛋白数据,探讨多组学合并数据相比于单组学数据,构建基因调控网络和共表达网络所优势

作者首先利用10979个基因重建共表达网络(图1A)。通过斯皮尔曼相关系数,衡量mRNAmRNA之间,以及蛋白蛋白之间的相关性为了直接比较mRNA和蛋白质共表达网络,并编译一个信度的共表达数据集,每一个网络被限制只包括相关指数大于0.75的边界。分析结果显示122029个边界在两个网络中是保守的,占总体的6.1%(1B)。尽管这个边界重叠区远大于随机期望的0.8%,但是大多数基因关系具有网络独特性即使将边界数目扩大到100万,上述指标发生显著改变这一结果之前一系列研究相吻合,也即mRNA和蛋白质具有较的正相关。

共表达网络一个关键特征是存在少量连接度的核心节点通常一个节点代表一个基因。核心节点比非核心节点在网络完整度有机体存活中具有重要意义,因此判定这些所谓的核心节点是网络分析的重心之一结果显示大多数核心节点是mRNA蛋白质网络所独有,而共同的核心节点15%左右(图1C)

图1. 共表达网络分析。(A)假设的非定向共表达子网络显示mRNA和蛋白质网络中保守的(实线)和非保守的(虚线)共表达边界。(B)利用维恩图展示边界保守性(C)每个节点的边界数目,X轴代表蛋白数,Y轴代表mRNA数红色点基于mRNA分析得到的核心节点,色点为基于蛋白分析得到的核心节点,绿色为共同获得的核心节点。

共表达网络中的模块进行富集分析,结果显示大多数模块都能显著富集到一个或多个Mapman类别mRNA和蛋白质网络模块类别富集程度方面总体上相似但是显著富集的类别中基因实际存在网络独特性(35%存在于蛋白网络,27%存在于mRNA网络,38%为两者共有)(2)这些发现表明不同类型数据预测到基因相关性和功能也不尽相同推测造成mRNA蛋白质共表达网络不一致原因主要是mRNA丰度和蛋白质丰度间有限的相关性有限的相关性,可能受mRNA和蛋白质的稳定性、翻译调控以及蛋白转运等因素影响

图2共表达网络模块的类别富集分析

相比于共表达网络,GRN能够直接展示转录因子及其靶基因(3A)因此为了深入探索玉米发育过程中的基因表达调控模式,作者分别利用mRNA蛋白质和磷酸数据构建了三个基因调控网络(GRN)为了构建这些网络,转录因子方面选择2200个可定量mRNA、545个可定量的蛋白质以及441个可定量磷酸肽而靶基因数据集则来自于41021个定量的mRNA。公布两类经典的玉米转录因子(同源转录因子KN1和bZIP转录因子Opaque2)来进行GRN质量评估评估方法是绘制工作者受试曲线(ROC)和正确率-召回率曲线尽管两种曲线显示出三个GRNs在总体质量方面较为相似,但细看得分500位的结果发现基于蛋白数据两个GRNs能够更准确预测靶基因(3B)KN1子网络准确预测到108(mRNA),129(蛋白质)125(磷酸肽)个靶基因,而O2子网络表现类似。此外,研究还发现在准确预测的靶基因存在GRN独特性且比例不低(KN1有44%O231%)(图4B)。上述结果表明利用不同表达数据进行GRN预测,能够极大的互补

将GRN分析扩大到所有转录因子作者同样发现存在较低的边界保守性大多数边界仍为不同GRN独有——例如边界数100万时,93%的边界存在于单一的GRN(3C)边界20万时,数值增加到96%。一发现说明转录因子mRNA、蛋白质和磷酸化层面不同积累模式,导致截然不同的GRN预测结果

为了检测多组学数据的整合分析是否能够改善单组学分析结果,作者另外构建了四个GRNs并利用KN1和O2相关数据来评估网络质量(3)结果显示基于多组学GRN预测优于单组学预测。图3D中显示仅用mRNA信息推断转录因子活性,计算的ROC曲线下方面积(AUC)0.657进一步结合蛋白丰度以及磷酸化水平信息,AUC增加到0.717这表明如果进行假阳性率为20%网络预测时仅凭mRNA数据,阳性40%利用多组学整合分析则能提高到50%3E揭示了类似的结果——如果进行精确度0.021网络预测仅凭mRNA数据,只有16%阳性率,而整合分析则提高到41%。

图3无监督的基因调控网络(GRN)分析。

 

提示和启发

1.大多数基因在mRNA水平和蛋白质水平呈现较弱的正相关性,mRNA丰度并不能客观反映蛋白丰度,导致mRNA分析结果的真阳性率相对较低,因此进行蛋白质组学研究是十分必要的。

2.然而由于目前蛋白质组学技术发展相对缓慢,存在通量低、成本高的劣势。如能通过联合其他组学(如转录组、磷蛋白质组、代谢组等)进行整合性分析,则能够获得多样的基因信息,有助于全面系统地解析复杂生物学过程背后的分子调控机制。

3.抗体组是蛋白质组学研究的重要手段之一,不但具有更高的重复性和稳定性,同时还进行蛋白定位、互作等方面的研究,这一优势是基于质谱技术的蛋白质组学所无法实现的。


其他文章:

艾比玛特医药科技(上海)有限公司
上海市徐汇区桂平路333号聚科生物园区1号楼1-3层

邮箱:market@ab-mart.com

应聘职位:hr@ab-mart.com

总机:021-34695901

热线:4006-123-828

邮箱:market@ab-mart.com

总机:021-34695901

热线:4006-123-828


沪ICP备17056956号-2    艾比玛特医药科技(上海)有限公司