PPI 分析

蛋白质-蛋白质相互作用(protein-protein interaction, PPI)是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(protein complex)的过程。在进行数据挖掘的时候往往会得到很多的差异表达的基因,当你对着一堆基因毫无头绪时,此时PPI数据库对你的数据挖掘起了很大的助攻作用。

常用的PPI分析数据库有STRINGbioGRID,然而在分析时其功能也是有一定的局限性,所以今天我给大家这个数据库在预测分析上功能更加强大,废话不多说,直接往下看。

该数据库名字叫做GeNets(网址:http://apps.broadinstitute.org/genets#),我们可以利用这个数据通过机器学习方法对差异基因(你寻找的一组差异基因)进行分析,找出其关键基因以及信号通路;同时该数据库也可以通过聚类讲寻找到的差异基因进行聚类;更人性化的是可以长期保存你所输入的一组数据,每次用的时候直接调用数据就可以了。(进入数据库后直接简单注册就能免费使用, 推荐使用谷歌浏览器)。

image.png

进入数据库后选择快速可视化选项,基因列表可以选择你以前保存的,也可以选择粘贴新的,将需要分析的基因列表粘贴进去即可在网络选择中可以选择GEO数据库作为数据的训练集,同时也可选择Web3(包括多个数据库,推荐使用),选好之后直接点绿色图标就可以了。

image

该图就是你所分析的数据库,点击箭头3所指向的链接即可对输入的基因列表进行可视化。

image

可视化结果如下图:其中不同的颜色代表不同的分类,通过机器学习的方法将其聚类到不同的疾病模型和信号通路上,点击箭头1所指向的区域可以查看富集分析的结果。

image

同时将页面下拉可以得到具体的分析结果,同时得到对输入基因进行注释的结果:

image

点击GENE SET ANALYSIS中的pre-GWAS分析可以得到下面的结果:

image

蛋白质之间的相互作用构成了细胞生化反应网络的一个主要组成部分,对调控细胞及其信号有重要意义。
相互作用蛋白质数据库收集了由实验验证及文献挖掘的蛋白质-蛋白质相互作用,常用的在线工具有DIP(Database of Interacting Protein)、BioGRID (database of protein and genetic interaction)、HPRD (human protein reference database)、STRING、EVEX。

DIP可以使用基因的名字等关键词、序列、模体/功能域、文献、实验等进行查询。

image

BioGRID是一个经典的蛋白质相互作用数据库, 目前版本是3.5.170,该版本从68,754篇文献中整理出了1,670,339个蛋白质和遗传相互作用,28,093个嵌合体信息以及726,378个来自主要模式生物物种翻译后修饰信息。

image

HPRD 数据库只收录人的蛋白相互作用信息,来源于文献挖掘的最大的人蛋白相互作用数据库,有PTM(翻译后修饰)、亚细胞定位、结构域等信息。

image

STRING数据库是一个覆盖的物种最多,相互作用信息做大的,查询已知蛋白质之间和预测蛋白质之间相互作用的数据库。

image

EVEX是一款以基因为检索对象,以PubMed和PubMed Central中发表文章的摘要和全文为依据的文本挖掘(text mining)数据库。

image
参考文章

1.换种姿势做PPI分析
2.筛选差异基因进行PPI分析

你可能感兴趣的:(PPI 分析)