在生信研究中,了解分子间的相互作用对于揭示生物过程的机制至关重要。分子之间相互作用是细胞内分子间通讯的重要方式之一。它涉及蛋白质与蛋白质、蛋白质与核酸以及核酸与核酸之间的相互作用。这些相互作用可以影响细胞内的信号传递、基因表达调控、代谢调控等生物学过程。
随着研究的深入,各种相互作用数据库应运而生,为科研人员提供了丰富的资源。今天,我们就来介绍一些常用的相互作用数据库,帮助大家在研究中更好地利用这些工具。
一、IntAct 数据库
数据库链接:https://www.ebi.ac.uk/intact
IntAct 数据库是国际分子交换联盟(IMEx)的成员数据库之一,目前已整合了 IMEx 的所有数据。它是一个集中的公共分子相互作用存储库,数据主要来源于文献整理和用户直接提交,大部分为蛋白质 - 蛋白质相互作用数据,也包含少量其他分子(如小分子化合物、核酸)的相互作用信息。
IntAct 支持多种查询方式,用户可在检索结果页面自定义展示列信息,并选择相应格式下载数据。通过 “Graph” 按钮,还能直观显示查询蛋白的相互作用网络。
不过,与 STRING 数据库相比,IntAct 在检索功能上存在一定局限性,仅适用于查询单个蛋白的相互作用网络,若要查询多个蛋白间的相互作用网络,则需自行编写脚本从整个相互作用网络中提取信息 。
BioGRID 数据库
数据库链接:https://thebiogrid.org/
BioGRID 即 The Biological General Repository for Interaction Datasets,是一个开放式获取数据库,专注于整理和存档所有主要模式生物及人类的蛋白质、遗传和化学相互作用数据。目前,BioGRID 从87122篇出版物中,手动注释了 2890191条生物相互作用记录,这些记录通过一套更新的实验检测方法控制词汇表进行分类。同时,该数据库还收录了超过110万个翻译后修饰位点。
值得一提的是,BioGRID 现在涵盖了化学相互作用数据,其中包括从 DrugBank 数据库中提取的人类药物靶点的化学 - 蛋白质相互作用,以及文献中手动整理的生物活性化合物。此外,BioGRID 的一个新模块专门注释基于全基因组 CRISPR/Cas9 筛选的基因 - 表型和基因 - 基因关系。其扩展资源 Open Repository for CRISPR Screens(ORCS)数据库目前包含在人类或小鼠细胞系中进行的 500 多个全基因组筛选结果。BioGRID 中的所有数据均可免费获取,无任何限制,可直接以标准格式下载,并能通过其网络服务平台轻松整合到现有应用程序中,还通过合作的模式生物数据库和元数据库免费分发,为科研人员提供了极大的便利。
ChemBL 数据库
数据库链接:https://www.ebi.ac.uk/chembl/
ChemBL 是一个经过人工精心整理的具有类药物活性分子的数据库。它将化学、生物活性和基因组数据整合在一起,旨在助力将基因组信息转化为有效的新型药物。
在数据内容上,ChemBL 包含大量经过实验验证的小分子化合物及其对应的生物活性数据,这些数据来源于科学文献、专利以及其他相关数据库。研究人员可以通过该数据库查找特定小分子与蛋白质靶点之间的相互作用信息,例如结合亲和力、活性抑制数据等。这对于药物研发过程中先导化合物的发现与优化极为关键,能够帮助科研人员快速筛选出具有潜在药用价值的分子,并深入了解它们与靶点的作用机制,从而缩短药物研发周期,降低研发成本 。
STRING 数据库
数据库链接:https://string-db.org/
STRING(Search Tool for the Retrieval of Interacting Genes/Proteins)是一款广泛使用的蛋白质 - 蛋白质相互作用预测与可视化数据库。它整合了实验数据、计算预测结果以及已有的生物学知识,能为用户提供全面的蛋白质相互作用信息。
数据来源上,STRING 涵盖实验验证的相互作用、计算预测的相互作用、文献挖掘信息以及其他数据库的数据。其功能十分强大,不仅能展示蛋白质之间直接(物理)和间接(功能)的相互作用,还允许用户查询特定基因或蛋白质的相互作用网络,并对网络进行可视化及拓扑分析。比如,当研究某个疾病相关基因时,通过 STRING 数据库,能直观看到该基因编码蛋白质与其他蛋白质的相互作用关系,助力探究疾病发病机制。
CellPhoneDB 数据库
数据库链接:https://www.Cellphonedb.org/
CellPhoneDB 是一款专注于细胞通讯分析的工具,其自建的配体 - 受体数据库集成了 UniProt、Ensembl、PDB、IUPHAR 等多个数据库的数据,存储了上千种蛋白质参与的 2,923 种相互作用。
更新至第四版后,CellPhoneDB 在原有异聚体复合物基础上,纳入了细胞间通讯的特定蛋白质和非蛋白质家族(非基因编码)的通讯配对关系,为蛋白质功能研究开辟了新途径,如在多组学关联分析中发挥重要作用。用户通过输入 Ensenbl ID、基因名称、Uniprot ID 或蛋白、复合物名称,即可快速搜索目标蛋白配对信息。
这些常用的相互作用数据库各有特点和优势,在实际研究中,科研人员可根据自身研究目的和需求,选择合适的数据库,深入挖掘分子间相互作用信息,推动生物信息学研究不断向前发展。
【免责声明】发布内容来源于互联网、业内人士投稿以及微信公众号等公开资源,我们对文中观点持中立态度,文中观点不代表本平台的立场。所有文章仅供读者参考和交流使用。转载的文章版权归原作者所有,如有侵权行为,请及时与我们联系以便删除。