在生物化学和药物研发等领域的研究中,获取准确且全面的化学实体信息至关重要。ChEBI(Chemical Entities of Biological Interest)数据库作为一个专注于生物相关化学实体的重要资源,其数据广泛应用于代谢通路分析、药物设计及化学信息学研究,为科研工作者提供了丰富而有价值的数据。今天,我们就来深入了解一下 ChEBI 数据库及其使用方法。
一、ChEBI 数据库简介
ChEBI 由欧洲生物信息学研究所(EMBL-EBI)维护,是一个免费且经过人工注释的数据库,主要聚焦于 “小型” 化学化合物这类分子实体,涵盖天然产物以及用于干预生物体过程的合成产物,但通常不包括基因组编码的大分子(如核酸、蛋白质及其裂解产生的肽段)。
它不仅包含分子实体,还涉及分子实体的基团以及实体类别。该数据库目前收录了注释数据超 61,000 个条目,每个条目都在本体中进行了分类,并被赋予多种注释,包括(若相关)化学结构、数据库交叉引用、同义词以及文献引用等信息,其数据来源广泛且经过高标准人工注释,使用国际纯粹与应用化学联合会(IUPAC)以及国际生物化学与分子生物学联盟命名委员会(NC-IUBMB)认可的命名法、符号和术语,确保了数据的权威性与准确性。
二、基础功能与数据获取
1. 登录数据库
打开浏览器,输入 ChEBI 数据库的官方网址:https://www.ebi.ac.uk/chebi/ ,即可进入数据库首页。首页界面简洁明了,主要功能区域清晰分布。
2. 查询方式
简单文本搜索:在首页的搜索框中,可输入多种信息进行查询。
- 分子名称:例如输入 “paracetamol”(对乙酰氨基酚),能快速查找该分子的相关信息。
- ChEBI 标识符:格式为 “chebi:XXXXXX”,如 “chebi:16526”。
- IUPAC 国际化学标识符(InChI):以特定的编码形式描述化学结构,如 “InChI=1S/CO2/c2-1-3”。
- 分子式:像 “C6H12O6”(葡萄糖的分子式)。
- 化学文摘社登记号(CAS):例如 “124-38-9”(二氧化碳的 CAS 号)。
高级搜索:点击搜索框旁边的 “Advanced Search” 链接,进入高级搜索页面。这里可进行更复杂、精准的筛选,能结合文本、化学结构以及本体关系等多方面条件进行联合搜索。例如,若要查找具有特定结构片段且参与某类生物过程的化学实体,就可在此通过绘制结构以及设置本体相关条件来实现。
3. 执行查询与获取结果
输入查询内容或设置好高级搜索条件后,点击 “Search” 按钮,数据库将开始检索并呈现结果页面。结果页面会展示与查询匹配的 ChEBI 条目列表,每个条目包含基本信息预览,如推荐的 ChEBI 名称、ChEBI ID 等。搜索结果支持下载,可选择以 TSV(制表符分隔值)、XML(可扩展标记语言)或 SDF(结构数据文件)等格式下载,方便导入到其他分析软件或应用程序中作进一步处理。
4. 查看详细信息
点击感兴趣的条目,进入详细信息页面。以某一化合物条目为例,页面左上角会展示其化学结构(若可绘制),结构下方有相关操作链接,如 “Find compounds which contain this structure”(查找包含此结构的化合物)、“Find compounds which resemble this structure”(查找与此结构相似的化合物)等。
页面右侧会呈现该化学实体的诸多详细信息,包括本体定义、星级状态(“三星” 表示完全注释条目,数据可靠性更高;还有部分是在其他地方整理但尚未经 ChEBI 策展人检查的数据)、二级标识符(即与该记录合并的其他记录的标识符,搜索任意二级 ID 可自动定位并显示合并后的记录)以及丰富的交叉引用信息,链接到其他相关数据库,如 PubChem、KEGG 等,便于获取更全面的数据。同时,若有相关 Wikipedia 文章,也会在此列出链接。
三、结果解读与应用
在结果解读方面,需关注化学实体在生物过程中的角色以及与其他分子的关系等信息。例如,从物质本体分类关系中,可了解该化学实体在整个生物化学体系中的层级位置,判断其与上下游分子的关联,这对于理解生物通路以及药物作用机制至关重要。
在实际应用中,ChEBI 数据库可助力药物研发,通过查询已知药物或潜在药物分子的信息,分析其结构与活性关系,为新药物设计提供参考;在生物化学研究中,帮助科研人员确定参与特定生物过程的化学物质,深入探究生物化学反应机制;还可用于代谢组学研究,对代谢物进行准确注释和分类等。应用场景具体如下:
- 代谢物注释 :将非靶向代谢组学结果中的未知峰匹配到ChEBI条目,获取其化学名称与功能描述。
- 药物靶点分析 :通过ChEBI的关联文献模块,筛选与特定疾病相关的化合物及其作用机制。
- 标准化命名 :在跨数据库整合时,使用ChEBI ID作为唯一标识符,避免化学名称歧义。
四、数据下载
对于数据批量需求,可通过访问https://www.ebi.ac.uk/chebi/downloadsForward.do进行需求数据下载。数据格式包括SDF(结构数据)、OWL(本体文件)等等,可根据下游分析工具选择适配格式 。
通过以上对 ChEBI 数据库使用方法的介绍,希望能帮助大家更好地利用这一强大的生物信息学资源,推动相关科研工作的开展。更多细节可参考官方文档(https://www.ebi.ac.uk/chebi/about.do),在使用过程中,不断探索其更多功能,挖掘数据背后的价值,为生物化学及相关领域的研究带来新的突破。
【免责声明】发布内容来源于互联网、业内人士投稿以及微信公众号等公开资源,我们对文中观点持中立态度,文中观点不代表本平台的立场。所有文章仅供读者参考和交流使用。转载的文章版权归原作者所有,如有侵权行为,请及时与我们联系以便删除。