你是否曾在海量基因数据库中迷失方向?是否因基因信息分散在多个平台而效率低下?当你想深入了解某个基因的信息,比如它与哪些疾病相关、涉及的信号通路、与哪些蛋白质有相互作用、与哪些药物化合物相关、转录本信息、表达模式、同源基因或变异基因等,传统的方法是查阅大量文献。但这显然非常耗时和低效。今天,我们为你揭秘一款科研“神器”——GeneCards生物医学数据库!
GeneCards介绍
GeneCards 是全球最全面的基因信息整合平台之一,汇聚整合了来自多个权威来源的数据,包括NCBI、UCSC、Ensembl、Uniprot等近200个网站的信息。
它提供了有关所有已知和预测的人类基因的简明信息,涵盖了基因组学、转录组学、蛋白质组学、遗传学、临床研究及功能数据等内容。其功能包括疾病关联、突变与多态性、基因表达、基因功能、生物路径、蛋白质相互作用、相关药物与化合物,以及先进研究工具(如抗体、重组蛋白、克隆、表达分析和RNAi试剂)等。
GeneCards是一个可搜索的综合性数据库,提供关于所有已注释和预测人类基因的信息。它收录了超过46万个基因信息,其中包括超过2万个与疾病相关的基因,能够为研究者提供全面的基因相关数据,极大地简化了基因研究过程。可以一键查询基因功能、疾病关联、通路与药物靶点,助你快速锁定研究方向!
网址:https://www.genecards.org/
基本信息
创建背景:Genecards由以色列魏茨曼科学研究所与美国Lifemap生物科技联合开发的综合性数据库,自1997年上线以来,至今已有20多年的历史,已成为全球生命科学领域核心资源。
数据规模:截至2025年3月,收录超过44.3万个人类基因条目(含2.2万种疾病相关基因),整合来自NCBI、UniProt、OMIM等近200个权威数据源的信息。
更新频率:每月同步更新,例如2025年3月发布的Version 5.24,包含最新基因组注释及临床关联数据。
访问方式:官网(www.genecards.org)提供免费学术访问,商业用途需授权。
多维度数据整合
基因组学:基因组坐标、调控元件(如TMEM164基因的增强子信息)、染色体定位。
转录组学:整合GTEx数据,展示基因在54种人体组织中的表达谱(如STAT3基因在免疫细胞中高表达)。
蛋白质组学:蛋白结构域(如BRCA1的BRCT结构域)、亚细胞定位、翻译后修饰信息。
临床医学:关联OMIM疾病表型(如APOE与阿尔茨海默病)、ClinVar变异分级、FDA批准药物靶点(如EGFR抑制剂)。
使用教程
智能检索
系统基础检索:支持基因符号(如TP53)、疾病名(如“乳腺癌”)、药物名(如“伊马替尼”)直接查询。
高级检索:通过布尔逻辑组合关键词(如“BRCA1 AND ovarian cancer NOT mutation”)、染色体区间(chr17:76,378,926-76,397,516)或表达模式(如“肝脏特异性高表达”)筛选。
批量检索:可上传基因列表文件(如ENSG00000141510;ENSG00000171862)进行批量信息提取。
跨库关联:例如,将HGNC基因命名(如HLA-DRB1)与DrugBank药物条目(如DB00005阿达木单抗)直接关联,实现“基因-药物”一站式查询。
今天我们主要为大家讲解Genecards 的基因信息检索以下三种模式:快速检索、高级检索、基因检索。
1.快速检索
快速检索通过检索内容直接列出‘Genecards’中相关的信息(如TP53),然后点击搜索按钮。
得到一个列表数据,结果按照“Score”进行展示(值越高,说明检索的结果越相似),可以看到结果中不仅包含了”TP53“基因本身,也包括了信息当中提到了”TP53“的其他基因。
每列数据说明:
- Symbol:基因名称。
- Description:基因全称。
- Category:基因类目。
- Uniprot ID:该基因对应Uniprot数据库编号。
- GIFts:Genecards 对基因功能预测程度的评分,分数越高,表示功能注释信息越多。
- GC id:基因在Genecards中的编号。
- Score:检索结果与检索条目的相关性,分数越高,说明检索结果与检索关键词越相符。
点击检索结果前面的“+“号,可以看到更详细的检索结果。结果中”TP53“被标红显示,而蓝色的字为超链接,如果需要了解更详细的相关内容,可以点进相应链接。
2. 基因检索
在搜索框输入基因名称(如TP53)、符号或别名(如“抑癌蛋白P53”)可根据提示词进行补全。
结果中主要包含四个部分:
1. Genecard标题:包含基因名称、基因类型、基因全称、更新日期和Genecard访问号。
2. 快速索引目录:点击即可跳转相应板块信息。
3. 相关产物目录:列出基因相关的产物数据。
4. 基因相关产品:包含公司Logo和对应的产品链接。
快速访问板块中,每个板块包含的内容如下:
Aliases | 名称和别称 |
Disorders | 基因相关的疾病 |
Domains | 家族成员、功能结构域 |
Drugs | 基因相关的药物或化合物及其信息 |
Expression | 基因在正常组织/细胞中的表达、共表达基因 |
Function | 蛋白功能(包括疾病、表型等)、动物模型、靶向基因的miRNA |
Genomics | 基因序列、大小、定位、调控元件(启动子、增强子)、转录因子等 |
Localization | 基因表达的亚细胞定位 |
Orthologs | 直系同源基因 |
Paralogs | 旁系同源基因 |
Pathways | 基因相关的信号通路、相互作用分子 |
Products | 基因相关的商业化产品 |
Proteins | 蛋白氨基酸序列、结构、剪接异构体、翻译后修饰等 |
Publications | 已发表文献 |
Sources | 基因信息来源 |
Summaries | 基因概述,包括功能、表型、机制等信息 |
Transcripts | 不同转录本的mRNA和cDNA序列、基因编辑相关产品 |
Variants | SNP、拷贝数变异及影响 |
3. 高级搜索
点击“Advanced“进入高级检索模式后,我们会看到两个条件检索栏。
以检索” LAYN基因相关的lncRNA和假基因“为例。
高级检索模式可以在Section中可以筛选期望检索词出现在哪一信息板块。而上方有一栏检索词会随着我们的输入和设置进行自动变换,方便我们更直观地查看自己的检索策略。当情况更为复杂时,就可以借助高级检索模式。
本期介绍就到这里,后续还有更多科研工具的功能使用方法分享,欢迎继续关注哟!
【免责声明】发布内容来源于互联网、业内人士投稿以及微信公众号等公开资源,我们对文中观点持中立态度,文中观点不代表本平台的立场。所有文章仅供读者参考和交流使用。转载的文章版权归原作者所有,如有侵权行为,请及时与我们联系以便删除。