嘿,各位科研小伙伴们!今天给大家安利一个宝藏数据库——人类细胞图谱(HCA)数据库,堪称单细胞研究的“百科全书”!无论你是新手小白,还是资深学者,这篇攻略都能帮你快速上手,玩转海量细胞数据~
一、HCA 简介
简单来说,HCA数据库(https://data.humancellatlas.org/)是一个全面的、高质量的、可访问的人类细胞图谱数据库,支持生物学、医学和生物信息学领域的研究和应用。其涵盖人类所有主要器官和组织类型,包括大脑、心脏、肺、肝、肾、胰腺、肠道、生殖系统等。
目前,HCA总共已解析6740万细胞数据,这些数据来自10.3k位捐献者,由951个实验室的506个项目组成。
HCA 数据门户网站存储并提供世界各地实验室提供的单细胞数据。任何人都可以贡献数据、查找数据或访问社区工具和应用程序。
二、使用场景说明
1. 查找感兴趣的项目
Data Portal Explore (数据门户探索) 页面按标题列出所有项目以及关键项目关联数据。项目列表可以按照关联数据值进行筛选。
点击第一个项目,可以查看项目的详细信息。
项目信息页面包含:
- 项目标题和描述
- 贡献者信息、协作组织和项目联系人
- 与项目相关的任何出版物或登录资料
- 项目详细信息,例如物种、器官和文库构建方法
- 输入计数
- 项目元数据下载链接
- 指向项目 HCA Data Portal 生成的计数矩阵下载的链接(如果可用)
- 指向项目参与者生成的矩阵的链接(如果可用)
2. 下载项目元数据
点击项目中的 Metadata 选项卡,对于TSV 文件包含完整的项目元数据。
TSV 包含项目中的每个文件,每列表示每个 metadata 属性。TSV 文件提供了项目元数据图的表示形式。
3. 下载 Project HCA Data Portal 生成的矩阵
选择 Matrices(项目矩阵)选项卡。点击下载图标。
当然也可以选择 Download 选项卡,选择包含在下载文件中的数据。
选择好后,点击 Request curl Command ,将打开一个包含 curl 命令的新窗口。 将此 curl 命令粘贴到本地或基于云的终端中就可以下载数据啦。
4. 查找和探索生物网络数据
HCA 主页列出了所有HCA 生物网络以及与每个网络关联的图谱数量。一些生物网络可能具有多个图谱,它们是单个图谱的不同版本,或专用于不同感兴趣组织的图谱。
点击 Lung 选项卡,可以查看 Lung Network 的概述页面。
页面包含的信息有:
- 生物网络的描述
- 生物网络成员的联系信息
- 有关与 Biological Network 关联的图谱的信息,包括名称、组织和疾病 ,并且预估的单细胞计数。
如果生物网络的图谱仍在开发中,则生物网络概述页面将有一个 **Datasets 选项卡,您可以在其中浏览包含该生物感兴趣组织数据的 HCA 项目 网络。
5. 查找和探索 Atlas 数据
点击图谱名称 "The integrated Human Lung Cell Atlas (HLCA) v1.0"。
跳转到新页面
Atlas Overview 页面包含:
- 谱图的描述
- 与图谱相关的 Biological Network、出版物和代码
- 图谱集成员的联系信息
- 组分图谱列表,包括名称、组织、疾病、估计的细胞计数和下载数据的链接。
要查看图集中的所有项目,在页面上选择 Source Datasets (源数据集) 选项卡。
三、拓展介绍
HCA 元数据标准支持五个主要实体:项目、生物材料(生物样本)、协议、流程和文件。用来列出用于描述人类细胞图集中数据集的当前元数据字段集。
每个部分中的元数据字段表示实验的不同部分生物材料(例如组织样本)可以经过处理(例如解离)以产生另一种生物材料(例如离解的细胞样本)或一组数据文件(fastq文件)。实际执行的过程遵循特定协议这些部分构成了整个项目(例如,了解人类心脏中的细胞类型)。
通过这篇文章你应该对HCA Data Portal有了一个初步的认识,如果有需要的话,就赶紧试试吧!
【免责声明】发布内容来源于互联网、业内人士投稿以及微信公众号等公开资源,我们对文中观点持中立态度,文中观点不代表本平台的立场。所有文章仅供读者参考和交流使用。转载的文章版权归原作者所有,如有侵权行为,请及时与我们联系以便删除。