Ensembl和NCBI都是盛名的基因组研究机构提供相关的基因组结构注释文件,比如gtf或者gff但注释的id却不是统一的。比如基因IDEnsembl有Ensembl gene id,NCBI有entrez gene id不同的人用的基因注释文件来源不同,就需要進行转换本文主要讲如何利用Ensembl的Biomart,下载对应关系
整合了各种生物学注释数据,提供了易于操作的界面在线提供批量下载,以加速科學研究Ensembl已应用提供相关服务。
第一步选择相应的数据库
点击count,显示共66232个基因中的66232个基因被选中
第四步查看或者下载数据
点击Results可以显礻相关结果,可以指定每页显示的条目个数如果有相对应的ID,则会显示
此外可以保存为本地文件,选择保存为gz格式tab分割(tsv),点击go即可下载到本地gz文件中包含mart_export.txt文件。文件截图如下