如何使用Biopython3的Entrez下载NCBI全部的细菌基因组数据。

Ensembl和NCBI都是盛名的基因组研究机构提供相关的基因组结构注释文件,比如gtf或者gff但注释的id却不是统一的。比如基因IDEnsembl有Ensembl gene id,NCBI有entrez gene id不同的人用的基因注释文件来源不同,就需要進行转换本文主要讲如何利用Ensembl的Biomart,下载对应关系

整合了各种生物学注释数据,提供了易于操作的界面在线提供批量下载,以加速科學研究Ensembl已应用提供相关服务。

第一步选择相应的数据库

点击count,显示共66232个基因中的66232个基因被选中

第四步查看或者下载数据

点击Results可以显礻相关结果,可以指定每页显示的条目个数如果有相对应的ID,则会显示

此外可以保存为本地文件,选择保存为gz格式tab分割(tsv),点击go即可下载到本地gz文件中包含mart_export.txt文件。文件截图如下

}

如果是基因组信息的话选择框裏先选择:Nucleotide

然后,输入序列号或者输入你要找的基因的名称

找到以后点击FASTA,可以下载也可以直接复制。

一般都是存TXT格式这样用软件汾析才能载入

你对这个回答的评价是?

}

我要回帖

更多关于 python 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信