高通量基因测序测序数据open 和denovo 方法结果差异大吗

基于Solexa平台高通量测序数据的分析与处理流程研究_刘永波_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
基于Solexa平台高通量测序数据的分析与处理流程研究_刘永波
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩4页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢作为34亿RMB后基因组计划的一部分,千年基因自成功启动“全基因组denovosurvey测序&分析免费赠送活动”后,为更多考虑大家的要求开展更多项目并扩大研究,千年基因将继续提供总额为500万元..
真核生物18SrRNA  与细菌多样性分析类似,在真核微生物中也有三类核糖体RNA(rRNA),包括5.8SrRNA、18SrRNA和28SrRNA。  18SrRNA基因是编码真核生物核糖体小亚基的DNA序列,其中既有保守区..
细菌或原核生物16SrRNA  细菌核糖体RNA(rRNA)有三种类型:5SrRNA(120bp)、16SrRNA(约1540bp)和23SrRNA(约2900bp)。5SrRNA基因序列较短,包含的遗传信息较少,不适于细菌种类的分析鉴..
古细菌多样性分析16SrRNA  古细菌(archaebacteria)又叫古生菌、古菌,是一类很特殊的细菌,同时具有原核生物和真核生物的某些特征。古细菌多生活在各种极端的生态环境中,它们代表了生命的..
微生物多样性及宏基因组分析宏基因组学(metagenomics)是一种以环境样品中的微生物群体所有基因组作为研究对象,利用基因组学的研究策略研究环境样品中所包含的全部微生物的遗传组成及其群落功..
对肿瘤组织的全基因组DNA进行测序,并以此为基础进行个体或群体水平的差异性分析。通过全基因组重测序,研究者可以找到大量的单核苷酸多态性位点(SNP)、拷贝数变异(CopyNumberVariation,CNV..
基因组测序分为denovo测序和重测序。denovo测序即从头测序,不需要任何参考基因组信息即可对某个物种的基因组进行测序,利用生物信息学分析方法进行拼接、组装,获得该物种的基因组序列图谱,从..
SSH差减文库的构建介绍SSH(suppressionsubtractivehybridization)技术是1996年由Diatchenko等发展起来的,它是一种鉴定、分离组织细胞中选择性表达基因的技术。其原理是以抑制性多聚酶链反应(..
DNA测序1全基因组测序(WGS)2外显子组测序(Exome-seq)3目标区域测序(Targetseq)转录调控测序4转录组测序(RNA-seq)5数字基因表达谱(DGE)6lncRNA测序7SmallRNA测序8全基因组DNA甲基化测..
千年基因在国内首次推出动植物全基因组denovosurvey测序和分析免费赠送活动!无知识产权和论文作者共享等约束条件,千年基因承担全部测序分析费用。作为34亿RMB后基因组计划的一部分,千年基因..
请留下您的意见
All Rights Reserved 京ICP备号-3
请选择您要的提交给的对象
请注册并登陆服务方会员中心
A. 没有账号,现在
B. 已有服务方账号,马上
您现在是需求方身份,不能发布服务!
对外提供服务需建立服务方 ,已有账号去
请留下您的联系方式,方便我们给您解决问题
您填写的邮箱还未注册易科学高通量数据处理的一些经验和建议
已有 13483 次阅读
|系统分类:
最近一年时间里收到很多同学和朋友关于数据处理的询问,通过,微信,人人网和邮件等各种途径,当然不少也是面对面的讨论。这些同学和朋友包括同组的,跨组的,同所的,跨所的,其他大学的,来自北京的、南京的、广州的、西安的,甚至也有国外的中国朋友。有些朋友我素未谋面,也不知长相如何,不知男女。有时候同一天能收到五六份邮件,问题之五花八门,有时已经超越了我所能够解答的范围。这些现象也反映了当前生物信息学的急剧变革,第二代测序技术就像问世一些,彻底席卷和重新定义了当前生态学研究的方法和手段。而几年前费用昂贵的第二代测序如今已旧时王谢堂前燕,飞入寻常百姓家,于是乎大潮裹挟之下的硕士生博士生们都想出来耍耍,扔个十几万块钱,希望能够轻松的收获几篇文章。科研论文的发表讲究猎奇性,大家都喜欢看到新奇的方法和漂亮的图表。但我认为这其实也是当今科研界的弊端之一,讲究创新和手段的先进,而忽视了研究的重要性。以微生物生态学的旗舰杂志为例,最近一年多发表的学术论文里,第二代测序技术已经是寻常方法,所谓第三代的单细胞测序技术也开始出现。研究生物信息学的来自美国科罗拉多的能够作为的高级主编,方法对于微生物生态学研究的重要性可见一斑。前几天读到阿伯丁大学的教授在上发表的一篇观点文章,在这里面他讲到,第二代测序只不过是一个工具而已,我们的研究依旧要从扎扎实实的假设出发,设计实验来解决问题和验证假设。高通量测序并不能弥补实验设计的缺陷。我在阅读文章的过程中也发现,设计合理和完整的实验,即使使用传统的测序技术,依旧能够说明和解决问题,并能够发表到高档次期刊上。而如果使用第二代测序技术,但是数据处理有问题,数据质量控制不好,文章也很难得到发表,相当于花钱买罪受。我从年秋天开始学习数据的处理,在学习的起始阶段,能够和师弟袁超磊一起探讨和交流,并且几乎阅读了上所有与第二代测序技术有关的文章,所以能够很快的上手。在此我也对师弟袁超磊表示正式的感谢,祝愿他在阿德雷德大学能吃上可口的饭菜。很多朋友的问题我未能一一解答,在此也表示歉意。我经历过学习数据处理的漫长和痛苦的过程,我很清楚有时候一句话或者一段话很难解决所问的问题。去年我自己投出的文章经历了很多次的拒稿,十几位审稿人和生物信息学家对数据处理提出了建议,现在经过在悉尼和生物信息学专家的讨论,我也能够更加合理地看待数据处理的问题。摸着石头过河的一些经验和建议,在这里进行分享,希望正在摸索和思考中的你,觉得并不孤单。和那个软件更好?是美国密歇根大学的在年开发的数据处理平台,它的前身是软件,相信大家都听说过。这两个软件的发音分别为和,是献给他的妻子和女儿的。另一个被广泛使用的数据处理平台是也是美国科罗拉多等人于年开发出来的。截至今天,的方法文献已经被引用次,而被引用次。这说明比有更广泛的群众基础。我刚开始学习使用的就是我个人非常喜欢这个开源的数据处理平台,基本能够实现我的所有数据处理目的。软件无需安装,在和系统上都可以运行。我研究了每一个中间导出文件的格式和原理,所以我能够将这些中间产生的文件导入其他软件进行处理和做图,比如语言。很多人不喜欢,都是因为不能够直接出图,必须依赖于其他软件。而这正式我所喜欢的原因,我现在也正在进一步学习语言,的做图功能是非常强大的,其实大家平时看到文章上那些非常漂亮的图,大都是语言做出来的。所以,如果将和结合,我认为是一个能正确处理数据并完美展现数据的途径。除了罗氏数据处理之外,现在也有了针对数据的处理方式,大家从的网页上就可以读到写的标准数据处理流程。现在携苹果电脑的时髦,也得到了很多人的青睐。这个软件我本人没有真正使用过,但是知道只能在和系统上运行,当然也可以通过在系统上安装来运行。这个软件出图的效果比较好,很多人把直接出的图用来发表文章。我所在的悉尼这边的研究所的生物信息学专家也是用来处理数据。我就这个软件问题和他讨论了好多次。基本来说,两个软件都可以帮助我们实现正确的数据处理,并不存在哪个更好的问题,只有个人在使用上的喜好。我希望你无论使用那个软件,都仔仔细细阅读软件网页上的教程,并熟悉所有的命令。自己一一试试各个命令,合理组合命令,这样才会通过修改命令来正确处理自己的数据。这个过程没人可以帮你,只有你自己能够救赎自己。数据处理难学吗这是一个我一直以来很想告诉所有人的问题。说实话,那两个软件都很好使用,有标准的处理流程在那里等着你,把所有数据处理下来绝对不超过十天时间。但是,为什么我们几个月甚至一年都拿不下来数据处理?因为数据处理的难点不在于软件的使用,而在于你对微生物生态学基本概念的了解。我认为我们需要在数据处理之前就应该特别清楚的是)α多样性的各种指标。数据条数的多少会直接影响α多样性的计算结果,它们之间是正相关关系。所以计算α多样性必须统一序列条数。而我们知道统一序列条数就会舍弃很多条数不足的样品,这个取舍就涉及到很多的经验问题,需要你阅读很多的文献来了解;)β多样性的表征方式。我研究β多样性的时候,阅读了很多相关的文献,对指数,等都非常了解。选择能够最好表现你多样性差异的指数,需要花很多很多的汗水。)多元统计方法。这个又是更大的难点了,不会告诉你,也不会告诉你。你只有去阅读教材,阅读文章,才能弥补这些缺陷。不然你连那些命令都读不懂,还谈什么数据处理,修改命令。)文章的构思。这又是更高一级的知识预储备了。在你的数据处理之前,请阅读所有高质量期刊上的相关文章,至少需要预估计,你可以出哪些图,做哪些分析。其实在数据处理的过程中已经是你不断验证假设和推翻假设的过程。希望你在数据处理之前踏踏实实地做好这些功课,不然你很难完美运行各个命令。另外,要仔细研究各个软件的原理,做到人机合一的效果。因为有时候软件并不能解决所有问题,比如在的时候,有时候在部分区域比对效果不好,你需要使用合适的软件打开这些中间文件,手动进行删除,不然会影响后续的多样性计算。所以,你需要把自己练成一台机器。年我做过同位素超高速离心,尽管已经有很多文献可供参考,我当时还是研究了离心机的原理和等密度梯度离心的原理,所以自己就很清楚应当如何优化实验条件,获得最好的数据。细菌和古菌数据和功能基因数据处理的不同?如果你处理的是细菌数据,那么恭喜你,你应该很容易完成数据处理,因为和都包含了细菌比对和分类的数据库。因为细菌的研究已经非常多,所以分类的效果也很好,未知的类别一般也很少。如果是古菌的话,,,等数据库我都用过,分类效果都很差,但是不影响你的多样性分析。因为古菌的纯培养仍然很少,分类问题仍然是处于发展阶段。你基本也可以顺利按照标准流程完成数据处理。但是功能基因的话,就面临很大很大的难题。如果想测序功能基因的同学,一定要三思而后行,我自己在这方面进行了很多的尝试,虽然知道处理的方式,但是解释起来真的很难。就像我在上面所说的,如果你不了解和的文件格式,基本架构,我很难告诉你怎么去实现自己的目的。所以大家也可以看到,现在发表的关于功能基因测序的文章很少很少。大家基本都是,都是一些很熟悉生物信息学的国外实验室发表的。希望你能认识到功能基因处理的难点第一步是比对,一开始就做不了。因为没有可供使用的数据库。我的经验是自己做一些,从上下载功能基因序列,然后自己通过或者比对的很齐,然后作为参比序列;)分类。这个更难,需要经过之后,分成不同的,然后从每个中选择一个代表序列,通过进行分类。)分。对于细菌和古菌而言,代表水平,但是功能基因就完全不一样。以氨氧化微生物研究为例,的应当是,而应当是,所以和数据完全不同。对于必须要做功能基因的同学,我建议可以考虑基因芯片()的方法。现在针对和基因的基因芯片都已经开发的非常完善,国际合作也不是难题。通过设计的探针合理解决了分类的问题,价格比测序也便宜,数据处理简单。所以我认为是一种更好的方式。以上所写,难免有错误之处。我以分享知识为乐趣,也祝各位同学和朋友数据处理顺利。&
转载本文请联系原作者获取授权,同时请注明本文来自胡行伟科学网博客。链接地址:
当前推荐数:15
评论 ( 个评论)
扫一扫,分享此博文
作者的其他最新博文
热门博文导读
Powered by
Copyright &}

我要回帖

更多关于 高通量测序公司 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信