顺利通过投sci论文流程投稿s ci需要做哪些准备工作?

推荐一个极具性价比的发文方向——生信。只有发过生信的人才知道生信有多香,有多快乐!毕业、求职、申请国自然哪个地方不能拿出来用一用?!话不多说,直接上干货,照着学就对了!至于外面的指导有没有用还要看你个人如何利用~这篇超全攻略分为三大部分:第一部分:我先来说说生信学习的重要性第二部分:现在有什么不做实验就能发SCI的方向?第三部分:确定方向后,怎么利用生信分析的套路【3-6个月】发一篇生信SCI呢?如果没时间看完下面的攻略,建议码住这节直播课,效果更佳!一、为什么说生信是医生做科研的成败点?▌大家想一想,为什么生信研究近几年这么火?因为搞科研这个活儿,难度系数实在是太高了。如果选择做基础科研,你最起码需要有实验室的一间实验台,需要有科研经费采买各种试剂和瓶瓶罐罐,需要花时间养老鼠,养细胞,基因鉴定,细胞转染,跑 WB,PCR、流式等各种实验,还要自己解决报税、申请伦理、标本收集等各方面的问题。实验一做起来,时间和经费上都是个巨大的无底洞。毫不夸张的说,有的运气不好的小伙伴,光造动物模型这个事就干了两年多。没办法,模型不成功,后面表达和下游信号通路探索都进行不下去。但是基础科研也是后续申请省市级课题的基础,该做还得做,绕不过去,但是作为一穷二白冷启动期,确实只能远观不能亵渎。如果选择做临床科研,要么自己科室本身就有大量的患者随访数据,要么靠挖公共的临床数据库的资源。在早年间,Meta分析很火,很多医生都赶上了这波红利,汇总一些文章,从不同的角度出发,一年发十几二十篇文章的都大有人在。但是因为风头太盛,而且题目里必有“meta”的字眼, 后面meta分析不能作为很多高校的职称晋升和拿学位的标准了,Meta的热度就下来了。但是临床研究水平也是临床医生必不可少的技能点。有多少临床课题,有没有高水平的临床文章,也反映了临床医生的江湖地位。毕竟,如果有一篇改写指南的代表作,那在你的小圈子里肯定算得上是巨佬级别的人物了。▌为什么最近生信这么火呢?第一个原因,是时代的红利什么是红利呢?官方的说法是: 红利是对客观存在的市场规律,对洞察力的奖励。随着常规的测序成本下来,稍微有点经费就能做测序,发个2-3分的文章绰绰有余;另外,测序又不断有新的测序类型和产品不断涌现,而且高端玩家也能钛金新技术,做第一个用该技术在本领域内的文章,就可以发到高影响力的期刊上;如果没有科研经费,或者没有测序样本怎么办呢?公共数据库存储了越来越多的测序数据,或者很多高分测序文章都提供了测序样本的补充材料,可以免费供研究者挖掘;二次数据挖掘的数据库,以及市面上各种生信教程,降低了学习门槛。可以说,无论你是贫穷还是富有,无论你是小白还是大咖,生信可以高效的满足你科研连续文章产出的需求。第二个原因,是生信的百搭性和实用性在老板随手扔给你一个课题方向的时候,你想过如何拆解这个课题,变成一个具有可行性的执行方案吗?首先分子怎么来?是看文献一个个盲猜,还是通过自己动手用公共数据筛?接下来信号通路选哪条,表型应该靠哪个?如果看文献来猜的话,每一个筛选步骤下来,需要调研的文献都是指数级增加。而且你写在文章或者课题里,专家总有种你不靠谱的感觉,为什么选了这个不选哪个?在数字化和讲究定量的科研时代,没有点生信测序结果,都有点拿不出手。无论是基础文章中的分子、机制、表型的筛选,还是和临床研究结合,用高通量数据构建临床变量的预测模型,都是很好的给科研增加论证维度的升级利器。生信之于科研,就好像你出门后的高德导航。另外,更务实的一点,发生信文章是目前最具有性价比的选择,具有周期短、起效快的特点。目前生信文章在高校和医院都是被认可的,用来晋升职称和拿学位都是允许的。雪球当年有一篇基础实验一直在投,迟迟不中,后面紧急补了个生信文章,擦着边靠生信文章毕业。生信文章的题目还有一定的隐蔽性,有些生信文章起的题目和基础实验类似,在申请课题的时候,专家粗略一瞅,说不定也误认为是基础科研类的文章。未来生信在生信研究中的比重肯定会越来越高,也会有越来越的科研工作者掌握生信,生信会逐渐成为医生的刚需技能。与之相对应的,生信的发文章的门槛也会越来越高。如果你做的是纯生信研究,会有审稿人要求你补实验,补越来越多的的实验;如果你做的是纯基础或者临床类的研究,在投稿的时候,肯定也会有严谨的审稿人要求你做一组生信解释一下你的分子、机制、表型和临床变量怎么筛选的 。目前生信还在红利期的中后节,遇到红利最正确的应对姿势是: 发现红利,吃掉红利,构建能力趁着今年,还有一些期刊还收纯生信文章,有一些3-5分的期刊对生信的分析难度还没这么高。还在岸上徘徊的小伙伴要抓紧入坑了。通过红利期,积累几篇生信文章,当作科研生涯的打底;等生信红利期过去,把生信当作自己武器库中的一个常见兵器,有机融入到你在科研中的每个环节,让生信起到为你科研探索方向出现岔路口的投石问路的探路器。当你吃到了生信红利,就会迅速构建起属于你自己的增长飞轮。增长飞轮的理论,最早出自于亚马逊。贝索斯的商业哲学是通过更低的价格,更优的选择,更快的交付,推动其商业帝国的高速运转。对于我们科研工作者也是一样。当你在没有资源,没有经费的时候,通过生信红利,有了一些文章的积累之后,会有更多的课题,能有机会申请到名校名导的研究生,获得更好的科研资源和环境,从而进一步促进科研成果的产出,形成正向循环。在三年五年,甚至未来几十年的时间维度里,打造你自己的科研壁垒 ,起码做到在同行业内中上的水平。当你回过来看的时候,你在职业生涯里转变的那一点,就有可能是当初抓住了生信的红利,发的那几篇文章开始。不能说绝对,但是雪球相信,对很大一部分医生来说,生信能力的高低很大程度上是决定了你做科研的成败点。如果这么性价比高的SCI科研方案都搞不定,其他费时费钱费力的基础科研,也很难做的很好。学习能力的差距:生信高手有哪些学习习惯?接下来,我们聊一个最基础的话题,生信高手是怎么炼成的?换句话说,生信核心能力成长的底层逻辑是什么?很多人可能觉得自己在生信这件事上投入的时间和精力够多了,就是因为“笨“或者没有这块学习代码的天赋。可事实真的是这样吗?一提到生信学习,大家总是习惯性的想到这些事情:多看文献,多看代码,多看教程,多听多看多问多做只要多听,多看,多问,多做,就能迅速上手生信了吗?那到底生信学习的捷径在哪里呢?【划重点 】直接说答案,生信高手的底层逻辑在于:刻意练习。什么是刻意练习呢?著名的心理学家埃里克森在”专业特长科学“潜心几十年,研究了一系列行业或领域中的专家任务:国际象棋大师、顶尖小提琴家、运动明星、记忆高手、拼字冠军、杰出医生等。他发现,不论在什么行业或领域,提高技能与能力的最有效方法全都遵循一系列普遍原则,他将这周通用方法命名为”刻意练习“。为此著作了这本书《刻意练习》。这本书的核心观念就总结了一句话:高手,都是练出来的。刻意练习,是专门为了”提升能力“而设计出来的练习方法。刻意练习,有四个必须要素:套路,非舒适区、重复、反馈。首先来说套路练习套路就是门路,门在哪,路在哪,别人都摸索明白了,而你不知道,别人告诉你一套门路,你去学习了就能按图索骥,不进错门不走弯路,快速到达目的地。专业人士在基础训练的时候,学的都是套路,比如围棋的定式,编程的算法,数学的公式,物理的定理,都是套路。对于生信而言,套路主要讲课题设计。生信的研究套路就是把生信类的文章大量拆解,拆解成各种模块化的要素,有哪些恒量有哪些变量,有哪些加加减减的排列组合,有哪些逻辑链接,掌握了这些,基本上可以完成一个生信课题的设计。第二个关键要素:非舒适区如果你想成长,在生信领域有所精进,需要跳出舒服的,自动做事的范畴,对标高手,不断挑战难题,才有机会成长。在生信研究方面,比如同一类文章套路,你用零代码的方式发表过几篇文章,下一步就需要考虑研究复杂度的升级,不要老是沉迷于老套路,去追一些高分生信文章的课题设计方式和分析方法,争取发表影响因子更高的SCI文章,申请更高规格的课题。沉溺于过去的成功经验,并不能代表未来你能始终追赶上生信研究套路的新趋势。第三个关键要素:大量重复重复是无聊又是必须的,大量重复有利于你形成肌肉记忆的条件反射,以及对套路内核更深刻的理解。在解螺旋生信部面试的时候,我们的技术主管总喜欢问面试者一句话,你一共写过多少行代码。这个问题的本质其实就是问代码的功底的最粗略的评估。早年间,雪球在网上学生信的时候,也认识了几个生信大神。他们的生信入门之路都如出一辙,都是比着几本R语言书《R数据科学》《R语言实战》整本书的敲代码敲了几遍。如果想写好R语言代码,离不开对常见统计学分析、可视化图表的常见代码的反复练习。多敲R语言代码,练手感的重要性,就好像你在学习武功的时候,练习蹲马步一个道理。第四个关键要素:反馈你在做的过程,需要拿到反馈,告诉你下一步怎么调整。反馈就是起到教练的意义,能以旁观者的角度提供及时反馈。不管在练习任何技能或提高能力,大部分人很容易陷入自我而不察觉。相对于球类运动、围棋,科研比较特殊,很难有专门这样的【高水平的教练】。解螺旋正是通过大量的课程、生信讲席营,各种主题的训练营,都配有助教老师,就是为了帮助大家及时反馈。我们希望大家用科学的方法去做科研,用更高投入产出比的正确姿势更快学好生信。总结一下,生信高手都有个刻意练习的过程:套路、非舒适区、重复、反馈,缺一不可。下面我就给大家介绍3个2023年不做实验发SCI的蓝海领域。二、这三个方向,让不做实验发高分成为可能1 机器学习仅仅去年一年,生信+机器学习的套路已经在10+SCI上发了近60篇文章!所谓机器学习,是指利用算法来检测数据中的模式,而不需要明确的指示。一个学习系统可以利用训练数据集,学会找出输入信息(例如图片)的特征与输出信息(如标签)之间的关联。机器学习在生信分析中的运用越来越常见,越来越重要。比如在基因组数据方面,用深度学习检测突变逐渐成为主流方法。比如群体基因组学领域的PRS,用于基于基因组数据预测生物性状,这就是个典型的机器学习预测问题。比如非肿瘤研究中,可以用机器学习来评估我们诊断标志物的诊断效力。临床预测模型、筛基因、二代测序、代谢通路、非编码RNA分析、蛋白质结构功能预测、疾病亚型分型、术后预测……机器学习在这些方面的运用已经越来越多见了。想做单细胞测序,就不要放过空间转录组。简单来讲,空间转录组是既能够保留组织空间位置信息又能够获得不同组织空间位点转录信息的一种技术,以10x Genomics Visium技术为例,它融合了组织病理学、基因芯片、高通量测序、生物成像技术。空间转录组测序技术目前蓬勃发展,在现有的高通量检测技术领域,它已为科学研究的发展提供了前所未有的技术支撑。那么,为什么要把空间转录组和单细胞结合?我们都知道单细胞测序是大腿。但是它其缺憾,那就是无法检测到空间信息,因为单细胞测序技术在将实体组织解离成单个细胞的过程中,不可避免地丢失了空间信息。空间转录组则可以提供空间位置信息,完美补偿这一点。但是目前来看,空间转录组并没有做到完全的单细胞,其每一个spot大概会有1-10个细胞左右,所以并不是完全的“单细胞”。因此,当我们通过算法把单细胞的精度和空间转录组联合运用起来时,我们就拥有了一个双剑合璧的完美上分利器!这俩加起来有多牛呢?可以说,空间转录组绝对属于新的测序技术的新宠,2021年有160篇文章发表!其中,Cell、Nature、Science也不乏空间转录组+单细胞的身影,54+Nature子刊,40+Cell,13+可复制生信高分模板……如果说单细胞的福利是在前两年,那么当下的福利就理所应到的在空间转录组身上。buff叠起来,文章发起来!你要是能染几张片子简单验证一下,那大杂志就更是认可有加了!如果只能三选一,那么影像组学绝对是今年必须抢占的发文先机。影像组学的概念自诞生以来就在不断完善,一个比较成熟的定义是,影像组学指从CT、PET或MRI等医学影像图像中高通量地提取并分析大量高级且定量的影像学特征。通俗地来讲,我们可以把它拆成“影像”和"组学”两个部分进行理解。所谓“影像”,通常指放射影像,主要包括了CT、MR影像等;所谓“组学”(Omics),其实就是把与研究目标相关的所有因素综合在一起作为一个“系统”来研究。影像组学本质上来说其实是一种分析思路方法,从临床问题出发,最后回到解决的临床问题。也正因此,在发文的时候,影像组学对实验并没有硬性要求。所以,你会看到——虽然不做实验,但是入门级别的影像组学都能发6分;虽然不做实验,但是影像组学+单细胞多组学能轻松上10分;虽然不做实验,但是生信分析加点影像组学就能发到17+……影像组学自2016年以来一直是热点,因此发文量飙升,但规范的影像组学论文依然能发到非常好的杂志,这是因为影像组学的价值越来越被临床认可。随着数据越来越标准,研究越来越规范,影像组学,或者影像组+人工智能在肿瘤学等领域会愈发大放异彩。如果你恰好还会一点机器学习,那在发SCI的路上可以说是神挡杀神,佛挡杀佛了。三、如何利用生信分析的套路高效发SCI生信数据库和分析方法并非无穷无尽,其实做基础科研,总归都逃不过这些套路框架和生信“挑圈联靠”的四字口诀。入门阶段:单变量论证给同学们讲课的时候,我经常强调:分子与表型之间存在因果关系,单变量论证其实就是一个【造因得果】的过程。要论证因果,必须操作因,观察果。所谓单变量研究,就是去操作代入到恒量体系里的变量(药物或者分子),去观察表型是否变化。这种套路初级阶段能胜任3分SCI左右的水平。*生信研究中的表型,本质上就是指特定基因的列表。表型类的生信研究套路,主要在转录组为主的测序类型为主。选自【8天领悟5分SCI】体系课第三讲 单变量研究“表达差异(分子),有效成分(分子)”变量分为分子,药物,通路。分子分为DNA、 RNA 和蛋白;药物分为中药(复方,药团,药对,单药,活性成分)与西药(药物,有效成分);通路包括9大信号通路。其中可以做主变量的为分子和药物。选自【8天领悟5分SCI】体系课第三讲 单变量研究2.3-5分SCI套路:二元变量论证仅仅做单变量研究的文章还是少数,更多的文章在做变量之间的组合。有了变量的组合也就有了分子机制,有了机制,就能胜任3-5分SCI的内容产出了。二元变量,即两个变量要素组合。二元变量的逻辑论证链一般分为以下几个步骤:主变量(A)调节表型,主变量(A)调节因变量(B),Rescue证明A调节表型依赖于B。生信数据库预测变量与变量之间关系的来源有三种:①基于已经发表的文献;②基于计算机算法对药物或者分子的结构进行预测;③基于实际体内体外实验的测量计算。选自【8天领悟5分SCI】体系课第四讲 二元变量组合常见四种二元变量组合:1)药物+通路:Kyoto Encyclopedia of Genes and Genomes数据库,简称KEGG数据库,网址http://www.genome.jp/kegg/pathway.html,提供了药物与通路之间相互作用的信息。在药物开发方面:包括抗感染药、抗肿瘤药、神经系统药物等相关通路;另外还包含靶向药物的相关通路。2) 药物+分子:STITCH数据库,网址http://stitch.embl.de,用于检索已知的以及被预测的化合物和蛋白质之间互作关系的平台,化合物与蛋白质之间的互作关系通过实验验证,数据库,以及文献中的研究被证实。3) 分子+通路:DAVID数据库,用于筛选出差异基因之后的功能和通路富集分析。Metascape数据库,网址http://metascape.org/gp/index.html ,能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。4)分子+分子:①STRING数据库,网址https://string-db.org/ , 适用于研究蛋白之间的相互作用网络。② starBase数据库,网址http://starbase.sysu.edu.cn/index.php ,适用于研究miRNA target,RNA-RNA相互作用,ceRNA调控网络,以及RNA和蛋白的结合信息。3.套路升级:二元变量+表型嵌套选自【8天领悟5分SCI】体系课第四讲 二元变量组合想让你的SCI更高级,更有逻辑层次感,可以用上表型嵌套。简单理解就是用一种表型作为解释另外一种表型发生的原因,论证手段为Rescue策略。目前生信分析已发表的文章中,应用两种表型嵌套的文章还比较少见,但也不是不可行。可以通过数据库或者已经发表的高分文章或者特定的R包获得表型相关基因的list,就得到了这个表型相关的基因集合。如果涉及到表型嵌套的话,那么这两个嵌套的表型的基因list取交集,不就得到了与这两个表型相关的交集基因集合,大概率这些分子会与表型嵌套有关。4.3-5分SCI套路:三元变量论证选自【8天领悟5分SCI】体系课第五讲 三元变量组合其实学会了二元组合,把两个二元组合组装一下不就是三元变量组合了吗?道理就是这么简单。药物、分子、通路这三元变量进行组合,有意义的组合只有七种。药物/分子+分子/通路+通路/分子排列组合的原则是药物不做次,通路不做主,分子主次皆可。通过将以上二元变量相关的数据库,两两组合,同样可以解决三元论证的问题。包括目标分子的来源问题是通过数据库或者生信分析筛出来的,药物的有效成分是通过数据库检索出来的。与其他分子的相互作用,与哪些生物学功能、通路机制相关也是通过分析预测缩小了研究范围。5.套路升级:三元变量+表型嵌套模块堆叠,排列组合。对复杂的因素进行拆解,是解决问题、减少焦虑的有效手段。从最简单的二元变量入手,再组合成三元变量,最后与多个表型变量相关基因list取交集基因相联系,即可完成本条逻辑线。关于表型嵌套的部分,仍然建议大家直接学习课程,三言两语只能让你了解概念,并不能使技能为你使用。6.5+文章必备:二元分子交互论证选自【8天领悟5分SCI】体系课第六讲 二元分子交互RNA可以与DNA, RNA, 蛋白结合。蛋白可以与DNA, RNA, 蛋白结合。同时化合物也可以与分子相结合。1)蛋白-DNA(即转录因子模式)转录因子含有 DNA 结合的结构域,能识别 启动子 DNA 序列的 motif,调控基因的转录,包括对编码基因mRNA 、非编码RNA(miRNA , lncRNA , circRNA)等的转录调节。2)蛋白-蛋白蛋白与蛋白通过形成复合物(complex)来发挥作用;或者蛋白通过直接结合效应蛋白,影响效应蛋白的功能。3)RNA-RNA/DNARNA与RNA或者DNA间能够碱基互补配对来发挥作用。RNA既可以结合到DNA上,影响基因转录等功能,也可以结合到RNA上,在转录后水平影响RNA,比如miRNA对mRNA的调控等。4)RNA-蛋白RNA能够结合到蛋白上,影响蛋白的功能或者定位。同样,蛋白亦可以发作用于RNA,影响RNA的功能。5)化合物-分子化合物可以通过直接作用或者间接影响到细胞内靶分子的表达量以及功能活性。7.分子修饰纵横嵌套在生信中常见的分子修饰套路研究比较多的包括甲基化,拷贝数变异,可变剪切。基于这些分子修饰变化,也延伸出了不同的生信分析套路,以及配套的数据库和基于代码的分析方法。8.三元变量一组交互三元变量和二元交互两个模块,均可通过生信数据库/R代码分析找到合适的对应预测手段。基于药物有效成分预测靶分子,再加上靶分子预测其互作分子;基于二元交互的模块,也可以通过分子来预测富集的通路。熟稔生信套路之后,你将会发现处处皆可生信,哪哪都能预测。9.三元变量两组交互构建ceRNA网络,是生信研究多分子类型的分析中的必备保留项目。比较常见的分析方式是以miRNA为轴心,用多个数据库预测与之相互作用的mRNA或者lncRNA,又分别对其得到的mRNA或者lncRNA取交集,再导入Cytoscape中构建互作网络。另一种常见的生信数据库预测转录因子蛋白与DNA的交互,这一步可以与miRNA上游无缝衔接。10.三元交互三元变量两两相互作用,在生信数据库中可以对每个变量进行靶基因预测,两两取交集靶基因,缩小去搜寻三三变量两两成团的筛选范围。11.可冲一区:细胞交互嵌套单细胞一直是生信分析中的高分选手。生信中的单细胞测序技术,一次可对最高30万个单细胞进行测序,得到其中每一个细胞的各基因的表达谱信息,通过筛选质控、数据标准化分析、特征提取,降维分析、距离计算、非监督聚类、聚类展示等环节,最终可以得到不同的细胞亚群。一般认为一个群代表一种细胞类型,而好几个小群构成一个大的细胞类型,而每一个小群代表该细胞类型的亚型。每个亚群的差异基因具有特异性,这种特异性的基因在理论上可以作为该细胞类型的marker基因,反过来,marker基因也可以作为鉴定和推断细胞类型的手段。12.可冲一区:主变量分裂与嵌套成环主变量分裂与嵌套成环在生信分析中,主变量可以分裂也可以聚合。主变量可以分裂成一个基因家族的不同分子,几个共表达或者功能相似的分子,或者不同可变剪切下的多个剪接体等。得到的这些分子在可以通过“圈”进行合并的生物学功能和通路分析,免疫浸润分析;可以通过“联”构建互作网络,临床相关性、预后分析等分析流程,比单个基因分析多了数倍工作量。主变量聚合是通过临床预测模型分析,构建筛选出单个分子类型或者多个分子类型的gene signature,再走圈联靠的一系列分析流程。嵌套成环,依旧是通过多元变量两两生信分析预测,最后首尾取交集的模式。写在最后:看完2023年还能发的生信方向,确定方向后,我又教了大家利用生信分析的套路高效发SCI,你学废了吗?靠自己到底如何3-6个月发一篇生信SCI发SCI呢?3-6个月发一篇生信SCI这是我一个小白能做到的吗?!当然能!如果你想发论文,但时间有限、实验条件不足;又或者工作繁忙精力不足,论文面临难产……那赶紧来看看这节解螺旋直播课!【3-6月投出1篇生信SCI-直播课】有限时福利,针对性强、小白友好!这节直播课,将详细为你介绍“生信研究”可发表方向、“干湿结合”详解、CERNA生信研究、特定表型研究、临床预测模型,从课题设计到写作套路,帮你打造生信学习的超强认知,快速发表高分SCI~相信自己,3-6个月你也可以的!点击下方链接即刻开启生信发文路!}

我要回帖

更多关于 投sci论文流程 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信