如何增强citespace数据格式处理数据的多少和快慢

点击联系发帖人 时间：2017-03-28 08:56

citespace找不到数据

君，已阅读到文档的结尾了呢~~
... 尤其是以美国和前苏联为首的东西两大军事集团对峙局面的消失，宣告冷战时代的结束，和平与发展已成为世界各国面临的两大主题，国际情报领域转向了激烈的商业情报战。全球商战的加速促使竞争情报的产生。信息和情报被各国政府和工商业看作是增强全球经济 ...
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
基于CITESPACE 的竞争情报研究的可视化分析
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口[转载]CiteSpace重要问题整理（转载沈奎林博士空间整理材料）
已有 3180 次阅读
|个人分类:|系统分类:|关键词:citespace，交流，学习|文章来源:转载
转载沈奎林博士与超美教授的博客留言交流内容：内容出自其博客空间 & & & & & & & & &
&（感谢陈老师认真耐心的无私奉献，也对沈奎林博士学习精神表示敬意！）陈老师，您好，我在用citespace 3.0.R2的Run Batch Mode一气呵成的时候，生成的narrative summary中第一个图表中，TFIDF、LLR MI，分别表示什么意思，我查了好久没有查出来，您能告诉我一下吗？博主回复( 11:57)：tfidf = tf x idf = term frequency by inverted document frequencyLLR = log-likelihood ratioMI = mutual information详见：Chen, C., Ibekwe-SanJuan, F., & Hou, J. (2010) The structure and dynamics of co-citation clusters: A multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, 61(7), . 10.1002/asi.21309陈老师，我想请问下“The most active citer to the cluster is 0.45 ISI:018 Mines, M (2000) ocular injuries sustained by survivors of the oklahoma city bombing.”里面的0.45指的是什么指标呀？看了一些资料没找到答案，谢谢老师啦~~博主回复( 23:13)：0.45=45%. Mines, M. 引用了该类中45%的文献。陈老师好，步骤3中所提到的前沿的“脚印”，是不是就是说它们在当时的那个时间里是研究前沿，即曾经是研究前沿？非常谢谢老师详细的解答！博主回复( 01:06)：严谨地说，‘脚印’只是前沿所留下的线索，蛛丝马迹，并非其真面目。熊猫的脚印不等于熊猫。第5步才涉及到脚印到底是那个熊猫的。陈老师好，我想请问下，一个图谱的研究前沿是怎么确定啊？我看的文章有的是直接把关键节点（有紫色外圈的）看做研究前沿，这样对吗？分析研究前沿时term type选择noun phrases还是burst terms？Node Type选择Cited reference，这样对吗？谢谢老师啦！博主回复( 22:38)：对错往往是相对的，主要取决于你要发现什麽问题。下面是一种方法：1. Cited References2.生成网络3. Citation Burst (需按2次）红色为被引burst, 是前沿的‘脚印’。Sigma最高的节点为重要地区留下的脚印。4.生成聚类。在Cluster Explorer里，选则右侧列表中脚印所在的聚类（参考#3）。这时中间列表所显视的论文可视为一组前沿文献。5. Synthesize&Generate a Narrative中包括一写#4中提到的文献。陈老师您好，我在运行citespace处理数据时有几点不明白：1.在运行citespace时，选择Pruning里的&pathfinder&与&minimum spanning tree&有什么不同？在什么情况下该选择哪个呢？2.silhouette值代表什么呢？值为多大合适？看见您的截图上这个值都比较大，我的也就才0.7476，对图的效果有影响吗？3.在进行聚类分析的时候，分别选择&T&和&k&进行聚类，然后选择clustering-&summarization of cluster显示聚类明细，发现有的聚类在T结果中比较好，有的结果在k结果中比较好，而且有的聚类silhouette值很小甚至为负数，不太明白是什么意思，请问对哪个进行聚类分析比较好呢？期待老师的解答，谢谢。博主回复( 05:54)：有些问题一两句话说不完全，下面列出的论文中有具体的答案，请参考：1。参见：Chen, C. and Morris, S. (2003) Visualizing evolving networks: Minimum spanning trees versus Pathfinder networks. Proceedings of IEEE Symposium on Information Visualization, (Seattle, Washington, 2003), IEEE Computer Society Press, 67-74.2 和 3。参见：Chen, C., Ibekwe-SanJuan, F., & Hou, J. (2010) The structure and dynamics of co-citation clusters: A multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, 61(7), . 10.1002/asi.21309陈老师，您好，我刚刚使用您的citespace，还是个新手，我有问题向您请教，例如，使用keyword，c，cc，ccv为3.3.15；3.3.20；3.3.20。space 右边的数字317，主要是指关键词频次出现三次以上的数量（同一个关键词出现多次算作一次），不知道这样理解对不对，另外的左下角的Records in the dataset: 2918，Records within the chosen range: 2569，是指数据库中关键词的数量吗，还是其他？希望陈老师百忙之中解答。谢谢。博主回复( 02:51)：317是在其中一年中的keyword的个数。2918是总数，2569是在From-To年份之间的总数。陈老师您好，请问article labeling 和term labeling 分别是指什么类别？在网上查不到精确的解释，不知道哪一个是正确的。谢谢您！博主回复( 20:37)：Node Type:Term: TermsArticle: Authors, Cited References, Institutions, Countries, Keywords, etc.陈老师您好！非常抱歉又麻烦您。但我在分析WOS数据时，遇到一些问题，还望老师能在百忙之中指点一二。1.在关键词可视化视图生成过程中，左边会出现相应的按词频排列的关键词排序，一些关键词会出现两次，这该怎么解释呐？而有些关键词只是单复数的区别，如library和libraries。在分析时应该将两者的频次相加，还是只取其中一个的数据呢？2.您的一篇博文中说“modularity大约在0.4~0.8时的图谱通常为符合要求的图谱”。但是modularity在哪里显示呢？我没找到。3.在生成有关reference的图谱后，点击DOI或google scholar，所得到文献总觉得与主题不相关呢？谢谢陈老师。博主回复( 10:21)：1. 在图中右键将要保留的词选为Alias Primary，再将另一词选为Alias secondary. 重新GO!一下, 会将二者合并。2。在图的左上角有几行字，倒数第2行。3。有具体例子吗？陈老师您好！感谢你的CiteSpace，太牛了。用了很久了，但最近处理的数据集比较大，有些问题向您请教。你在“如何增强CiteSpace处理数据的多少和快慢 ”一文中提到了数据集过大的处理办法，但我下载了还是会出现JVM不能创建不能运行的问题（could not create the Java Virtual Machine）啊，在我机器上修改为1500M以下有时候能够运行，有时候也不行。我在一个内存为8G的机器上试过，也是这样的情况，请问是什么原因呢？该如何解决？还有其它几个问题向您请教：1您的新版本是不是去掉了按住Alt键拖动鼠标多选的功能啊？我用的这个功能好像只有2.8版本有。2关于可视化的聚类图每一年的颜色可以设置吗？我的数据较多，总是看不清楚。3可以根据节点的属性而不是勾选左侧的选定节点来决定是否显示该节点吗？如蒙回复，不胜感激！谢谢！博主回复( 20:58)：JVM如果内存已被其他应用程序占用，就会有这种情况。抢先打开CiteSpace是一种办法。1。好像是。近似的选法可用右键选择列出同一类里的成员。2。暂且没有这种界面。可试试增加每个时间区的长度，slice length=3, 5，10，等。3。没有。可在表中按列排序，然后逐个剔除。以后可以考虑加上类似功能。陈老师，谢谢您的回复。还有两个问题：第一，在节点个数问题上，一般通过设置，最后多少节点是理想的？（我目前运行时得到节点关键词308个，连线2057条）；第二，在进行时间线视图时（timeline），每一个聚类后面的名称是依据什么来标注的？（通过运行，发现有的聚类名称和研究领域联系不大）博主回复( 23:00)：1. 这个问题可参考我以前的博客。主要考虑是网络结构是否能回答在比节点本身更高抽象层次上的一些问题。2。是由引用各聚类的论文决定的，具体词组可选自论文的标题，摘要，和索引词，再由3种办法之一度量。如“联系不大”，可解释为施引/被引之间的“距离”较大，参照silhouette值。详件：Chen, C., Ibekwe-SanJuan, F., & Hou, J. (2010) The structure and dynamics of co-citation clusters: A multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, 61(7), . 10.1002/asi.21309陈老师，您好。我想请问下关于CITESPACE怎么保存图谱，我是做教育经济的，图点很散，怎么样吧图点聚集起来输出，看起来一目了然博主回复( 04:59)：可以存成.viz格式，以后可以直接用CiteSpace打开使用：File&Save Visualization也可以:File&Save PNG如能增加更多联接，也许能把整体集中一些: 增加time slice的长度，增加topN, topN%等。陈老师，您好，我想请教您一个问题，我下载CNKI或者万方的数据格式，应该如何进行转换，谢谢。博主回复( 21:50)：试试CiteSpace&Data&Import/Export&CNKI陈老师，再次请教你一个问题，这个问题一直迷惑着我，我在您的有关文献里看到citespace的操作步骤1、2、3（extract noun phrase term from title,abstract,descriptors,identifiers of citing articles in the dataset）4----，关于步骤3我在实际操作的过程中并没有执行，而是直接分析共被引等内容，这样的话结果会有影响吗？如果我在分析了共被引等后，然后想作前沿词的探测的话会对结果有影响吗？另外关于提取名词的操作步骤是这样的对面，选择了time scling ,term source,然后在term type里选择noun phrase，然后点go对吗？如果我想探测突现词，必须先进行名词短语的提取然后选择burst term--detect bursts吗？可是这样只能在窗口里显示了几个探测词，我往往再选择go，才能出现相应谱图？博主回复( 09:04)：CiteSpace中的burst detection 有两种用法：1。名词短语和 2。单词。1需要事先提取。2则不用。如果后面的分析不涉及名词短语，结果不会受影响。最后几个问题：对；是；应该如此。陈老师，您好！我想问下老师：如何用基于CSSCI的数据绘制“研究前沿突变术语”的图谱？（burst来源为名词短语）博主回复( 00:13)：1. 抽取名词短语选需要的年份选Noun Phrases等左边窗口出现回应后，GO. 等到提示visualize, save, cancel，选cancel.以上这步只需做一次2。选burst, 用名词短语3. Node Type选Cited References 和 Terms.4。 GO.陈老师您好，我的疑问与33楼得clover6相同。在阀值的选择上，如果阀值设的太低的话，会有太多的节点，分析起来可能太复杂，但是设的太高的话，又怕没有可信度。在阀值的设置上，怎么样才能更为科学呢？博主回复( 02:49)：建议你先读一下这两篇：如何选取CiteSpace中的各项参数如何在CiteSpace中控制节点的取舍陈老师，您好！关于citespace我有几个问题想请教：1、在聚类簇图形中右键选择list citing papers to the cluster，结果页面中1）Citing Titles显示的是什么内容？那个圆括号中的数字代表什么含义？2）bibliographic details显示的又是什么内容呢？那个方括号中的数字代表什么含义？2、在citespace中如何查看某个聚类簇的主要施引文献及其施引频次呢？谢谢！祝工作愉快！博主回复( 19:51)：下个版本中会包括一个Cluster Explorer的介面，可以用于交互式分析。目前版本中，在project目录下有一个叫clusters的子目录，文件以相应聚类号命名。文件内包括施引文献。陈老师，你好，在选择“节点类型”的问题上有一点不明白。我想做共词分析的图谱，选择keyword那一项就可以了吗，感觉这样画出的图谱好像没有体现出共词的关系呐。学生要做共词分析的图谱，还需要如何设置呢？博主回复( 02:45)：Term和Keyword都可生成co-word网络。Keyword是Web of Science记录中KeywordPlus字段里的词。陈老师，您好！非常感谢您能回答我的问题。在做作者或机构或国家合作网络知识图谱时，Freq 指的是被引频次呢，还是发文数量？博主回复( 23:29)：这时Freq为发文数量。陈老师您好！在操作过程中经常会遇到有的文献被引频次很高，但是中心度却很低，而有的文献被引频次很低，中心度却很高，对于这样的现象我该怎样去理解？这两类文献中那一种才是关键文献或重要文献？为什么会出现这样的情况。另外，阈值设定中：top N per slice或者Threshold（c，cc，ccv）数值大小，选用Pathfinder或者Minimum Spanning Tree，即使小小的变化，软件选择出的被引文献或者关键词其中心度变化很大。如果选择了其中的一组数据进行分析，自己都无法解释选择为什么要选择这组数据？我应该依据什么去选择分析？因为自己正在学习过程中，希望得到陈老师的帮助。博主回复( 00:41)：被引频次和中心度是两种不同的度量。中心度是定义在网络结构上的。至于什么是关键文献或重要文献，取决于你要研究什么问题。如果波动很大说明你选的top N还不够大。陈老师请教一个问题，同样的阈值设定，用Pathfinder或者Minimum Spanning Tree，软件选择出的文献其中心度是不同的，如果中心度高的节点可以将其看成是关键节点，我现在无从下手了，不知道该选择那些文献来进行分析？以Pathfinder为准。见 Chen, C. and Morris, S. (2003) Visualizing evolving networks: Minimum spanning trees versus Pathfinder networks. Proceedings of IEEE Symposium on Information Visualization, (Seattle, Washington, 2003), IEEE Computer Society Press, 67-74. 陈老师您好！我想请教您一个问题。在citespace里进行被引文献或被引作者分析时，聚类的依据是什么？根据什么标记聚类的？在被引作者分析过程中，是将每个作者被引的所有文章进行统计然后得出Freq吗？还是只分析作者的其中一篇文章？在被引作者分析中，Freq最高的作者对应这某一个年份和期刊，是否表示该分析过程只研究该作者的某一篇文章？但是在被引文献分析中，该作者的文章Freq不是第一，而且该作者对应的文章显示的年份也不同，为什么？真心希望得到老师的解答，谢谢您！博主回复( 10:49)：聚类相关的技术细节读一下这篇论文：Chen, C., Ibekwe-SanJuan, F., & Hou, J. (2010) The structure and dynamics of co-citation clusters: A multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, 61(7), .被引作者分析：Freq是按每个作者的所有文章的被引情况计算的。这时只有作者字段有意义，其他字段如期刊名称等没有意义。陈老师，再次打扰您了。我最近在谢我的博士论文，现在正整理文献，突然有个想法，就是可不可以把文献综述写成知识图谱呢？博主回复( 21:45)：对了解学科发展历史和现状来说，知识图谱和文献综述异曲同工。这确实是CiteSpace所针对的几个核心问题之一. 还有就是，C、CC和CCV阈值的选择有没有什么标准呢？问题较多，因为最近遇到了这些实际问题，麻烦陈老师了！博主回复( 11:03)：TopN 和TopN% 更直接，建议你用这两项。c，cc，ccv的选择灵活但较为复杂，参考2004年我的PNAS文章。从前，c有选5次以上的，ccv有选25%以上等等在文献中都可见到。阈值低的覆盖面会稍微广一些。考虑到文献数据本身的误差，以及大部分人的注意力往往集中在最有代表性的工作，所以阈值的选择总是相对的。WOS并不包括所有的文献。另外，信息和噪音比也是一个考虑因素。有个新的问题问您，我用知识图谱写了一篇文章，现在导师提出一点疑问，我也有些疑惑，特向您请教。就是利用中心度分析某些关键词的时候，选取的阈值，如C、CC和CCV，会不是对中心度的值有影响呢？选取不同阈值会得到的不同膨胀词，那么我如何说明哪组阈值选择的更加合理呢？我导师问我为什么那么选择阈值，我该怎么回答呢？学生孤陋寡闻，希望得到陈老师的指教！博主回复( 11:21)：会有影响。实际上，绝大多数的网络模型都会受到这类参数的影响，只是大部分条件下用户没有给与选择的机会而已。我在我的数篇文章中反复强调这是个探索性的分析过程，不要望“图”生意，想当然，而是要以图为线索找到确凿证据。
转载本文请联系原作者获取授权，同时请注明本文来自胡小洋科学网博客。链接地址：
上一篇：下一篇：
当前推荐数：1
评论 ( 个评论)
扫一扫，分享此博文
作者的其他最新博文
热门博文导读
Powered by
Copyright &君，已阅读到文档的结尾了呢~~
citespace应用
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
Citespace信息可视化软件应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口论文发表、论文指导
周一至周五
9：00&22：00
基于CiteSpace的竞争情报研究的可视化分析
2011年第10期目录
&&&&&&本期共收录文章10篇
　　[摘要]以信息计量学的相关理论与方法为指导，借助可视化分析工具CiteSpace，以各种类型文献作为知识载体，以Web of Science数据库收录的竞争情报领域的载文信息为主要数据来源，对10余年来国内外竞争情报研究领域的规律和发展状况等进行可视化分析，为增强对竞争情报研究领域的认识提供有价值的参考。中国论文网 /2/view-539725.htm　　[关键字] 竞争情报可视化分析知识图谱 CiteSpace 　　　　1 引言　　　　第二次世界大战以后，全球经济一体化和第三世界发展中国家经济迅速崛起，尤其是以美国和前苏联为首的东西两大军事集团对峙局面的消失，宣告冷战时代的结束，和平与发展已成为世界各国面临的两大主题，国际情报领域转向了激烈的商业情报战。全球商战的加速促使竞争情报的产生。信息和情报被各国政府和工商业看作是增强全球经济、科技竞争力战略资源的重要组成部分，因而开展竞争情报研究，提高国家、集团和企业的竞争实力也就成为世界各国情报界的重要战略选择[1]。　　竞争情报的发展迄今虽不足30年，但其影响已经遍及世界各地，应被视为经济学、管理学与情报学领域的重大发展，是人类在社会信息化基础上向情报智能化发展的重要标志，将对全球的经济发展与社会进步产生重要的影响。近年来信息技术的迅速发展，尤其是国际信息互联网络的出现和广泛应用，加快了信息的传递速度和企业的兼并与合作，市场竞争日趋激烈，客观上对情报研究分析快速反应能力提出更高的要求，同时国际信息互联网络的建设和应用又为灵活调用国际间的各种信息资源，建立竞争情报分析研究系统创造了良好的技术基础条件[2]。　　竞争情报领域有哪些研究热点？有哪些具备影响力的高产作者？未来的发展趋势如何？这些都是值得探讨的问题。2004年，美国德雷克塞大学信息技术学院陈超美教授基于引文分析理论并应用Java语言开发了CiteSpace信息可视化软件，成为近几年来在全美信息分析中最具特色和影响力的可视化信息软件[3]。利用CiteSpace，基于Web of Science对某学科领域进行可视化分析是近几年研究的热点，如对“高等教育研究”、“地震预报预测研究”、“科技政策研究”、“能源技术研究”、“国内外机器人研究”、“国外人力资源管理研究”、“文献计量学”、“图书馆学”、“基因操作技术研究”等领域的可视化分析，取得了极具价值的成果。但目前仍没有对“竞争情报”领域的可视化分析研究，因此本文拟通过CiteSpace这一可视化工具加深对竞争情报领域的认识与研究，希望可以对竞争情报的未来发展有一定的借鉴意义。　　　　2 数据来源与研究方法　　　　2.1 数据来源　　本文所使用的数据来源于美国科学情报研究所ISI出版的Web of Science数据库（SCI-expanded, SSCI,A&HCI,CPCI-S,CPCI-SSH）中的文献。该数据库收录了9 000多种高影响力的学术期刊，是目前国际上唯一的且最具学术权威性的引文信息源，这就为我们下载数据、转换格式和进行数据分析带来了极大的便利。数据的检索策略是“TS（主题）= Competitive Intelligence AND 入库时间=所有年份 AND 文献类型=所有类型”，检索结果为586条文献记录，数据下载日期为日。　　2.2 研究方法　　本文使用陈超美博士开发的信息可视化软件CiteSpace，该软件是一种可视化的共引网络分析软件，提供一种寻径网络图谱。通过合理设置引用(citation, C)、共被引(co―citation, CC)及共被引系数(co-citation coefficient, CCV)的阈值，可绘制出较直观的、容易理解的知识图谱。本文采用定量分析与定性分析相结合的方法来进行研究。通过使用网络版CiteSpace知识图谱分析软件，并对引用、共被引及共被引系数3个参数进行适当调整，对586条文献记录进行了关键词共现分析（KCA）、文献共被引分析(DCA)及作者共被引分析(ACA)等。对关键词共现进行图谱分析，可以找到某一学科或研究领域的研究热点，并且有可能发现研究热点的转移趋势；对文献共被引进行图谱分析，可以寻找学科或研究领域演化的关键经典文献及演化动力；对共被引作者图谱进行分析，可以发现该学科或研究领域的重要核心人物及相互之间的学术亲缘关系[4]。通过分析地区及机构分布，可以发现该学科的重要核心地区和机构。此外，CiteSpace还具有关键词聚类和膨胀词探测功能，可确定某研究领域的热点和发展趋势。　　1965年,美国文献计量学家普赖斯(Price D)注意到一个非常有趣的现象,即在科学引文网络中,频繁被引用的文章多是新近发表的文章。他提出了“研究前沿”的概念并以此来描述学科研究领域的过渡本质。1994年皮尔逊(Persson O)对研究前沿和知识基础作了界定：“从文献计量学来看,引文形成了研究前沿,被引文献组成了知识基础”。知识基础由共引聚类来表示,通过逐渐降低共引的阈值,他提出了所谓的知识基础的逐级扩大(step wise enlargement)概念,即随着共引阈值的降低,共引聚类中的文章越来越多,从而知识基础也逐渐增大,并发现知识基础在相当长的一段时间内保持稳定[5]。　　确定研究领域演进的关键点是进行计量分析的关键环节。假设Ψα和Ψβ 分别是t时刻和t+Δt时刻产生于Ωα=Φ(Ψα)和Ωβ=Φ(Ψβ)知识基础上的，以文章α和文章β为标识的主要研究前沿,形成分别以文章α和文章β为中心的两个共被引文献聚类。连接这两个聚类路径上的文章[p(i)]描绘了从Ψα向Ψβ转变的特征,我们将这样的[p(i)]称作关键节点。CiteSpace可探测出这些关键节点,并在视图中用颜色加深加粗的外圈加以突出显示 [6]。　　在开始利用CiteSpace进行数据处理之前,要将需要处理的文献数据放在同一个文件夹内。每个数据文件名必须以“download”开头,并以“.txt”结尾,如“downloadCI2008.txt”。在开始利用CiteSpace创建一个新的项目之前,需要具体制定两条路径：一条是数据存储路径,一条是项目存储路径。通过项目存储路径可以找到在CiteSpace运行过程中所保存的图谱和输出文件,数据存储路径则是文献数据的存储路径。　　　　3 研究结果　　　　本文将年发表的共586篇“competitive intelligence”主题文献的题录数据输入CiteSpaceⅡ软件中,题录数据主要包括标题、关键词、摘要和参考文献等。设定选项,调节阈值,选择网络节点确定为参考文献,时间分区设为每年一分区。以下将从时间分布、地区分布及合作网络、机构分布及合作网络、高产作者、研究热点、文献共引等6个方面做具体分析：　　3.1 时间分布　　首先来回顾竞争情报的来源。20世纪50年代，美国Wisconsin大学的怀思汀博士在通用汽车公司中首先建立了一个从事竞争分析和战略决策的“作战室”，开启了正规的竞争情报活动。60年代，日本为了进入美国和欧洲市场，在各行各业广泛开展了以竞争对手和环境为内容的情报活动。而真正把竞争情报作为一门学科来研究是以1986年美国竞争情报从业者协会（SCIP）的建立为标志的。80年代，上海科技情报研究所率先将竞争情报概念引入国内，并进行了实践探索；1994年中国正式成立了竞争情报专业委员会（SCIC），我国竞争情报研究工作开始走上了有组织和相对正规化的道路。
　　图1说明了有关竞争情报研究的文献的发展历程。从图中我们可以看到，最早的有关竞争情报研究领域的文献（A New Factor in Evolution， Baldwin J M）出现在1896年，而直到20世纪90年代中期以后，竞争情报研究领域的文献量才开始有所增加。20世纪末到21世纪初，竞争情报的文献增量达到最大。由此可见，有关竞争情报领域的研究在如今科学技术不断发展的信息时代受到越来越广泛的关注，其研究成果也不断涌现。　　　　3.2 国家（地区）分布及合作网络　　　　图2 世界竞争情报文献数量国家（地区）分布　　对于竞争情报领域，不同的国家(地区)研究实力不尽相同，见图2。竞争情报文献的发文总量以美国最多，为137篇，占世界竞争情报研究领域发文量的23%；中国紧随其后，为113篇，占19%；排名第三的是加拿大。其余依次是英国、德国、中国台湾、西班牙、意大利、日本、希腊等。但从发文量来看，排名第三的加拿大以及其后的各国家（地区）远落后于美国和中国。这表明，美国和中国在竞争情报研究领域中与世界其他国家（地区）拉开了距离，处于遥遥领先的地位。　　　　图3 竞争情报文献的国家（地区）合作分布　　图3展示了各国（地区）发表文献的合作情况，美国和中国发表的论文在数量上遥遥领先，但与其他国家之间合作相对较少，这反映出在竞争情报研究方面美国和中国走在发展最前端，也从侧面反映出这两国之间以及与其他国家（地区）之间的学术壁垒现象。图中可见发文数量较多的国家（地区），与之合作过的国家（地区）并不多；而一些发文数量较少的国家，如德国、意大利等，与他国的协作关系反而很多。　　3.3 机构分布及合作网络　　图4展示了Web of Science数据库竞争情报研究领域文献的各机构之间的合作情况。　　　　图4 竞争情报文献的机构合作分布　　各节点表示该机构不同年份发表的文献数量，连线代表机构间某年合作的情况。2007年之前，各机构间的合作并不密切，大多是发表论文数量较少的两三个机构之间的合作。年尤其是年，出现了代表各机构密切合作的小型复杂网络。可见，发文最多的是美国斯坦福大学 [7]，因为斯坦福大学Koza J R教授对遗传算法的研究极大地促进了竞争情报学科的发展，他是竞争情报的高产作者之一。　　紧接其后的还有Chipworks公司、武汉大学、香港理工大学、香港城市大学、希腊雅典国立科技大学、美国北德克萨斯大学等。　　3.4 高产作者　　对检索到的数据做作者合作分析图，发文量最高的是Koza J R，其次是James D，Bouthillier F等。图5列出了发文量达到4篇的作者。　　　　图5 竞争情报领域作者发文量排行　　在检索到的586篇竞争情报文献中，来自IEEE会议的论文共17篇，突变值域高为4.53。从统计数据可见，在竞争情报研究领域IEEE拥有极大的发言权。　　Koza J R是斯坦福大学教授、遗传算法之父约翰•霍兰德的学生，他于1992年出版了《遗传编程：用自然选择让计算机编程》，来介绍遗传编程。James D是Chipworks公司资深专家。Chipworks公司矢志在系统情报及电路情报服务上成为智能财产权业界的必然选择，依照客户提出的需求调整业务方向,在系统与软件层级提供专利支持服务 [8]。可见，竞争情报的研究与“智能”、“系统”密切联系。　　同时，我国武汉大学信息管理学院的查先进教授在高产作者中位列前五，他先后曾发表过《网络环境下的竞争情报研究》、《突发事件与企业竞争情报咨询服务快速响应》、《面向企业预警的企业竞争情报研究》等文。　　3.5 竞争情报研究热点分析　　关键词是一篇文章的核心与精髓,是文章主题的高度概括及凝练,频次高的关键词常被用来确定一个研究领域的热点问题[9－10]。CiteSpaceⅡ是一个由Java语言编写的基于共引分析的引文网络可视化软件。运行该软件时，可以选择使用关键路径(pathfinder)算法[11]或最小生成树(minimum spanning trees)算法[12－13]对科学文献引文共引网络的路径进行分析和处理，并可以通过显示高频关键词来确定竞争情报的主要研究领域和研究热点。　　表1 竞争情报研究文献出现频次大于30的主题词　　　　输入数据后,网络节点确定为keyword,选择阈值(3,2,20),(4,3,20), (2,1,20),选择pathfinder算法,运行后经整理生成主题词被引频次大于30的主题词列表 (见表1) 以及图6所示的竞争情报研究热点领域知识图谱。　　　　图6 竞争情报研究热点知识图谱　　图6显示的是高频关键词共现网络图,出现频次最高的主题词是competitive intelligence（竞争情报）,达131次。高频主题词反映出的竞争情报研究的其他主要热点领域还包括artificial intelligence（人工智能）103次, competitive advantage（竞争优势）87次，business intelligence（商务智能）、neural networks（神经网络）、data mining(数据挖掘)、knowledge management（知识管理）等。由此可见，竞争情报的研究与现代信息技术及智能化研究有很大关联。　　从国内外的研究和实践来看，竞争情报活动的主要内容涉及到认识竞争形势、了解分析竞争者和参与制定竞争策略三方面。目前国内外主要研究重点在于竞争情报系统的研究和实践。竞争情报系统是一个由多种功能模块有机组合而成的以信息网络为平台的人机融合的应用系统，而此系统为了满足竞争数据管理、竞争情报分析、竞争情报服务三大功能模块，使用了数据挖掘技术、人工智能技术、神经网络技术[14]。这些与知识图谱的结果是相同的。　　3.6 竞争情报研究前沿演进　　接下来对文献进行共引分析，利用CiteSpaceⅡ软件中提供的膨胀词探测 ( burstdetection) 技术和算法，通过考察词频的时间分布，将其中频次变化率高的词(burstterm) 从大量的主题词中探测出来，依靠词频的变动趋势，来确定竞争情报研究的前沿领域和发展趋势[15]。此项选择为膨胀词短语 (burst phrases)，阈值设置仍然选择默认值(3,2,20)，(4,3,20)，(2,1,20)，点击探测膨胀词 (find burst phrases)，运行CiteSpaceⅡ后，探测出的膨胀词居于前6位的是：business-intelligence（商务智能）、neural-networks（神经网络）、competitive-advantage（竞争优势）、highly-competitive （高竞争力）、knowledge-based（知识型）、particle-swarm-optimization（粒子群优化）,如图7所示：　　　　图7 竞争情报前沿演进知识图谱　　由图7可见，主题词频变化率最高的词是business-intelligence,说明商务智能是近年来竞争情报研究的重要前沿领域之一，其次是神经网络、竞争优势等，这些高频突变词所表现出来的研究前沿反映出竞争情报领域也随着新时代的到来越来越毗邻高科技，与新世纪、新应用相适应是竞争情报领域研究不可逆转的趋势。
　　4 结论　　　　本文以信息计量学的相关理论与方法为指导，借助可视化分析工具CiteSpace，以各种类型文献作为知识载体，以Web of Science数据库收录的竞争情报领域的载文信息为主要数据来源，对十几年来国内外竞争情报研究领域中的规律和发展状况等进行可视化分析。得出以下结论：　　 从1896年第一篇有关竞争情报的文献出现到20世纪60年代的几十年间，竞争情报领域研究的发展速度都很慢，直到60年代后才开始出现文献量的较大幅度的增长，之后则一直接近于线性增长。　　 美国和中国在竞争情报领域的研究处于领先地位，其他国家和地区都与他们有一定的差距。而发文量较少的国家（地区）与他国（地区）的合作明显比发文量较多的国家（地区）与他国（地区）的合作要多。　　 美国斯坦福大学、加拿大Chipworks公司、武汉大学以及香港理工大学等机构在竞争情报领域的发文量都位居前列。但机构间合作不多，直到近两年才出现比较明显的代表各机构密切合作的小型复杂网络。　　 IEEE在竞争情报领域拥有极大的发言权，Koza J R、James D、 Bouthillier F以及我国的查先进等都属于高产作者。　　 竞争情报领域的研究热点包括：competitive intelligence (竞争情报)、artificial intelligence（人工智能）、competitive advantage（竞争优势）、business intelligence（商务智能）、neural networks（神经网络）、data mining(数据挖掘)、knowledge management（知识管理）等。　　 近年来，竞争情报研究的重要前沿领域包括business-intelligence（商务智能）、neural-networks（神经网络）、competitive-advantage（竞争优势）、highly-competitive（高竞争力）等，与信息时代接轨，并体现高应用性。　　此外，CiteSpaceⅡ可视化应用软件显示了其强大的引文分析功能,可视化程度高,尤其在分析学科演化、热点和前沿领域方面,具有较强的探测和检验等辅助分析功能。可以预见，CiteSpaceⅡ在未来的科学研究中将继续发挥越来越重要的作用，为科技、科学工作者带来极大的便利。　　　　参考文献：　　[1] 竞争情报产生背景.[].http://blog.省略/s/blog_00iz32.html. 　　[2] 彭靖里，王晓旭，邓艺.论国内外竞争情报发展与实践的现状和特点. 云南科技管理，-11. 　　[3] 侯剑华,陈悦. 战略管理学前沿演进可视化研究. 科学学研究, -17. 　　[4] 赵玉鹏,刘则渊,许振亮. 基于知识图谱的美国《科学哲学》研究前沿和热点探讨.科学学研究, 2008,（6）:52-57. 　　[5] 陈兰杰.基于知识图谱的国际信息资源管理(IRM)研究的可视化分析.情报资料工作，2009,（5）：14-19. 　　[6] 陈超美.CiteSpaceⅡ：科学文献中新趋势与新动态的识别与可视化. 陈悦，侯剑华，梁永霞，译.情报学报，）：401-421. 　　[7] 斯坦福大学简介.[].http://baike.省略/v80695.htm#1. 　　[8] CHIPWORKS 大幅投资全新实验室设备.[].http://it.省略/0143949.shtml. 　　[9] Bailon-Moreno R, Jurado-Alameda E, Ruiz-Banos R. Analysis of the field of physical chemistry of surfactants with the unified scientometric made 1 fit of relational and activity indicators. Scientometrics, ):259-276. 　　[10] Belvaux G, Wolsey L A. Bc-prod: A specialized branch-and-cut system for lot-sizing problems. Management Science, ):724-738. 　　[11] Chen C. Generalised similarity analysis and pathfinder network scaling. Journal of the American Society for Information Science and Technology, ):107-128. 　　[12] Chang S J, Chung C N, Mahmood I P. When and how does business group affiliation promote firm 　　innovation? A tale of two emerging economies. Organization Science, ):637-656. 　　[13] Morris S, Chen C. Visualizing evolving networks: Minimum spanning trees versus pathfinder networks. Proceedings of IEEE Symposium on Information Visualization, (Seattle, Washington, 2003), IEEE Computer Society Press, 67-74. 　　[14] 刘永，王素立.竞争情报可视化探讨.图书馆论坛，8-160. 　　[15] 栾春娟, 侯海燕, 王贤文. 国际科技政策研究热点与前沿的可视化分析. 科学学研究，):240-243. 　　　　[作者简介] 张凌，女，1981年生，讲师，博士，发表论文7篇。
转载请注明来源。原文地址：
【xzbu】郑重声明：本网站资源、信息来源于网络，完全免费共享，仅供学习和研究使用，版权和著作权归原作者所有，如有不愿意被转载的情况，请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息，与本网站立场无关。xzbu不保证该信息（包括但不限于文字、数据及图表）准确性、真实性、完整性等。}

常信村百科网