paiairp0rt中文思密达是什么意思思

中文信息处理_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&中文信息处理本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来吧!
是指用对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与、语言学、、信息学、等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。外文名Chinese information processing领&&&&域计算机
基于、国家、等各种问题,所需要处理的文字,有
中文信息处理时不仅包括、繁体汉字,也包括、蒙文、、等大量的文字,周边国家的假名、,还包括古汉语文字、、等各种不同的文字。中文信息处理可以从硬件及两方面去看,以下详述中文信息处理的发展、现况及未来发展等多方面的面貌。基础研究:汉字字频统计、词频统计、汉语自动分词、句法属性研究、
汉字、通用汉字样本库、汉字属性字典、语料库等 输入技术:、中文手写输入、中文语音输入、等
输出技术:汉字字模技术(字型库)、汉字激光照排、汉语等
存储技术:汉字库标准等
转换技术:繁简转换等
信息处理:中文、中文文本校对、机器翻译、、中文人机界面等、、、、心理学、、数理统计、控制论、神经计算、模型论、信息学、形式化理论、等在1946年由IBM发明,当时的电脑主要用于计算。及至1960年代,商用开始普及,电脑被用于处理大规模的数据,当中其一个重要项目是的目录整理。在当时,及多家大学都有不少来自的藏书。为了有效管理这批藏书,必须要有一套有效处理文字的系统。这套系统包括了两方面:其一是如何把文字储存在内;其二是如何在电脑表示出东亚文字。
汉字在过去,每一台都有各自的数据表达方式,使电脑之间不能沟通。及至1960年代(ASCⅡ)的出现,之间才可以互相沟通。不过,ASCⅡ并不能有效处理英文以外的文字。
最早可以处理中文的,可以追溯到1970年。在当年举办的大阪万国博览会上,IBM公司公开了部分汉字处理系统的技术资料,到了1971年正式发表。当时公布的机种包括有「IBM 2345 汉字印刷机」丶「IBM 029 汉字穿孔机」丶「「IBM System/360-System/370 OS/VS」及「DOS/VSE」等。其後,本土公司也争相开发,包括有富士通的JEF(Japanese processing Extended Facility)丶NEC的JIPS(Japanese Information Processing System)及日立的KEIS(Kanji processing Extended Information System)等,全是大型。到了1979年5月,NEC发表了可使用汉字ROM的私人PC-8000系列;到了1982年10月,更开发出有名的16位元的PC-9801私人电脑,能处理汉字的电脑在渐渐普及。在七十年代末期,更出现一种专门用作编辑文件的文书处理器,可看成为一种拥有特定功能的小型,八十年代中後期再演化成手提方式,并可打印出汉字。至於输入方式,由日东芝发售「JW-10」起,「假名汉字变换」成为主流的汉字输入法;即以日文拼音的方式,配合人工智能,输入汉字词汇。在还没有真正的中文前,中国大陆部分学者依靠入口的电脑来处理中文。
1973年,新华社派出考察团到,参观了日本共同社丶日立丶日本电气丶松下及东芝等公司。他们看到共同社采用磁芯技术解决了2000左右汉字和片假名的存储问题,并发现工作人员使用大键盘方式输入稿件。他们回国後,提出了采用技术改善新华社收发编印四方面,并由中国四机部(民用机械丶核工业和核武器丶航空及电子工业)与北京市科技局邀请了富士通等公司到中国进行技术座谈会。後来,四机部提出研制汉字信息处理系统。在1974年8月,中国开始了748工程,包括了用计算机来处理中文字,展开了各种研究工作,后来到1980年公布了汉字编码的国家标准,1983年研究Unix中文化,1985年推出了Unix中文版。
台湾方面,早期美国空军研究部门,曾经与IBM公司合作研发中文,斥资了六千万、历时十年,研究电脑处理中文字的方法,结论是电脑不能处理中文。而当时的开始化,一批中文书有待编入目录。另外,多家公司也开发了式的中文系统,包括有王安丶工技院(中华一号到中华三号)及神通等。这些机器多数采用大键盘的输入方式,有数十至数百个键。到了1976年,中文电脑之父发明了一套形意检字法,并在1978年改进为仓颉输入法,以英文键盘输入中文。在1979年,朱邦复提出以图形功能及从显示器的英文字符产生器入手,研发中文,并由宏碁公司出产。之後,在原有英文操作系统上外挂中文系统的方法大行其道,多套中文相继推出,包括有国乔丶及仲鼎等。
中文信息处理至今经历了两次高潮:1980年代中期到1990年代中期之前,核心内容是汉字的计算机处理问题;经过几年的发展低潮之后,1990年代末,中文信息处理的重点转向、和语义处理方面。
汉字之难——被抛弃的时代:在上半叶,英文打字机的普及极大的提高了文字资料的录入速度。而由于汉字的复杂性,使中文打字机迟迟未能设计出来,再加之基础汉字的学习难度大、时间长,连都喊出“汉字不灭,中国必亡”。之后,虽然设计出,但要配备数千个铅字组成的大字盘,昂贵的机器成本和复杂的使用技术决定它不能普及到大众使用。对此也深感无奈,发出了中文“要走世界共同的拼音文字道路”的慨叹。这些局限于条件所限而做出的言论,在中文信息处理技术发展后期仍然被经常(断章取义的)提及。
朱邦复1984年的有这样的记载:“法新社8月5日电 新华社派了22名记者,4名摄影记者和4名技术人员在奥运会采访和工作。在全世界报道奥运会的7000名记者中,只有中国人用手写他们的报道”……此时只有中国人仍然用手写从事着创作。
汉字成了被打字机抛弃的“落后文明”,直到八十年代PC技术推广下,中文PC系统问世,中文信息输入的问题,才有了初步解决。汉字的拉丁化问题:,是给汉字进行注音的方法,从而易于中西方交流,或者代替汉字。有些人以为将汉字改造为文字,希望以此在短期内大幅增加中国人民的识字率。
缘起:中西方的交流很早就有了,而不同的文化交流需要语言的沟通,可以实现西方人对中国的了解。近代以前,汉字的拉丁化基本由西方人进行。近代中国遭受了一系列的变故,彻底打破了中国固有的文化自豪感。中国近代的一些思想家认为中国古代的一些遗留阻碍了中国的发展,包括思想、等,其中也包括汉字。
汉字由于其字数众多,学习比较费劲,而且由于师承不同,字的具体写法也有不同。近代科学大量引入中国,汉字在这些概念面前变得不够使用,又由于影响,汉字改革遂成为主流的社会思想。其中、鲁迅等提倡尤甚。
过程:最早的的实践来自于中西方的交流,若要介绍中国的一些地名、人名或其他固有名词到西方,必会涉及汉字拉丁化的问题。明清西方传教士为了学习汉字和传教的需要,开始系统用拉丁字母给汉字注音。1605年天主教耶稣会士、意大利人窦(Matteo Ricci)的《西字奇迹》具有开创性的系统化意义。1626年耶稣会士出版的《西儒耳目资》是最早用音素给汉字注音的字汇,所用的拼音方案是利玛窦方案的修正。1867年,在使馆任中文秘书的(Thomas F. Wade)出版了一部《语言自迩集》,创立了一个拉丁化的,使用时间很长,对汉字的拉丁化起了重要作用,以后的方案都有参考。
“国语”繁、简体、拼音化1918年教育部公布第一套法定的37个民族字母形式的注音字母方案,特点是采用符号表示声调,这虽然不是一种直接的拉丁化方案,但用符号表示声调的方法却延续到。
1928年公布第一套法定的拉丁化拼音方案-国语罗马字(简称国罗),特点是用字母的拼法来表示汉语的声调,实际上由于流传时间较短,时间起到的作用不大。1958年,公布的第二套法定的拉丁化汉语拼音方案,使用了26个拉丁字母,用符号表示声调,但是这种符号不易在西式打字机上实现。1980年代,汉语的进入日程,形成“万码奔腾”的局面,汉语拼音方案作为重要的拼音输入方法得到使用,使汉语较能同信息化接轨。
汉字信息处理阶段:
硬件:、、等公司的;、的中文电脑;四通中文打字机;大洋字幕机
巨人M6403汉卡
企业:联想、、四通等一批靠中文处理产品起家的企业。
标准、基础研究:中文信息处理界基本上完成了词频统计、多种显示/打印、汉字显示/打印技术、输入法、标准、标准等与字相关的所有基础工作。倪院士说,到2000年,中国已制定了70个与中文信息处理相关的国家标准。
学术理论:1990年代中期,最为普及的由DOS升级到平台。从中文版开始,在里集成了汉字处理技术,使传统中文信息处理产品迅速失去了市场。中文信息处理进入一个低谷,原先做中文信息处理的公司纷纷转行。及以上版本,无论采用何种文字,均已支持中文处理。
中文、、中文
互联网时代的中文处理:互联网时代对中文信息处理产生了新需求。互联网上的海
注音符号与拼音法量数据为提出了新的课题;其次,外文信息已经多到不能人工完翻译的程度,机器翻译的重要性被提到了空前的高度;第三,手机、PDA等移动设备将信息处理需求变成无处不在,非标准键盘的需要有新的方案。大量新的课题出现,重新启动了中文信息工作的热情。
汉语信息处理阶段
:与此同时,为方便使国内各民族化的步伐加快,政府作出一连串行动去使这些民族的语言更便于“计算机化”。这一连串行动包括以下各项:
取消民族语言中的特殊字符,尽可能以26个标准拉丁字母代替。(参看:壮语) 为还未有文字的民族设立以拉丁字母为本的新文字。方面,在1990年代曾引发“中文电脑化”及“电脑中文化”的争议。
资策会方面的意见:认为的操作空间有限。如果不让中文适应环境,中文就会失去新时代的活动能力而变成死的语言。
学界及业界的意见:操作空间有限的只是短时期的问题。随着发展日新月异,操作空间的限制很快就变得没有意义。政府应该在新时代来临以前,及早制定长远的标准。
结果:资策会未能在ISO 10646开始讨论中日韩文字编码空间之前产生一个前瞻性的编码方案,加上当时政府的阻挠,使繁体字几乎要在世界消失。后来幸得多方面商讨和配合,同意中日韩三国共享编码空间,成为了今时今日的中日韩统一表意文字,而台湾的一万三千多个字亦准以“民间通用标准”为理由成为了统汉码的参考标准之一。对汉字的亲和性增加,而Unicode在统汉码之后,亦不断推出扩展A、扩展B及扩展C计划,以涵盖上所有曾经出现过及使用过的汉字,并为它们编码记录。现时已整理好接近七万个汉字。天汇汉字系统TW213
希望汉字系统UCDOS
零壹中文系统
国乔中文系统
,它还有Windows版本,最后一个版本是倚天2000 for Windows
震汉中文系统,因与高度相似而曾被倚天控告。
这些都是1980年代出产的,随着Windows通行都逐一末落了。编码 (encoding):用数字代替文字
中文:例如Big5
中文交换码:例如CCCⅡ、CNS11643
壮文字集: 要先选择一定数量的字, 如常用字3500,或某本字典收录的八千字
(主要是台湾及用):Big5,,一万三千多字
(主要是中国大陆用):GB,六千多字
繁简混合: GBK (由GB发展而来),二万多字; Unicode2.0(可同时处理日文、韩文等文字),二万多字( font):细明体(不能使用,因错字多)、(符合台湾字体标准)、SimSun(简宋,符合大陆规范)
字型技术(在荧幕及):(bitmap)、向量(vector)、TrueType、OpenType等 输入
键盘:字形输入:、(及因仓颉而衍生的简易等)、快码、九方、纵横等
字音输入:汉语拼音、注音、港式拼音及其他方言拼音
其他:混合字形及字音,使用英文译成中文
倚天中文系统(语音输入)、手写板(手写认字)、扫描器(字符识别 character recognition)这是一项最关键的语言工程,汉字如不能进入计算机,自动化、印刷出版现代化 、办公室事务自动化都将化为空谈。近10年来,汉字信息处理研究得到很大发展。曾设计了 400多种方案(见汉字编码),其中上机通过试验或已被采用作为输入方式的,已达数十种之多。研制了上百种汉字和设备。这些系统主要采用两种类型的键盘:一是笔触式大键盘,另一是。前一种除整体输入外,一般还有利用部件组合的能力;后一种有的可兼容多种编码方案,有的还带有计算机引导的智能。
汉字信息处理除了在方面进行研究外,还制成了若干种输出专用设备,其中有各种类型的汉字输入键盘、汉字字库、汉字显示终端、汉字图形兼容终端、汉字印字机。成套的汉字信息处理系统(包括汉字编码法、通用中外文键盘、通用中外文显示器、汉字打印设备、汉字库和系统等)已研制成功,并安排批量生产。一种最新式的编辑排版系统──计算机激光汉字照排系统也已研制成功。中国的字模生产有良好的基础,1985年 5月国家标准局公布了《信息交换用汉字15×16点阵字模集及数据集》和《信息交换用汉字24×24点阵字模集及数据集》两项标准,为各种设备的设计和推广提供了有利条件。
为了使人们摆脱繁重的编码输入工作,汉字的光电自动识别研究提上了日程。近年来有越来越多的单位从事和印刷体的识别研究。邮电部数据所和提出了象限端点和转动惯量特征识别法,提出了文字线长度识别法,公用事业研究所研制出数字条形识别系统,电子工业部第52研究所设计了提取汉字笔划特征的划分映射法,清华大学研制了有限制性汉字识别系统。
为了使各种系统之间的信息交换有共同性,也为了使各种的设计有统一的根据,1981年国家标准局公布了《信息交换用汉字编码基本集》(简称《汉字标准交换码》)。这个标准是根据汉字使用频度制定的,共分两级,一级3755个字,二级3008个字,共6763个字。为了满足少数用字量超过基本集的用户和台湾、香港等地的需要,正在制定《信息交换用汉字编码字符集辅助集》,辅助集将根据使用频度高低分作第一辅助集和第二辅助集,各收8000余字。计算机和语言的最早结合开始于机器翻译。1956年,机器翻译被列入工作的发展规划。1957年,机器翻译研究工作正式开始进行。这可以说是中文信息处理的第一项工程。首先研究的是俄汉机器翻译,并于1959年成功地进行了试验,译文输出是代码,而不是汉字,因为当时没有汉字输出装置。1958年底至1960年初,又研制了一套英汉机器翻译规则系统。年工作处于停顿状态。近年来,先后上机试验了英汉、俄汉、法汉、日汉和汉外(英、法、德、俄、日)机器翻译系统十余个。有的输出汉字译文。有的输出拼音译文。
语言的对比研究是机器翻译的语言学基础。在外汉系统中调整词序是一个中心任务。词序的调整,首先必须分清层次和确定轴心。为了调整词序,有的系统还建立了一套特殊的成分体系,即。介词、连词和是机器翻译研究中的难点,对它们的正确分析是解决词序调整问题的关键。当发生困难时,需要进行。
影响机器翻译发展的最大因素在于译文的。就已有的成就来看,机译的质量离理想目标仍相差甚远。中国数学家、语言学家教授曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了人脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。[1]为了提供标引和检索蓝本,1979年编辑出版了10卷本的《》。目前,中国已有上百个单位开展情报检索的试验研究,其中十几个单位已进入定题情报服务 (SDI)的应用阶段。不少单位正在建立各种汉字文献数据库,同时还在考虑联机网络问题。
中的关键问题是的建立(见)。除一般的词汇语法问题外,中文情报检索系统中还有一个特殊问题,就是词的切分,因为检索是以词(关键词)为基础的。
④言语统计:中国利用电子计算机进行言语统计是机器翻译工作者开始的。1978年语言研究所和计算技术研究所在合作研究 ECMT-78英汉机器翻译系统的过程中曾编制一个排序统计程序,加工过一些外文资料和汉语拼音资料。1981年等单位开始对人工调查统计的词汇进行计算机处理。1985年完成了《汉语词汇的统计与分析》,在52万多字的汉字语料中统计出18177个不同的词, 这些词出现的总和是374654次,出现最多的单音节词是&的&, 出现最多的双音节词是“我们”。1986年 6月又完成了《现代汉语频率词典》。1982年等单位开始更大规模的汉语统计工作,要在2000万字的语料中进行字频和词频统计。部分字频统计结果已经得出,从年的1200多万字的语料中统计出8969个不同的汉字,并提供了这些汉字根据不同学科分类的26种使用频度表。
由于词的自动切分问题尚未解决,因而现在的词频统计都是在人工调查统计或人工分词的基础上进行的。
另外,和利用计算机对1.6 万多个汉字的部件进行了统计分析,以研究汉字的结构特点。为了研究人名用字的使用情况,中国文字改革委员会和根据人口调查材料对人的姓名分别进行了统计。很多省份“王”为大姓,而“陈”、“林”为大姓。最近几年,随着的进展,语言研究所、心理研究所、自动化研究所和一些大学开展了汉语理解系统(人机对话)的研究。目前只限于书面语言理解,而且主要是问答型的。输入方式采用汉语拼音。上机试验结果表明,有的系统已有识别30多种句型的能力(见汉语书面理解系统)。汉语语音理解系统的研制正在酝酿之中。近年来很多人关心这一课题。现代化教育技术研究所、、等单位已研制出语言教学多种(见)。语音打字的任务早在1958年便已提出。1964年实现了“元音识别机”,1970年前后又实现了10个口呼汉语数字的识别机。但利用电子计算机进行识别研究,则始于 1972年。研究所利用语音图样匹配方法在一定范围内实现了单呼语言的识别,正确率达99.5%以上。哈尔滨工业大学利用音素分析法进行汉语识别,正确率达90%以上。
汉语合成的研究已在一些单位进行,一般尚处于研究实验阶段。自动化系最近试制成功一种会说话的中文计算机,机器里存有声韵母等语言数据,计算机会自动根据拼音规则实现拼接,合成语音。国外有人曾将汉语方言资料输入计算机,让计算机提供各个方言、、的出现,以及鼻化、现象分布的百分比。这些数据不仅有利于方言的共时描写和比较,而且还有利于检验各种构拟假说的正确性。目前,中国已开始利用计算机进行方言研究和绘制方言地图。1980年武汉大学开始语言自动处理工作,主要是编制逐字索引,同时提供汉字统计数据。他们计划编辑《现代汉语语言资料索引》23辑,收录现代著名作家9人的作品共33部,总字数500多万。前 5部作品(、、、和)的逐字索引和统计资料已相继印出。最近,他们又与合作,完成了的语词索引和统计资料。其他一些书籍的索引工作也在进行之中。武汉大学等单位利用现有的语料库开始进行风格学研究,随着语料的扩充和统计方法的改进,将会提供不同作家的风格特点和各种风格对比研究的成果。
利用计算机编制词表、词典也已提上日程。语言研究所正在编制《多语对照语言学词汇(英、法、德、俄、中)》。机编词典除能加快辞书的编辑出版过程外,还可以随时扩充、修改,保持词典的先进性。
中文信息处理研究方兴未艾。随着研究手段的改善和研究工作的深入,还将有更多更新的项目涌现。日文电脑,韩文电脑,其他文字的
加在其他操作系统或硬件上,如Linux,Macintosh,PPC,Palm,手提电话等
搜寻器 (search engine)
语义网 (sementic web)
电子书 (ebook)
电子字典(形式如或硬件形式如快译通)
辅助翻译 (computer aided translation)
的国际化(internationalization)和本土化(globalization)
新手上路我有疑问投诉建议参考资料 查看steal the spotlight的中文释义
沪江词库精选steal the spotlight是什么意思、英语短语。
steal the spotlight的中文翻译: 把观众的注意力吸引过来,哗众取宠
英语短语推荐
2015steal the spotlight是什么意思由沪江网提供。中文维基百科_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&中文维基百科
中文是维基百科协作计划的中文版本,自日正式成立,由──维基媒体基金会负责维持,截至日14:47,中文维基百科已拥有314,167条条目,累计次数达13,708,705次。此外还设有其他独立运作的中文方言或版本,包括闽南语维基百科、、文言文维基百科、吴语维基百科、闽东语维基百科、赣语维基百科及客家语维基百科等。
营利性质 否
网站类型 线上百科全书
需注册 可选
在这个网站启用时,仅以“中文Wikipedia”为名。直到10月21日,Wikipedia的中文名,经过13人投票,命名为“”。首先“”二字符合的译名标准,另外“维”字意为系物的大,也做解释,可以引申为,“基”是事物的,或是的。“维基百科”合起来可引申为因特网中装载人类基础知识的。
中文维基百科的副题是“海纳百川,有容乃大”。这是中国大臣(1785年——1850年)于1839年为广州越华书院所创作的的上联,下联原为“壁立千仞,无欲则刚” 。“海纳百川”语出《·形势解》,意指海洋之所以广大,是因为它不分你我地容纳了数以百计的。“有容乃大”则语出《尚书·周书·君陈》。对联的上联勉励待人接物应仿效海洋,以宽大的胸襟和宽容的态度去接纳不同的人事地物。这同时也配合了维基百科自由开放的宗旨。GNU的标志。
中文维基百科正如维基百科本身,有三个引人注意的特点。正是这些特点使中文维基百科与传统的中文百科全书有所区别:
首先,中文维基百科将自己定位为一个包含人类所有知识领域的百科全书,而不是一本、在线的或其他任何东西。
其次,计划本身是一个,这允许了大众的广泛参与。中文维基百科是第一个使用wiki系统进行百科全书编撰工作的中文协作计划。
还有一个重要的特点,那就是中文维基百科是一部内容开放的百科全书。内容开放的材料允许任何不受限制地复制、修改及再发布材料的任何部分或全部。维基百科使用。
和其它版本的维基百科一样,中文维基百科也是、精英制、的混合,通常大部分的内容,由普通的网友讨论、修改,通常为的形式,而维基则因特殊、适当的理由而解除部分限制,例如修改首页、适当的删除文章或封禁用户。中文维基百科使用书写。汉字是的共同,是中国大陆、中国的,中国、中国、的官方语言之一。中文维基百科未规定以官方语言(普通话、国语)书写,但维基人默契以其为通用形式,适度掺入书面语或,以力求文句通顺优美。
中文维基百科的者来自于世界各地的华文使用者,根据2006年9月初维基百科对各语版本的编辑者来源的统计结果,香港的编辑者占28.6%、台湾占25.9%,而和则分别占13.7%及8.2%。
来自于各地拥有不同成长背景的华文使用者共同参与了中文维基百科,不同的政治立场与社会观念在中文维基百科产生最直接的接触,中文维基百科的文章内容是全球华文使用者相互妥协折衷后的成果。此外,包括中文维基百科在内各语言版本对于非自由版权下的内容,或者版权、来源不明的文章和图片,则保有不同于 当地网络氛围的,极为严格的审查制度。基本上任何不能用于自由传播或者禁止无经济补偿地应用于商业领域的文章、图片,原则上均不会被保留在这里。
中文维基百科大幅度且深度地介绍、中国与中国大陆、台湾、香港、澳门、新加坡等地区介绍。在某些领域,阐述了华语使用者的价值观,内容更贴近于华人自己的理解。截至日20时20分,目前中文维基百科已有314,209个,但这个数量还不包括对话页、没有内部链接的条目、重定向页以及其他名字空间的页面,如果加上这些页面,截至2010年6月底,总共有1,022,962页,并有超过1370万次的编辑。[1]参与人数方面,共有逾44,966个注册用户曾进行编辑,当中编辑超过1,000次的维基人共有570多人,而他们的贡献占了中文维基百科编辑总次数的约75%。至于管理人员,中文维基百科拥有79名管理员及8名行政员,负责站内日常的维护工作。自从2002年第一个条目起,中文维基百科至今已经迅速扩展。年5月,中文维基百科计划与其他12种主要语言维基百科计划同时成立,但当时维基百科网站不支持中文输入。同时期,与中文版有相同困扰的,权宜地使用来撰写条目,中文维基百科在当时则只拥有少许的测试文字。
日,Ghyll(现在的)成功的借由的辅助,撰中文维基百科第一次聚会时的照片写了实质中文内容的文章,中文维基百科至此才算是真正开始运作,而Mountain也成为中文维基百科的第一位参与用户。,中文维基百科移动到新,软件升级到Phase III,新版的软件解决了中文输入的问题。11月17日,中文维基百科网站界面的中文化工作告一段落,Mountain翻译了英文条目Computer Science,张贴到中文维基百科上来,这是真正意义上的第一篇条目:。
在中文维基百科的早期,大部分的长条目都是从英文翻译过来的,中文维基原创的则是以短条目居多。中文维基百科最资深的维基人是Mountain,而早期累积大量编辑次数的五位资深维基人:Samuel、Menchi、Lorenzarius、Formulax与Shizhao,在日一起成为首批中文版的华人管理员。
其中Shizhao在维基百科的整理和协调方面做了大量的工作,他在中文版的其他计划中也做了很多维护的工作,其编辑次数亦高居榜首,惟其处事手法亦备受争议。
2002年至2003年,中文维基百科持续进行本地化与正体(繁体)化的翻译工作。直至日,随着MediaWiki 1.4版本的发布,中文维基百科初步实现正(繁)简体自动转换。《明报》于香港首次正式报导维基百科日,中国大陆的《》文章[介绍维基百科,这是中文媒体第一次正式报导维基百科。翌年2月15日,同是中国大陆的《》在第173期也发表了与维基百科有关的报导,接着随后的几周,许多媒体跟进报导,为中文维基百科带来了大量的中国大陆维基人。2004年的3至5月,维基人以倍数计的增加,总条目数很快的从6000篇突破10000篇。
日,台湾的《》刊出〈维基网络,大家一起写〉,是台湾主流媒体首次报导维基百科,随后于6月,台湾的《》跟进报导〈Wiki百科网书,你也可写一笔〉,为维基百科带来大量的台湾维基人,台湾相关条目的编写量大量增加,首页也加入了台湾的热门新闻。
香港媒体对中文维基百科的关注较迟,是香港维基人发展起步较迟的主因之一。日,香港的《》于副刊发表〈生活百科:Wiki世界 自由开放〉,这是香港媒体第一次正式报导维基百科。3月29日至3月30日,香港的《头条日报》于新闻故事连载发表〈网友齐编“自由”百科全书 港八月办首届中文维基联会〉(按:应是),这是香港媒体第一次深入介绍中文维基百科。同年5月,中国大陆的《》也报道了维基百科,很多大陆青年就是通过阅读报纸而得知并加入维基百科的。中文维基百科突破十五万条目时的特殊标志中文维基百科于2002年10月刚开始时,英文维基百科已有超过40,000条目,成为起步较迟的主要语言版本。日,中文维基百科突破了5000条条目,但是其中有些文章包括正(繁)简两个版本;注册用户数也同时突破了3000人。2月27日,用户Ktsquare大量添加年份条目,使中文维基百科短短3天内就突破了6000条条目。5月14日,中文维基百科总条目数终于突破1万条。
随着更多维基人的加入,条目数量增长速度也稳步上升。日,用户Shibo77大量添加年份条目,使中文维基百科短短1天内就增加了500条条目,并突破5万条。到了日,中文维基百科条目数突破10万条,成为第12个拥有超过10万条目的维基百科语言版本,为一个重要的里程碑。日,中文维基百科条目数突破15万条。日,中文维基百科条目数突破30万。[2]中文存在两种书写系统──()与。一般来自台湾、香港、澳门的使用者使用正体中文(繁体中文),来自中国大陆、新加坡、马来西亚则使用简体中文。因为缺乏交流与各自不同的书写系统的发展,许多正式的名称在中国大陆、台湾、香港、新加坡完全不同。举例来说,电脑的打印设备,在中国大陆称为,在台湾称为印表机。随着中文维基百科的成长,正(繁)简体问题也成为中文维基百科发展不得不面对的问题。在2003年的讨论中,中文维基百科社群的主流意见,是让正体(繁体)简体并存于中文维基百科,正(繁)简体问题应该通过发展转换程式来解决,而不是让正(繁)简体分别成立两个中文维基百科网站,但是当时没有开始开发相关的技术,仅止于讨论。
绝大部分的条目是正(繁)简体共同存在一篇文章之中,少数条目是拥有正(繁)简两个不同的版本,例如法国曾经使用两种不同版本:与法国,或是“日本/简”,“日本/繁”。其他维基百科可以使用zh-tw与zh-cn做跨语言连结。中文维基内部的正(繁)简跨语言连结则是使用〖中文维基百科|繁〗这样的方式做连结。这种方式可以使两种文字系统互不干扰,但却只能靠人工整合正体(繁体)简体两版本的差异。而公告、总集型页面则以正(繁)简并存的方式存在(如Wikipedia:Wikipedia的中文名/投票结果开头介绍部分依然是正〔繁〕简并存),以示正(繁)简体文字在中文维基百科具有相同的地位。
在正体(繁体)简体转换功能启用之前,部分的使用者大量地将正体(繁体)文章全面改为简体,反之亦然,实际上却未编辑文章中的任何内容。如此的作法被视为一种破坏行为,正体(繁体)内容的缺少很容易被视为中文维基百科排挤正体(繁体)字的使用者。随着简体使用者大幅度的增长,中文维基百科从以往的正 (繁)简并存,逐渐成为简体为主流的百科全书。中文版成立以来就不断出现正体(繁体)版或是台湾版维基百科独立的呼声,从这段时间得到越来越多台湾使用者 的认同。
经过大约两年的争论与等待,2004年9月,Zhengzhu加入中文维基,提出正(繁)简转换的处理方式为 此并制作了具体程式,开始进行正(繁)简转换功能的开发。该套转换程式一度以主要中文维基用户的所在地为分类,后简化为“简体”、“繁体”与“不转换 ”3类。中文正(繁)简转换系统因其易于手动添加及使用,成为中文维基百科解决正(繁)简问题的最实际并可行的方案。该套方案及程式在2005年的第1届维基媒体国际大会上由中文用户进行了简单的介绍。
为了免除如此的障碍,从日起,中文维基百科在服务器端提供一个功能──正(繁)简体自动转换功能,能够依据用户参数自动地转换不同的与词汇至用户端浏览。过去许多使用正(繁)简两种版本内容的文章逐渐合并。输入正(繁)简两种名称都可以检索浏览合并后的文章。
转换功能免除了正体(繁体)简体的隔阂,也一并解决了中国大陆与台湾、香港之间词汇的分歧所带来难以跨越的障碍。
最初在页顶的条目文字转换的标签只有“不转换”、“简体”及“繁体”三种,但“繁体”是使用台湾用语的繁体字,对习惯港澳用语的香港、澳门使用者感到不便。2006年11月,经投票通过后,页顶的条目文字转换的标签改为“不转换”、“简体”、“”及“港澳繁体”四种。 在2007年1月,转换标签更增加至“不转换”、“大陆简体”、“台湾正体”、“”及“港澳繁体”五种。经过一定时间发展的维基百科一般都会产生“特色条目”,虽然真正100%符合维基百科完美作品标准的条目实际上并不存在,但特色条目依然是作为该语言维基百科中,通过多数人认可为比一般条目要更为完整、优秀的作品。它们一般是众多维基人共同协作的甜美果实,也可以是部分人独立完成的华彩篇章。每一篇特色条目都会在正文右上角和条目讨论页上注明标记。
对于中文维基百科而言,特色条目的概念的出现始于2004年3月(中文维基百科实质开展近半年后),起初是由管理员们将个人认为较为完整的条目遴选为特色条目,而这种做法在中文维基百科步入条目数量与质量大幅增长后变得不符合发展的要求。此外,为尽快提升中文维基百科条目的质量,该年5月份,中文维基百科引入了一直持续到现在的条目质量提升计划,成为当时唯一一个成为特色条目的方法。但不久后,“特色条目评选”制度也许可有个人独立完成的条目参选特色条目。
最早的特色条目是与 (英格兰),经过第一次同行评审后伊丽莎白一世依然保留了特色条目的地位,该条目也成为中文维基百科最早的特色条目。但是在日,伊丽莎白一世 (英格兰)已被撤消特色条目资格。日,中文维基百科的特色条目数量正式突破100,第100个特色条目是哆啦A梦,但由于随后有数条特色条目被撤消资格,因此特色条目数目一度跌回100以下的水平。直到两个月后的4月28日才再度回到100个特色条目的数字。
另一方面,中文维基百科很多条目拥有极佳的内容质素但其仍不足以成为特色条目;可能是因为其长度过短、或论题过广、或过于聚焦于某一话题、或是该条目所述的领域并不太知名。即那些具有成为特色条目潜力的条目,由维基人主动找出、编写,通过提名并通过的,将会成为优良条目。
截至目前,中文维基百科拥有139条特色条目,当中以类最多,其次是及类的条目。可能与参与者的爱好和日常工作,文化类条目的普及度较高所致。同时,中文维基百科拥有521条优良条目,数量正稳定上升当中,其中以政治类条目最多,但历史与地理类条目也占到很大比重。条目质量提升计划开始于2004年5月,目的是集合维基人的力量,更快地合力打造更多特色条目。条目质量提升计划在动员更多维基人参与的同时,提升中文维基百科的写作质量,选取进行质量提升的条目由维基人投票决定,在经过数周的提升后复交特色条目评价。当中,特色条目评选得分最高的是,满分5.0分中平均得4.8分。
除了主计划之外,其他领域下也设有自己的条目提升计划。例如香港条目提升计划是针对香港相关条目而发展的质量提升项目,以提升香港之条目至特色条目为目标。此外,还有台湾主题、主题、主题、主题,但后三者现时经已在荒废状态,只有香港和台湾的计划仍然继续正常运作。
然而,自2006年起,由于维基人对编写条目的态度,转变成以独力完成为主,因此这些条目质量提升计划的成效大不如前。除了提升后的条目质素并无大改善,部份计划更陷入荒废的状态。2006年11月曾有维基人动议废除条目质量提升的主计划,但主流意见是倾向保留进行改革,直到现时还未有最后定案。
日,由用户dgg32提出的用户条目质量提升计划正式试行。该计划目前预计试行3个月,到期后由维基人讨论其可行性,并且是否取代旧计划等问题。是中文维基百科特有的一种为增加条目数量与兼顾质量而进行的召集维基人编辑条目的活动,方式是部份维基人主动邀请其他维基人参与条目编辑。动员令可分“大动 员令”及“小动员令”两种。目前动员令已举办七次,其中前三次为大动员令,第四次为小动员令,第五次、第六次、第七次为大动员令与小动员令结合的方式。而第三至七次动员令更启用了加分机制。
首次动员令举办于日到日;第二次是在日到日;第三次是在日到日;第四次是在日始到4月30日,这次动员令限定了生物动员令、翻译动员令、寰宇动员令、体育奥运动员令、动员令和暗黑动员令六个主题;第五次是在日始到8月31日,第五次动员令指定了消灭外文、历史与世界遗产三个主题,编辑者既可以编写这三个主题的条目,也可以编写其他领域的条目,但编写特定三主题条目有额外加分;第六次是在日始到日,第六次动员令和第五次动员令一样采用大动员令加小动员令的模式,完成小动员令会有额外加分,第六次动员令的小动员令分别是消灭外文动员令、经济、动员令和科技动员令。第七次是在日始到日,依旧采用大动员令加小动员令的模式,完成小动员令会有额外加分,第七次动员令的小动员令多达七项,分别是优化工程、消红任务、体育、地理、节日、人物和计划页面翻译。第八次则会于日至8月28日举行,是次动员令将会引入中动员令,类似小动员令的一项动员令。
一些维基人乐于接受这种活动,但亦有人表示反对。总的看动员令确实对中文维基条目质量产生一定促进作用,但因参加 人数有限而效果平平。关于动员令是否应该继续举办下去也多有争议。中文维基参予了的每周翻译计划,每星期从其他语言版本的维基百科翻译一篇条目。这个计划到现时为止已成功翻译超过100条中短篇幅的外语条目,为翻译工作提供榜样。中文维基百科设有不同的专题。 专题是一个帮助各参与者去整理在维基百科中某一特定范畴的资料的资源。这不是提供那些资料的地方,而只是一个有关那些资料的资源:如那些资料应如何编排方 式、或是哪些内容是应当包括等等。而且各个专题的讨论页亦为那些对该题目有兴趣的参与者提供了一个讨论地方。截至2007年11月,中文维基百科共有 100个专题。
对于特定范畴,中文维基百科还设有。 主题首页是为对某一领域的知识感兴趣的维基人及一般读者提供的首页,用于帮助查找该主题的资料,并扩充与该主题相关的条目。一个维基主题可与一个或多个专 题相连,但与专供维基编者使用的维基专题不同,维基主题是同时为编者及一般读者服务的。截至2008年9月,中文维基百科共有107个主题首页。为凝聚对特定范畴感兴趣的维基人,中文维基百科设有不同的工作小组及兴趣小组。工作小组的主要焦点的中文维基百科内的站务维护,而兴趣小组则集合了对有兴趣编写特定范畴条目的维基人,借此进行意见交流。截至2007年11月,中文维基百科共有10个工作小组及40个兴趣小组。2005年8月,有香港的维基人者尺发起了香港维基人布告板。这是中文维基百科首个成立的地区性维基人布告板,作为香港维基人和对撰写香港条目感兴趣的维基人联络之用。该板的最大特色,是其香港条目提升计划。在这个计划之下,有数个条目质量得到了大幅提高,并成为特色条目。最早从此计划中出来的特色条目是,于该板的条目提升检讨中在满分5.0分中得到平均得分3.4分。
继香港维基人在中文维基百科首创地区性维基人布告板之后,于1月1日,有台湾的维基人阿儒发起了相同性质的台湾主题公告栏,以求将台湾的风土文化在维基百科里展现出来。其后,来自、中国中部、及澳门的维基人也建立了他们的维基人布告板。截至3月,中文维基百科共有6个地区性维基人布告板。维基读本的第一期封面,由Shizhao任主编中文维基百科从2005年起,由中文维基百科行政员Shizhao主持编写维基读本(第二期称为维基文摘)。维基读本是对维基百科上某种主题文章的精选的一个连续出版物,并且制作成格式出版。维基读本每一个季度出版一期,两期出版后却未沿续。2006年第一届中文维基年会筹备期间,有提议重办维基文摘,但最后并未成事。
另一方面,中文维基百科设有一个名为wikidigest的邮件组。该邮件组由中文维基人snowyowls建立于2005年12月,内容为中文维基百科新条目精选,目前定期向用户发送每日入选中文维基首页你知道吗栏目的条目。
鉴于维基读本已荒废多时,中文维基百科用户信陵使于日,出版全新的《中文维基百科电子杂志》试刊版(简体中文版、繁体中文版)。杂志初步计划每月出版一期,内容除了展示中文维基百科的特色内容,也会有用户专访、社群热门话题及最新统计数据等。然而,截至同年5月,仍没有该杂志的最新消息。中文维基百科设有一个名为互助的地方,用来讨论技术议题、方针和规则、以及中文维基百科的管理维护。这是中文维基人最主要的交流意见的地方。另一方面,面对着雅虎知识+一类知识型网站的流行,中文维基百科于2006年10月设立了一个名为询问处的地方,用来供使用者发问及解答任何与维基百科无关的问题。中文维基百科的参与者来自于世界各地的华文使用者,并非集中于中国大陆。东南亚拥有庞大的华语使用人口,但当地华人人口没有反映在该地区相关文章的书写量上,可能与华人多使用、、或是当地华人已失去华文书写的能力有关。维基人的年龄跨度和一般人印象中“百科全书”的编辑者年龄跨度不同,其中不少活跃的维基人在生活中还是大学生及中学生,甚至有少数小学生的参予。此外,通过条目质量提升计划、访问与编辑总数上显示中文维基百科用户大部分对政治、历史、文化类条目报有较大的热情,因此特色条目、优良条目、新条目推荐中也以该类条目居多。另一个特色现象,就是由于来自香港的维基人很多都关心本地的事物,因此优秀的香港相关条目的比例也不少。
截至2008年7月,中文维基百科有超过24万名注册用户,拥有195,070条条目和超过400万次的编辑。但活跃的维基人所做出的贡献却是占据了整个中文维基百科的大多数。编辑超过1,000次的维基人共有约300多人,而他们的贡献占了中文维基百科编辑总次数的约75%,而编辑超过10,000次的维基人的35人中,已贡献了超过三分之一的编辑总次数。。部分观点认为这是维基百科不易于新人上手或者对版权的要求严格的表现。
一般而言,已经熟悉中文维基百科的用户大多使用互助客栈来进行日常的编辑交流,而专为新人设立了常见问题的集合社区。为了进一步加强维基社区之间各用户的交流,中文维基百科在维基百科人中通过地域、爱好及兴趣、毕业学校、政治倾向……各种不同的分类创立了各个维基人之间的交流板块。通过这个板块维基人可以很快找到自己的同乡、校友、志同道合的其他维基人。维基人可以通过这里寻求各种帮助,或发起当地维基人举行聚会。也可以找到维基的部分指导方针,工作小组与一些怪诞而罕见的条目。2006年底,中文维基百科一共有86个管理员:29个来自中国大陆、16个来自台湾、14个来自香港、9个来自美国、5个来自、3个来自澳门,、、法国、、、日本各一个,2个未鉴别。当前管理员人数为91人。参与聚会的数位来自世界各地的维基人维基百科第一次的聚会──维基百科北京地区网友见面会,于日在举办。此后在、香港、、都有维基人发起聚会,将网上的聚会带到了现实中。聚会的主题主要涉及中文维基百科的当时遇到的问题和一些发展的建议,因此讨论的焦点往往各有侧重。2005年8月,中文维基百科的Wing、阿仁、虎儿等数名用户参加了这一年的维基媒体国际大会,并在会上发表了由Zhengzhu撰写的关于简繁转换的技术性论文“Chinese conversion the wiki way”和主要由Mountain撰写的讲演稿“We-create-pedia in China”等多篇文章,受到了与会者的广泛关注。
2006年4月,台北维基人开始展开每两星期一次的定期聚会,香港维基人于10月仿效。2006年12月,、、、香港及台北五个地区均计划举行冬季聚会,为中文维基百科成立以来同一个月内最多地方举行聚会的月份。
2007年10月,粤港澳三地维基人在澳门举行秋聚,是澳门首次维基人聚会,并开展在澳门成立维基组织的工作。为使各地的中文维基人增加见面的机会,以及向外界推广中文维基百科的应用,中文维基年会因此而被发起。第一届中文维基年会已经在日至27日于香港的中文大学举行。超过一百名参加者参与是次的活动。这个年会更是全球第一个针对个别语系的维基聚会。
由于成功取得2007年8月举行的第三届维基媒体国际大会主办权,因此第二届中文维基年会可能由澳门在2008年或2009年举办。
中文维基人依地区的习惯而有不同的网络交流方式,例如来自台湾的维基人多使用与互相交流,而来自中国大陆的参与者则较多使用进行即时交流。但是随着参与者群体的不断交流和融合,这些不同网络交流方式的利用也并不绝对,比如,现在一些中国大陆的中文维基的网络会议也会使用MSN,以及这样其他地区维基参与者常用的网络通讯软件。下面是一些大纪事:
★ 日,以Wikipedia为主题的讨论看板成立于台湾BBS站,并开始有计划的在BBS上推广维基百科。
★ 日,中国大陆的维基人建立了以维基百科为主题的,其他大陆维基人也先后建立以维基百科为主题的QQ群,其中冷玉的两个群人数最多、讨论最为热烈。QQ群成为中国大陆的维基人的方式之一,接近甚至超越了其他维基百科的IRC频道的地位。
★ 日,香港的香港地BBS建立维基百科版,并与台湾批踢踢BBS维基版建立转信关系,此暂为香港唯一开设维基讨论区的站台。2005年1月,Richy和Vipuser为进一步推动中文维基百科的发展,参考、日文版维基百科创建了目前中文维基百科通用的维基荣誉与奖励,并在不久后设立了以奖励或为主要方式的维基其他奖励,以作为对长期为中文维基百科付出贡献的维基人的肯定。此后新条目推荐制与条目编写竞赛制(该项目已停止)。这几措施在执行中既获得了确实的成效,带动了刚加入维基百科的新人的贡献热情,也走了不少弯路。同年8月,由Ffaarr和Super1发起了针对维基荣誉与奖励具体操作细节的一次讨论,并将之付诸投票通过。2006年2月,香港维基人布告板设立了维基香港创作奖,2007年3月始,ACG专题也设立了维基ACG专题创作奖。此二奖励为中文维基百科且为目前为止唯二独立于维基荣誉与奖励主计划的创作奖项,另外,维基香港创作奖也在2007年4月,再度分成维基香港内容奖与维基香港图像奖,让更多摄影好手可以不经由撰写条目的方式,参与摄影的协同工作。全球使用中文的人数达14亿以上,为世界主要语言之一。然而,中文维基百科的规模与中文的普及率远远不成正比,甚至远不及的1/15。以台湾而言,大多数上网者利用知识性网站时较倾向使用自由问答制的雅虎奇摩知识,甚至直接到条目数量最多的英文维基百科查找资料,而非以中文维基百科为首选。因此如日文以及数种欧洲语文的维基百科,虽然其语言的使用人口远低于中文,但条目数量却远高于中文维基百科。
自从2006年11月中文维基百科条目数突破十万之后,其条目增长出现速度大幅减慢之势。2007年1月整个月,中文维基百科只增加了3180篇条目,平均每日增加只有约103篇而已,比半年前2006年7月整个月的6219篇,少了接近50%。同一时间,排名于中文维基百科之前俄语维基百科的条目数正逐渐抛离。中文维基百科另一为人诟病的地方是其充斥大量未完成作品。据统计中文维基百科每篇条目长度仅为约3,000字节(每个汉字占3字节),比、日语等主要语言短少。当中超过2KB(2,000字节)的条目更只有13%而已,同样比大部份主要语言为少。少于一成条目的长度超过平均长度,意味着中文维基百科只靠极少数内容极详尽的条目和大量列表支撑着条目平均长度的数字。
除了小作品的问题,未完成翻译的条目同样为数甚多。现时有超过3,000条条目尚未完成翻译,即超过条目总数的2.5%。相对于其他语言版本,这个数字是比较严重,最差的情况是,部份条目直接复制其他语言维基百科的条目全文内容,但只有一点内容被翻译(如审查制度等)。中文维基百科于科技、物理、、医学等条目之建构与经营方面,其专业性明显低于英文或,翻译进度亦略嫌过慢。其因为中文维基百科参与者如同前段所提以在学学生为主,而缺乏各领域的在职专业人士及学者教授参与。
中文维基百科中有不少使用者申请帐号仅为撰写介绍自我之自传性质条目,而不作其他贡献。
中文维基百科中、运动选手、等条目多仅以列表方式叙述某名人之三围、所出之专辑、单曲、精选集、工作人员名单、收视率或运动战绩,而未以叙事方式述其生平、个性、事功、歌唱、演戏或运动风格、评价、争议(如)。电视剧条目亦常出现各集大纲一堆,但制作动机、经过、收视率、评价、争议等却流于简略甚至付之阙如之问题(如《》)。条目内容流于数据库此点曾于PTT之Wikipedia板遭部份板友批评。中文维基百科其模板数明显多于其他语言版维基百科,其中有一部份并未使用,或与其他模板重复,或可完全以(category)代替。此点曾于PTT之Wikipedia板遭部份板友批评,甚至有人提出要限定模板数量。另外小作品的分类过细,反而忽视分类的整理。[3-25]
新手上路我有疑问投诉建议参考资料 查看}

我要回帖

更多关于 思密达是什么意思 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信