汉字的unicode编码编码有几种?各有什么用途?

扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
一个汉字对应的编码有哪几种,个有什么作用
zhanshu0106
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
为汉字设计的一种便于输入计算机的代码.由于电子计算机现有的输入键盘与英文打字机键盘完全兼容.因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题.   汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输.编码是关键.不解决这个问题,汉字就不能进入计算机.   汉字进入计算机的三种途径  分别为:   ①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字.   ②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字.   ③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机.   机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决.在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机.   汉字编码的困难点  汉字进入计算机,有许多困难,其原因主要有三点:   ①数量庞大:随着社会的发展,新字不断出现,死字没有淘汰,汉字总数不断增多.一般认为,现在汉字总数已超过6万个(包括简化字).虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多.   ②字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔.   ③存在大量一音多字和一字多音的现象:汉语音节416个,分声调后为1295个(根据《现代汉语词典》统计,轻声39个未计).以1万个汉字计算,每个不带调的音节平均超过24个汉字,每个带调音节平均超过7.7个汉字.有的同音同调字多达66个.一字多音现象也很普遍.   五种类型的编码法  据粗略统计,现有400多种编码方案,其中上机通过试验的和已被采用作为输入方式的也有数十种之多.归纳起来,不外5种类型:   ①整字输入法:前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上.近来,大多是将这些汉字按XY座标排列在一张字表上,通常叫"字表法",或“笔触字表法”.比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入.键盘上或字表中字按部首或按音序或按字义联想而排列.不常用的字作为盘外字或表外字,另行编码处理.   ②字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器.笔画一般分成 8种:横(一)、竖(丨)、撇(丿)、点(丶)、折(?)、弯(乚)、叉(十)、方(口).部件一般归纳出一二百个.由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上.   ③字形为主、字音为辅的编码法:这种编码法与字形分解法的不同在于还要利用某些字音信息.如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母.   ④全拼音输入法:绝大多数是以现行的汉语拼音方案为基础进行设计.关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ──机内软件变换(实为查机器词表)──汉字输出”系统.   ⑤拼音为主、字形为辅的编码法:一般在拼音码前面或后面再添加一些字形码.拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”.如F键既表声母F,又表韵母ang,连击两下,便是Fang“方”字.区分同音字的字形码也多种多样.除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的.   上述各种编码法,各有短长.例如,字表法的特点是一字一格(键),无重码,直观性好,操作简单.缺点是需特制键盘,速度较慢.字形分解法的好处是按形取码,不涉及字音,因而不认识的字(包括生僻字、古字)也同样可以编码输入;但汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一,因而不少方案规则较多.拼音输入法(包括拼音-汉字转换法)的优点是操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理;缺点是不认识的字无法输入;另外,如果不加字形码或不用以词定字法或显式选择法,同音字较难处理.   双轨制编码  汉语拼音推广应用,并逐步过渡到汉字和汉语拼音文字并存并用,这是一种双轨制.汉字信息处理领域中,音码和形码的并存并用,同样是一种双轨制.因此,不少人认为,采用双轨制好,理由有以下5点:   ①对掌握普通话的人来说,使用音码比形码方便,速度比较快.形码虽然较慢,但能输入任何汉字(包括古字).采用双轨,操作员认识的字可按音输入,不认识的字按形输入,会普通话的人可按音输入,方音重的人可按形输入.   ②对于用字量少的单位,按音输入无问题,但对用字量多的单位来说,按音输入就不如按形输入,因为一般人只能念出一部分汉字.   ③按形输入(尤其是整体输入)对于中文信息处理的某类工作,如统计汉字,非常适合;但是对于其他类工作,例如统计汉语的音(声韵调)则无能为力.按音输入则正相反.双轨正好是相辅相成.   ④有的形码可以照顾多种汉字(如日本的汉字、南朝鲜的汉字),而音码能分词连写,便于作进一步的信息处理.   ⑤适当的双轨方案,不会增加设备上的麻烦.如不考虑采用整字输入,一般均可使用现有的小键盘.   汉字编码研究的新发展  除了单轨向双轨发展之外,还有下列趋势:   ①混合式编码法.笔触字表示法中除整体字之外,增加一些部件或字元,可以解决盘外字问题,甚至能具有字形分解法的全部优点.而笔画方案为了提高速度,一般也增加一些部件或整字.   ②充分利用简码和词汇码.这样可以提高输入速度.因而人们为少量出现频率高的字或词设计了单字母和双字母的简码.   词汇码也是提高速度的手段.有一种形码方案的词汇码是根据每个字的部件规定的,如“汉字编码”的词汇码是43、45、55、13(氵冖纟石).另一种形码方案的词汇码是利用计算机引导方式输入的.例如,当“中”字输入后,一按语词键,屏幕上便显示出“中国”、“中型”、“中性”、“中华”等双音词;选择“中国”后,如再按一下语词键,便可显示出“(中国)话”、“(中国)人民”、“(中国)共产党、”、“(中国)工农红军”等词或词组.音码方案的词汇码实际上为词组码,如 ZRG“中华人民共和国”,ZZXY“中国中文信息研究会”.词汇码不仅能提高速度,而且也能区别同码.但是,如果用得太多,也会产生重码.因此,有必要划分通用词汇码和专业词汇码,以减少重码.   ③充分发挥“电脑”的作用,尽量减少“人脑”的负担.上述计算机引导输入法就是一例.还有的方案不断以开窗口方式向操作员提供选择的范围.这样,操作员不必再记忆大量的编码规则.   编码工作中的定型化和标准化  编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要.当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要.关于选优,曾提出多种评定标准,一般包括字码无二义性、操作方便易学、输入和处理效率高、存储节省、传输可靠、设备经济实用、组词能力强.   编码方案繁多,需要有一个统一的标准.1981年,国家标准局公布了《信息交换用汉字编码字符集基本集》(简称汉字标准交换码),共分两级,一级3755个字,二级3008个字,共6763个字.这种汉字标准交换码是计算机的内部码,可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性,从而使信息资源的共享得以保证.目前,正在制定《信息交换用汉字编码字符集辅助集》,以满足少数用字量超过基本集的用户和台湾、香港等地的需要.
为您推荐:
其他类似问题
扫描下载二维码2012年2月 挨踢职涯大版内专家分月排行榜第三2011年11月 挨踢职涯大版内专家分月排行榜第三2011年10月 挨踢职涯大版内专家分月排行榜第三
2013年 总版技术专家分年内排行榜第一
2014年 总版技术专家分年内排行榜第三
2013年 总版技术专家分年内排行榜第一
2014年 总版技术专家分年内排行榜第三
本帖子已过去太久远了,不再提供回复功能。谁知道百度对中文用的是什么编码方式?【javascript吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:147,204贴子:
谁知道百度对中文用的是什么编码方式?收藏
比如“百度”两个字 显示的是 %B0%D9%B6%C8 。。
网易云课堂 零基础,零代码,一站式掌握必知必会全部技能!一线资深前端开发团队,打造前端系统化课程,助你开启新的职业生涯!
url编码,是gbk的,如果是utf-8的应该有6个
怎么获取到?
你发的这个好像是浏览器把中文转的,不是url编码的结果,这个应该是按字节来的吧,%B0%D9%B6%C8 %后边都是16进制,也就是说每一个是一个字节,gbk编码的是2个字节表示一个字符,也就是说%B0%D9表示百的2个字节,就是这样的应该,获取一个字符的int值,取后2个字节就是了
忘了这是js吧了,js有方法转码的
啥方法? encodeURI ?
encodeURIComponent 百度搜索的时候好像没转码吧
这个我之前试过了 得到的是 %E7%99%BE%E5%BA%A6
你用百度搜索下市区的名字就有转了
不转码的人无压力
我只想抠点度娘的信息
问我就好了吗,但是我是不会告诉你太多的,因为我也知道的不多
此娘非彼娘...
上传参数有日期/的时候必须转下,要不就坑爹了
登录百度帐号推荐应用> 问题详情
汉字国标码规定的汉字编码每个汉字用______个字节表示。A.1B.2C.3D.4
悬赏:0&答案豆
提问人:匿名网友
发布时间:
汉字国标码规定的汉字编码每个汉字用______个字节表示。A.1B.2C.3D.4
为您推荐的考试题库
您可能感兴趣的试题
1下列编码中,属于正确的汉字机内码的是______。A.5EF6HB.FB67HC.A3B3HD.C97DH2一个汉字的机内码与国标码之间的差别是______。A.前者各字节的最高位二进制值各为1,而后者为0B.前者各字节的最高二进制值各为0,而后者为1C.前者各字节的最高位二进制值各为1、0,而后者为0、1D.前者各字节的最高位二进制值各为0、1,而后者为1、0
我有更好的答案
请先输入下方的验证码查看最佳答案
图形验证:
验证码提交中……
找答案会员
享三项特权
找答案会员
享三项特权
找答案会员
享三项特权
选择支付方式:
支付宝付款
郑重提醒:支付后,系统自动为您完成注册
请使用微信扫码支付(元)
支付后,系统自动为您完成注册
遇到问题请联系在线客服QQ:
请您不要关闭此页面,支付完成后点击支付完成按钮
遇到问题请联系在线客服QQ:
恭喜您!升级VIP会员成功
常用邮箱:
用于找回密码
确认密码:}

我要回帖

更多关于 汉字的编码 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信