倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
转《再谈 GB18030-2000 字符集与输入法》 - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 15854|回復: 2

转《再谈 GB18030-2000 字符集与输入法》

[複製鏈接]
發表於 7-11-2003 13:02:58 | 顯示全部樓層 |閱讀模式
这是本人发在“五笔爱好者”网上的帖子,因文中提到仓颉输入法,故而再转一次。以下是原帖内容:

再谈 GB 18030 - 2000 字符集与输入法
  本人曾于2003-11-01在“五笔爱好者”网上提出,望尽快推出支持 GB 18030 - 2000 字符集的输入法一帖,现再作一补充陈述。
  一、现 Windows 2000 / XP 下的 Office 2000 / XP(2002) 、国产软件 WPS 2000 / 2002 以及蒙泰排版软件(V5.0)均支持GB 18030 - 2000 字符集(以下简称18030)。但目前北大方正的书版和飞腾、华光的书林和超捷等软件,均尚不支持 18030 中的四字节编码部分(有六千多汉字。原 GB2312 -80 和 GBK 是双字节编码)。
  二、18030字符集是国家的一项强制性标准(请注意是强制性)。据本人所知,五笔输入法发明人王永明推出的 WB18030L 、陈虎的智能陈桥V5.4、仓颉国际版,还有郑码均已支持18030字符集。
  三、字符集收字的多少与词库的大小是两个不同的概念。一般人GB2312 的六千字多了已够用,而有些用户对两万一千字 GBK 还嫌少,因而国家颁布18030,收字量增至二万七千多。微软OfficeXP中所带的方正超大字库近六万字,更有甚者北京中易公司名为“zyksun”的四字节字库数量已超过微软超大字符集(但用此字库需有该公司的专用加密狗,用“四字节郑码输入法5.0”可很方便的使用――本人实际使用过)。上述两款超大字库均采用 Unicode 方式编码。
  四、汉字字符集虽逐步增大,但这些后增字的使用上频度肯定不是很高。如何针对对 2312、GBK 和 18030 这几个字符集不同的使用频度,采取不同的编码方案是输入法设计者应该考虑的问题。将27000多字归在一起编码不是好方法,高频字、次高频字……至罕用字混在一起,重码增大,输入速度不快,用起来很累。本人认为,分档编码是较好的方法,为 GB2312为一档,GBK为一档(事实上“五笔加加”已这样实施了,本人经实际使用感觉很好),而 18030 的六千多字使用频度不高,应单独编码,并且不用词组(实际上这些字组词也很少),届时需此档字符者切换即可,且对2312 、GBK无任何影响,更何况Win9X/Me和不少软件不支持这六千多个四字节汉字。
   上述之建议对任一输入法均可实施。鉴于五笔有86/98两版本,可对的这六千多字使用86/98混合编码,这样一个字符集两类用户均可使用,可能略增重码,但无大碍。
  (附:本人曾用Windows XP下的“输入法生成器”18030中部分汉字进行了试编,可正常显示,打印。)
發表於 7-11-2003 21:26:36 | 顯示全部樓層
  什么字符集才有下图中的字符?
  
Untitled.gif
發表於 12-11-2003 20:34:00 | 顯示全部樓層
今日在一花名册上见一人名用字,用我的“谁的超集”也打不出,便造一个如下:
Untitled.gif
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 23-4-2024 03:00 PM , Processed in 0.012569 second(s), 11 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版