倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
如何做到"一字一码"? - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 40666|回復: 10

如何做到"一字一码"?

[複製鏈接]
發表於 16-6-2004 13:13:40 | 顯示全部樓層 |閱讀模式
转贴:
"
   http://www.cbflabs.com/gstbook/allmsg.php3?start=15
  一字一碼者,根據取碼規則,重複字前加X。英文鍵有26,倉頡只用24,X是為了定義重複字用,Z則供片語或個人慣用詞之擴充碼。只惜一些系統工程師不懂,胡作非為,尤以「微軟」的洋工程師,重複字要「選擇」,而且在中文態的英符竟是半形!
  倉五可支持六萬多字,但坊間無六萬字庫也。人文系統有「組合字千萬」(有效字近十萬,將公佈於文傳寶典中),只要倉頡碼拼得出,就有字形,故「輸入碼=內碼」。老朽不願介入狗咬遊戲,明知未來倉頡為主流,自己努力就是,不爭也!

"
关于重复字前加X,这种方法有没有规律可以遵循.
比如说在简体仓颉5中打入SK键出现两个字 " 区, 尹 "
如果要打"尹"字,
   1.打完SK二键后选择数字键2.
   2.打完XSK三键出现"尹"字.
"区 尹"二字是通过什么样的规定来排列的.

闭上眼睛,双手放在键盘上,我想把"尹"字打出来,当把SK打出来后,如何却定"尹"字是排在哪一位了.

因为现在用的是一台CRT显示器,时间长了眼睛痛的厉害,所以才问这个问题.

谢谢大家!
發表於 21-6-2004 21:57:29 | 顯示全部樓層
我不明白“X”和“Z”的用键道理。它们是作为疏散重码用的,打完三码或四码后才会知道是不是重码,“X”应该加在单字编码后面,“Z”加在词语编码后面才对。如果是加在编码前面,若不是背住重码字、词,怎么打得出?
發表於 21-6-2004 22:06:13 | 顯示全部樓層
输入SK,只看到“区”,没有“尹”。你确认“尹”的编码就是“SK”,于是输入“XSK”,输出“尹”。在入门阶段就苦了,因为未必能确认谁与谁是重码。
 樓主| 發表於 22-6-2004 21:21:47 | 顯示全部樓層
对不起,我忘了说明我用的是简体版的仓颉输入法,在本版中,输入SK,却实出现"区"和"尹".

我不明白的是"区"和"尹"的排列规律,为什么"区"字在前,"尹"在后.为什么不能反过来了,两字的排列是不是有什么规律.

谢谢大家的帮助.
發表於 23-6-2004 09:15:19 | 顯示全部樓層

倉頡編碼的「X」重碼字(一)

在倉頡取碼中,「X」有兩個很巧妙的安排。一個是當作「難字」來用。另一個是排在字碼前頭當「重碼字」使用。

這裏所提的是當「重碼字」用的「X」。

兩個或者兩個以上不同字形的漢字,而都擁有相同的倉頡編碼,稱之為重碼字或重複字。相同的重碼字收集在一起,按照使用頻率來排列先後「字序」,最常用的字在前,是為「本字」依照一般倉頡規則取全碼,較不常用的漢字依序排在後面,是為「重碼字」。第五代倉頡取碼有關重碼字的規定是,第一個重碼字前面加一個「X」,第二個重碼字前面加兩個「XX」,第三個重碼字前面加三個「XXX」。加「X」後如果總碼數超過五碼,把後面超過的字碼去除,在任何情况下,最多只保持五碼。

要注意的是第四個重碼字的編碼略為不同,不過這方面的字並不多。詳情可參考朱邦復先生的第五代倉頡輸入法手册第92頁。

重碼字「X」的安排,在目前港台最通用的第三代倉頡是採用選字方式,把全部重碼字排在一起,同時出現,任用戶選擇一個,目前反應看來一般倉頡用戶都比較喜歡用這個方法。五倉也有選字的安排,阿勤兄的各種五倉輸入法都有提供選字功能的倉頡全碼安排。

在處理重碼字「X」時,有兩個很有趣的問題。第一個是「字序」,即那一個字先,那一個字後。第二個是「X的前後」,即X要加在碼前或碼後。

雖然規定「字序」的排列是多用的排前,少用的排後。但實際排列時問題很多,多用或少用是根據那個地區的標準,是港台,中國內地,東南亞或歐美?而早期倉頡編碼都分開來編,繁体字有BIG-5繁体倉頡碼,簡体字有GB簡体倉頡碼。BIG5有BIG5的「X」,GB有GB的「X」。今天大家都在用比較大的字庫像GBK,GB18030,UNICODE,這些都是簡繁同台,包括了BIG5和GB在內,但是「X」碼在這裏似乎還沒有合理的統一字序,比方說當簡体和繁体都同碼時,是簡先?或是繁先?常用的標準是根據每人用字的次數?或使用人數多少而定?如果是每個人本身使用次數,則可能是繁先簡後。若是按使用人數多少而定(人數多當然用次也多)則很可能簡体排先。這個問題,目前的簡繁倉頡碼好像沒有很合理的解决,看來也不易處理。
發表於 23-6-2004 09:16:11 | 顯示全部樓層

倉頡編碼的「X」重碼字(二)

第二個問題是「X」在前或在後。目前的規定是「X」在前。按照一般常理,我們是不太可能先知道那一個字要用「X」,而那一個字不必用「X」。通常是見字能拆碼,打出全碼後才會知道有無重碼字,若有重碼字再决定要用那一個。若要預先知道那個字是重碼字,大概只有「死背死記」了。

看看這些數字,在GB簡体字庫6763字中,用「X」的重碼字大約有240個;BIG5繁体字庫13053字中,用「X」的約有520個。朱邦復先生五倉手册所附的碼表有950個要用「X」重碼字。這裏的數目字都是大略粗算,只做參考比較用。注意的一點是這些「X」重碼字都是簡体字和繁体字分開編碼,分開計算(若合在一起會更高),目前很難找到一個簡繁合併而合理的列表,但大略估計在這三萬字左右的字庫中,要用「X」重碼字的漢字少說有1000多個以上,約為總字數的百分之三左右。

問題出在,除了少數很專業的打字員,有多少用户能熟練運用這1000多個「X」重碼字,或者說死記死背這1000多個字?而當字庫數目增大到五萬字或十萬字時,重碼字肯定會更多,記憶會更困難。

如果「X」重碼字排在前面,估計可能會遇到上述這些問題。

因此,在處理「X」重碼字排前時,必須有更令人信服和合理的理由以及方法,才能使大多數的倉頡用戶樂於接受和採用,也方便倉頡的推廣。

不過還好的是,我們若只關注GB字庫中的3755個一級漢字,或者BIG5字庫中的5401個常用字,則「X」重碼字不會産生太大問題,因為在這些常用字庫中,倉頡編碼要用到重碼字的機會是非常非常的少。即使有,也不過是幾個,記一記熟習一下就能巧用了。

「X」重碼字排前的安排,主要是要做到能快速盲打和快速輸入漢字,這一字一碼的安排確實是用心良苦,也非常巧妙。

由於漢字幾乎不太可能沒有重碼字,如果我們不容易接受「X」重碼字排前的安排,那只好把它排後了。「X」排後很容易被倉頡用戶理解和接受,這和用數目123來選字是相似的,用戶也不必去死背字序,也不必爭論誰的字排先誰的字排後,有時還可以用電腦按照自己使用習慣自動排列。

以上淺見,僅供參考並請指正。
發表於 23-6-2004 12:23:29 | 顯示全部樓層

倉頡編碼的「X」重碼字(三)

再看看一些字例:

1.鵁:原碼是(YKHAF);用X後 (YKHAF)。
2.鷟:原碼是(YKHAF);用X後 (XYKHA)。
3.鳼:原碼是(YKHAF);用X後 (XXYKH)。
4.鴍:原碼是(YKHAF);用X後 (XXXYK)。
5.鸆:原碼是(YKHAF);用X後 (XXXYA)。
6.鵺:原碼是(YKHAF);用X後 (XXXYB)。

這六個漢字的倉頡碼都是(YKHAF),經過字序排列後,可得出前面附有(X)重碼字的倉頡碼。

第一字到第四字都可以理解,前面加一個(X),後面就切除一個碼,使全碼仍保持為五碼。

第五字和第六字就要重新再排字序了。
第五字不取(XXXXY),第六字不取(XXXXX)。

第五字和第六字前面只取到三個(X),即(XXX)。第四碼是原字的首碼(Y),最後一碼,是把這兩個重碼字再重新按字序來排,最先的取(A),其次是(B),(C),(D)。。。等等。

因此,第五字是取(XXXYA)。第六字取(XXXYB)。

再假設:如果還有兩個新發現的罕用字也是(YKHAF),分別排在第七位和第八位。那麽,第七字是(XXXYC)。第八字是(XXXYD)。

最後,我們會發現,前面幾個重碼字還能看得出是原字的倉頡碼。到了第五,第六,第七和第八字時,幾乎看不到原來倉頡碼的影子。而最後的這幾個重碼字己經不是一般普通的人腦能夠快速處理和反應的。

不過,這些五或六個同碼字以上的情况不多,許多字可能一生都用不上,因此在日常生活中也不必去格外操心。

但從這些重碼字字例或許能看出,為什麽一般用户都喜歡用123來選字。

謝謝指正。
發表於 25-6-2004 08:08:06 | 顯示全部樓層

倉頡編碼的「X」重碼字(四)

重碼字「X」加在倉頡碼前難度較高,因此「五倉手册」另有一個簡易的方法。這是前文所提的「X」加在倉頡碼後的簡單方便方法。用户只要見字拆碼然後依照一般規則輸入全部倉頡碼即可。詳情可參考朱先生的「五倉手册」第112頁。

當遇有重碼字時,「X」加後的做法是:
1.若用户要的是第一個本字,可直接按鍵輸入。。(後面沒有X)
2.若用户要的是第二個重碼字,要按(X)。。。(後面一個X)
3.若用户要的是第三個重碼字,再按(X)。。。(後面二個X)
4.若用户要的是第四個重碼字,再按(X)。。。(後面三個X)
5.若用户要的是第五個重碼字,再按(X)。。。(後面四個X)

這裏提的是大略的原則,主要是說明「X」加在後的方法,其他細節如按「X」後要按空格或電腦在有重碼字時會發出响聲提醒用戶或者那些系統能採用等等不再詳訴,可參考五倉手册。

有注意到「X」加在後的特點是:

1.所有漢字輸入都用完整倉頡碼,重碼字不必考慮「加前割後」。
2.不必强記「X」重碼字的編碼,一切順其自然。
3.只用文字鍵,不用數字鍵。


若再仔細看看,會發現很有趣的一點:

即現在通用的123選字輸入,所有漢字皆輸入倉頡全碼,遇有重碼字時,碼前或碼後不必加「X」,所有同碼漢字一併列出,用戶則用123數字鍵來選取一個。這個通用的方法和上述的方法看來還很相似,不同的是,遇有重碼字時不用「X」,而用數字123來選字。

因此,倉頡輸入法己經把各種可能遇到的重碼字難題盡量考慮在內,也有提供了應對的多種方法,使用戶在採用時更稱心如意,這是多麽巧妙的安排。

阿勤兄目前的各種五倉輸入法,都有照顧到重碼字X加前,以及全部同碼字都列出再用123選字的方法,這對普及倉頡和推廣倉頡是一個很妥善和適當的安排。

以上乃個人粗淺的理解,錯誤在所難免,尚祈多加指正。謝謝。
發表於 27-6-2004 20:29:02 | 顯示全部樓層
个人看法:

如果是作为打字用,仍保持“123”择字较好。

如果是作为信息交换用,“X”、“Z”加在码后较好。因为交换过程不能有人工干预,必然保持一字一码,一词一码。一般人并不理会怎么加,与他没有一点关系。加在码前似乎也可以,便于设计人员查阅,保证“一字一码”就可以。
發表於 28-6-2004 17:45:57 | 顯示全部樓層
的確,我個人也有同感,倉頡重碼字安排方面,目前通用的「123選字」輸入方法算是很合理。當然,我們一直都期望有更好的方法面世。

要做到有效的「123選字」,必須確保有關的倉頡碼表,各種倉頡輸入法,倉頡字典等都有提供重碼字的「完整倉頡碼」,不能只列出「X倉頡重碼」而己,用户在面對重碼字時才能用「完整倉頡碼」輸入漢字並適當選字。

所幸在這方面,阿勤兄目前在網頁公佈的倉頡輸入法和倉頡字典,重碼字方面都己能輸入完整倉頡碼並自行選字,對一般倉頡用户幫助很大。

這些,只是我個人的看法。
發表於 18-9-2004 20:19:19 | 顯示全部樓層
如果输入法能有选项.能选择输出繁体或简体用户.繁简体重码的字对应输出.
这样不好吗?
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 22-12-2024 10:56 PM , Processed in 0.013624 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版