倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
我想請問一下:倉頡是否可改用4碼而不是5碼 - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 11173|回復: 5

我想請問一下:倉頡是否可改用4碼而不是5碼

[複製鏈接]
發表於 30-11-2019 12:17:24 | 顯示全部樓層 |閱讀模式
本人從90年代前後開始學倉頡,比較其他大易,行列之类的可以取4碼而不是5碼,請問是否可以設定4碼來簡化輸入呢?
發表於 5-12-2019 03:58:13 | 顯示全部樓層
本帖最後由 Ichirou 於 5-12-2019 04:09 AM 編輯

其實爲甚麼用五碼,朱邦復先生在《倉頡輸入法手冊》裏說得很清楚的:

根據說文解字,中文源自象形、指事、轉注、假借、會意、形聲六書。後人百分之九十的文字,皆依據形聲所造,是以,本輸入法即以「形聲」為取碼及組字之基本法則。將所選取的文字一一整理,共計分析出594個字首,9897個字身。

前述之字首及字身,實為原始之象形及指事等字形,是故這些字首及字身可以分別取碼,以代表原字,亦可按中文字形組合之規則,以字首及字身結合之。

因限於26鍵,其中保留了一鍵供特殊用途,餘25鍵,594個字首,每一字首若取一至二碼,可得到650種排列組合;字身9897個,每個取一至三碼,可得一萬餘,顯然可涵蓋所有之字首及字身。因此,以字首碼加字身碼,即每字取一至五碼,適為全部收集字之最小公倍數。


簡單來說,漢字主要是合體字,特別是形聲字,佔了大多數。它們都是由「字首+字身」(即是「左邊+右邊」、「上邊+下邊」或「外邊+內邊」)組成。朱邦復先生訂出倉頡輸入法前就統計過,漢字(包括古籍和專門書藉使用的)有594個字首,9897個字身。

在只用26鍵作輸入碼的限制下,如果只用四碼,我們有方法讓594個字首、9897個字身都好好安置嗎?

樓主說到大易、行列之類的其他輸入法,正正就是沒有像倉頡般,在設計前已作出這麼好的規劃。所以,它們都沒有依漢字的特點來設計,連字首、字身的概念都沒有,只是以「頭三碼,尾一碼」的方式去取碼,令取碼過程頭重腳輕。它們的重碼都比倉頡多。

當然,倉頡是世界上最早開源的輸入法(當其時連「開源」這個稱呼都還未有),誰都可以自行修改。「大新倉頡」正是一例,它把倉頡的組合字(分體字)改成四碼:字首取其首尾兩碼,字身也取其首尾兩碼。而本來倉頡的整體字(連體字)則改成「首、次、尾」三碼。犧牲了的是重碼率。以常用字來計,本來倉頡很大部份的字都沒有重碼,少部份是二字重碼,三字重碼的少之又少。大新倉頡則是一般字也會有三、四字重碼,即是說重碼結果跟大易、行列類似。

要是樓主喜歡這樣,不妨試試大新倉頡。然而,取捨之下,我寧可多打一碼而不用選字,享受盲打的樂趣。
發表於 5-12-2019 04:15:08 | 顯示全部樓層
本帖最後由 Ichirou 於 5-12-2019 04:54 AM 編輯

剛好尹卂兄在他的論壇上也說到:

其實當年朱老發明倉頡的邏輯並不複雜,他就是知道當今大多數漢字(百分之七十以上)都是形聲字,那麼(假定)以左為『形』以右為『聲』,『形』取首尾二碼,『聲』取首次尾三碼。其他非形聲字也能套到這種模式,因為形聲字最為複雜,它相當於兩個象形字的組合,所以能䖏理形聲字,也就能䖏理一切漢字。

那麼朱老通過橫豎二軸,均佈了各種常用的『形』旁和『聲』旁。『形』旁方面,比如「耳」分在縱軸為S、横軸為J的格子中;「馬」分在縱S橫F的格子中。若『聲』旁取三碼,則將橫軸擴大為24*24個格子,576格。就這樣將所有可能取到的聲旁都置入這些格子中。

朱老就是用這種方法,在科技不發達的時代,首先(也是至今為止惟一一位)用限長五碼的不定長編碼,實現了對康熙字典四萬字幾近無重的編碼。


同時,尹卂兄也指出,倉頡只是最長五碼,但日常打字時,往往只用四碼或以下。詳見他的帖子:
http://ejsoon.win/pb3/viewtopic.php?f=3&t=955&sid=9db6370afc4dd001a0ae2dd88c15bf55

並附上一段他新寫的總結

倉頡還有一個很大的優勢就是全碼不定長,限長五碼。所以用倉頡可以闗掉逐漸提示,只有全碼匹配才將該字顯示出來。

我猜一開始很多人知道倉頡打一個字最長五碼的時候,就直接否定了倉頡。但如果他們知道很多字的全碼只有二碼或三碼的時候,估計就不會再去考慮其他的形碼了。

為甚麼強調全碼呢,為甚麼一般的倉頡用戶都不考慮簡碼或打詞,甚至要闗掉逐漸提示功能呢。因為形碼打字的最大優勢,甚至我們說唯一優勢,那就是能準確輸入一個漢字。而全碼對於一個漢字而言就是準確對應的唯一編碼。因為做到了準確和唯一,就將思考和出錯降至最低。

這就是很多其他的形碼用戶寧願每個字都打全碼也不願打簡碼的原因,還有的形碼某些字是三碼的還要再加一個無義符補足四碼。而只打全碼,不打簡碼,也不開逐漸提示,那麼幾乎所有形碼都不是倉頡的對手,因為倉頡就是這樣最好用。

鄭碼的全碼基本是定長四碼,倉頡的全碼平均碼長大概是3.2左右。也就是說倉頡不設簡碼,達到了其他形碼設簡碼都達不到的成果。
 樓主| 發表於 6-12-2019 19:43:21 | 顯示全部樓層
哦,明白了,谢谢提供资讯。其实我之前在用小鹤双拼,打论文的时候都很少出现重码。不是说不喜欢,因为想起拼音的全拼也长达5或6码,所以产生了简化的念头。最近在学仓颉也因为拼音的限制,打名单里名字的话很难找到我要的名字。以上5码的理论,我不反对。但如果加入词组的观念的话,我想应该也能盲打吧?我也试试看寻找大新仓颉,用过之后回头再来评论。
發表於 7-12-2019 03:51:33 | 顯示全部樓層
嗯,網上也有詞組倉頡的碼表。
加油啊,有甚麼歡迎來討論^^
 樓主| 發表於 26-8-2020 11:50:08 | 顯示全部樓層
本帖最後由 蓼汀花溆 於 20-5-2021 03:44 PM 編輯

大新倉頡是三代倉頡,而我正在用五代,所以我只是參考參考就好。詞組倉頡的碼表暫時沒找到,小狼毫的詞組不夠多,歡迎各位介紹有關碼表。
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 22-12-2024 01:19 PM , Processed in 0.020123 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版