倉頡輸入法流程總結
本帖最後由 鍾靈 於 3-8-2011 12:10 AM 編輯倉頡輸入法流程總結
手冊上的取碼流程其實是指切分字首字身的程序,就是下方 一、(通則),至於其他的規則則述諸文字,沒有像其他輸入法,如五筆,把它們編輯整理在一頁內,方便參閱。請把下文標示起來,貼入《筆記本》存檔即可。
1. 首身字形或字碼分隔符: 字首_字身;字首_次字首_次字身
2. 字形構式括弧:{上下疊} [左右列] (外內包) 不表構式字形組合:<字形> "強調字形"
+ = 兩字形相連處 - = 自-號前字形刪除-號後字形
3. 省略表示符: x = (尾碼)包含省略(一或多個字形) ~ = (首身中間)部份省略一字形 ~ = (首身中間)部份省略多個字形
4. 取碼=,不用括弧,碼用中文字母,酌用鍵位羅馬字母。 X = 錯誤取碼(碼用中文字母,酌用鍵位羅馬字母)或錯誤取用字形
依三代手冊方式約化整個倉頡輸入法為三大規則(通則=取碼方法、原則=取碼規則、附則=例外字):
(不採五代手冊的濃縮說法,因嫌不夠清楚。)
一、(通則)各個區塊取碼個數規定(共有20種組合,但祇需記得二刀貫切法即可)
┌▲第一刀切 ┌◆第二刀切
(外上左)
┌字首(≦2碼) ┌次字首1碼+次字身≦2碼
│ 首尾、首 │ 首 首尾、尾
┌1.分體字(≦5碼)┤ ┌分體字身(≦3碼)┤
字┤ └字身(≦3碼┤ └次字首2碼+次字身1碼
└2.連體字(≦4碼) └連體字身(≦3碼) 首尾 尾
首次三尾 首次尾
口訣:
連體一字一區塊,連體字碼不過4,首次三尾是4碼。分體一字多區塊,區塊首身次首身,左上首起右下尾。
分體字首2身3,分身再切次首身,次首1首次身2、次首2次身1尾;連身不切最多3,3碼便是首次尾。
改流程圖為表格: (▲是第一刀切,◆是第二刀切)
┌────────────────────────────────────────────┐
│ 字 │
├─────────────────────────────────┬──────────┤
│ 分體字/組合字≦5碼 │連體字/整體字≦4碼│
├─────▲───────────────────────────┼──────────┤
│字首≦2碼│ 字身≦3碼 │ 首、次、三、尾 │
├─────┼─────────────────┬─────────┤ 首、次、尾 │
│ 首、尾 │ 分體字身≦3碼 │ 連體字身≦3碼 │ 首、尾 │
│ 首 ├─────────◆───────┼─────────┤ 首 │
│ │ │ 首、次、尾 │ │
│ │次字首2碼=首、尾;次字身=尾 │ 首、尾 │ │
│ │次字首1碼=首 ;次字身=首、尾│ │ │
│ │次字首1碼=首 ;次字身=首 │ 首 │ │
└─────┴─────────────────┴─────────┴──────────┘
(本網頁看來表格線條都不整齊。本帖是在筆記本上打字再貼上來的,表格完全是對齊的。各位可把本帖文字標示後,貼到筆記本新開的檔上,就可見到整齊的表格。)
二、區塊切分取碼流程: (左上角起, 右下角終)
中文字
│
↓
切-(通則):區塊定義=字形群組區域:明顯跟別的群組分離獨立、有外廓圍起來的、依原則視作連起來的
分離:跟別的群組分離獨立:碼=石馬;語=言五口;體=骨曲豆;字=宀子;連=辶車;.....
外廓:有包圍四三二面共九大類:囗、冂、凵、匚、コ、厂、𠃍、𠃊、𠃎。
形勢(筆劃相連原則):1. 單純之丨和ノ筆畫與其上的字形相連:焉步賓亟卑
┌→區 2. 儿、ハ,丷、ㄦ 視為與上相連:見兀臖舉頁商酉
│ 3. 丶附屬於整個字形, 視為其一部份:寸永兔甫犬
│ 4. 卜、フ,ノ、𠂊、ㅛ,䒑與下相連:𣖴甬自兔業
│ 塊-(附則:例外字):(等同一區塊)
│ │ 複合字=(三代十個:門=日弓 目=月山 鬼=竹戈(三代) 几=竹弓 鬥=中弓
│ │ 阝=弓中 隹=人土 虍=卜心 {畿-田}=女戈 吂=卜口)
│ │ (五代七個:門=日弓 (不列) (取消) (不列) 鬥=中弓
│ │ 阝=弓中 隹=人土 虍=卜心 {畿-田}=女戈 {贏-貝}=卜弓)
│ │ (五代複合字首:麻=戈金 麻=戈木 厭=一大 辰=一女
│ │ 气=人弓 合=人口 羽=尸一 薛=廿十)
│ │ 難字 =十二個:身=竹難竹 慶=戈難水 廌=戈難火 鹿=戈難心 𠂔=中難竹 𣶒=中難中
│ │ 龜=弓難山 黽=口難山 兼=廿難金 臼=竹難 肅=中難 齊=卜難
│ │ 特殊字=(三代)木、大、火;(五代)木、大、火、戈、七。特殊字形毋需分割, 先取支架:
│ │ (先取特殊字形後, 剩餘字形仍要合乎完整原則(故不受字形特徵原則所控,取過仍可再取。)
│ │ 如: 柬中間⺌的丨仍要取,得⺌取火,不是變成丷取金。)
│ │ 東→木"田" 夷→大"弓" 卷→火"手"尸山 戋→戈"十" 长→七"人"
下 │
一 取-字母表
區 字-(原則)精簡:多種解碼, 取碼數最少者:王→一土 X<一十一>
塊 形 羊→{䒑キ}=廿手 X<丷一キ> X<金一手>
│ │ 完整:多種解碼而碼數同, 先取繁複字形。(五代合併「精簡、完整、字形特徵」在「完整」之下)
│ │ 夫→{キ乀}=手人 X<十大> 堇→{廿中キ一}=廿中手一 X<廿中十土>
│ │ 字形特徵:保留原字形特徵 1. 避免取碼重疊(取過不再取;但特殊字、封閉字形「囗日」例外)
│ │ 也→[七カ]=心木 X<卄𠃌乚> 者→{十𠂇日}=十大日 X<土ノ日>
│ │ 1-1.囗、日等封閉字形, 有其他字形貫穿其間時, 必須切割, 保持封閉字形特徵:
│ │ 曱→{囗一丨丨}=田一中中 X<囗一丨> 甴→{丨囗丨一}=中田中一 X<丨囗一>
│ │ 註:冉→土月(冂不是封閉字形,故土上端可跨越冂上部。)
│ │ 2. 避免在轉角處分割
│ │ 力→[𠂇𠃌]=大尸 X<𠂇亅> 之→{丶フㄟ}=戈弓人 X<亠ノㄟ>
│ │ 省略:1. 部份省略:依(通則)取碼個數規定,區塊字形數>2,省略~~中間字形不取,祇取首尾
│ │ 鬱={[木缶木]冖[鬯彡]}=木~木_冖_凵~ノ=木木_月_山竹
│ │ (字首~、次字身~部份省略)
│ │ 2. 包含省略:字首、字身、次字首或次字身在取尾碼時,其尾碼字形完全被三面或四面包
│ │ 含著,優先省略x包含在內字形, 只取外形作尾碼。
│ │ 三代:囗、(母-÷)、冂、凵、匚、几、𠂊、乃、土、工、王。
│ │ 靈=雨_𠱠_巫=一~冂x_口~口_工x=一月_口口_一
│ │ (省<雨>內<丶𠁼>、<工>內<人人>)(三代)
│ │ 五代:囗、(母-÷)、(瓦-丶)、(匃-人)、冂、凵、匚、コ、廿、几、𠂊、乃
│ │ (五代取消三代:土工王) 靈=一~冂x_口~口_~人=一月_口口_人
│ │ 1)字首包含省略:獻=鬳_犬=卜~冂x(省𢆉)__丶大=卜月_戈大
│ │ 粵={粵-丂}_丂=ノ囗x(省采)__一𠃊𠃌=竹田_一女尸
│ │ 2)字身包含省略:璃=王_离=一土_亠凵x_~冂x=一土__卜山_月
│ │ (次字首 省乂、次字身 省厶)
│ │ 海=氵_每=氵_?_(𠃊𠃌)亠x=水__人_田卜
│ │ (次字身 省丶)
│ 得-(通則)區塊取碼個數:如上
└←碼-(附則:例外字):特殊字=如上
│ 重複字=(軟體有顯示同碼字選字窗,本則等同虚設)
│ 取碼相同者, 以使用頻率較高、或能自動組合者作本字;
│ 本字外作重複字, 首碼加引碼 重(X), 全字取碼超過5碼, 則尾碼省略。
│ 晚 → 日弓日山;冕 → 重日弓日山 日 → 日;曰 → 重日
↓
全字得碼 本帖最後由 鍾靈 於 7-10-2010 09:31 AM 編輯
解釋
口訣:連體一字一區塊,連體字碼不過4,首次三尾是4碼。分體一字多區塊,區塊首身次首身,左上首起右下尾。
分體字首2身3,分身再切次首身,次首1首次身2、次首2次身1尾;連身不切最多3,3碼便是首次尾。
這裡引用倉頡手冊不明言的觀念:區塊。
1.連體一字一區塊,連體字碼不過4,首次三尾是4碼。
分體一字多區塊,區塊首身次首身,左上首起右下尾。
連體字不能切分,整個字視為一個整體(區塊),就是一個字是一個區塊。連體字最多取4碼,就是首、次、三、尾。
分體字是可切分為字首字身、次字首次字身的,就是一個字是可切分作多個區塊。區塊切分由整個字的左上外開始,
到右下內。區塊內取碼,也是由區塊內左上外開始,到右下內。
假如一個字其上部是一個連體字,那麼這個連體字就自然是字首區塊了,如:息𧑉𦤑𥄥䄟,字首就是自毛。
2.分體字首2身3
分體的字首最多取2碼,字身最多取3碼。
3.分身再切次首身,次首1首次身2、次首2次身1尾
分體字身可再切分,就是次字首次字身。
若次字首是1碼就是首碼,則次字身最多取2碼。
若次字首是2碼,次字身最多取1碼,就是尾碼。
4.連身不切最多3,3碼便是首次尾。
連體字身不可再切,最多取3碼,就是首、次、尾。 很高深,不過就取法規則而言,我在初學的時候死記,但後來練熟了規則居然也說不出來,但字也拆得出,無碍打字。 不高深,這些全是由手冊上抄出來的,祇是手冊欠缺把整體規則整理在一頁的全貌圖。
依著手冊一章一章地練習,基本上熟悉不太難。不過五代手冊的整理不如三代手冊好. 我把三代和五代的規則(大致相仿)全整理在一起,方便互相參照。對初學者,一邊依手冊練習,一邊對照本文流程,將可飽覽全豹。 本帖最後由 鍾靈 於 24-10-2013 12:17 PM 編輯
倉頡手冊雖然並沒有使用「區塊」這個名詞術語,但它卻是主幹觀念。字首、字身、次字首、次字身、連體字,都是一個區塊的取碼空間,是一字形群組區域,是無法再切分的。
區塊又如何認定?
二、區塊切分取碼流程: 有兩種方式
1-1。(通則)分離:一字形群組明顯跟別的群組分離而自立成一區域的。
1-2。 外廓:有包圍四三二面共九大類:囗、冂、凵、匚、コ、厂、
131024補:糟!又砍文了!祇是補加一句,編輯後,在原帖文字第六列「 1-2。 外廓:有包圍四三二面
共九大類:囗、冂、凵、匚、コ、厂、 給一樓加註第一刀▲及第二刀◆切點,及給通則(取碼)流程圖加上表格提示。
本帖的流程總結,祇是我寫下文的副產品。我使用倉頡超過二十年,但在發現極少數以分體字作字首的字例,卻造成了我極大的困擾。我花了八個月時間,寫成了下文,把所有形式的區塊取碼作了總整理,其中還包括了跟湛森討論《經典問題》帖內的一些想法整理。希望各位賜教:
http://www.chinesecj.com/forum/viewthread.php?tid=2503
倉頡之友 》倉頡論壇 》在哪裡切--字首五情況、形勢說、【筆劃相連原則】、重疊型上部外廓字首
其中標示★的字是取碼有問題的,請阿勤版主幫忙研究。多謝。 本帖最後由 鍾靈 於 23-9-2014 05:16 PM 編輯
因字數限制,不能修改,重貼1樓的流程於此。又,網站軟體應該是更新了版本,有特殊筆劃無法顯示且會砍文,改以GIF畫面貼上:
(這是最新版的圖 2013/8/13;之前的舊版圖----《通則流程圖》夾用了第三代的名稱「分體字、連體字」。)
2014/9/21更新,填入三代手冊末所列的「當成整體字的字首」(等於五代的複合字首角色)共十個:
#7樓流程圖最上方(第一步)「切區塊」位置的《通則流程圖》和下方(第三步)「得碼」位置的《通則流程圖表格形式》,兩者是相同的,祇是表現形式之異。
組合字就是分體字。組合字是第五代名稱,分體字是第三代名稱。
整體字是第五代名稱,連體字是第三代名稱。但第五代所稱的整體字,是以第三代的連體字作基礎,把附則的例外字(註)包含進來。第五代又把第三代的《連體字筆劃交連規則》重新整理成《整體字字形筆劃相連原則》,這個新訂的「筆劃相連原則」更清楚地界定筆劃相連的狀況,使「連」的意義更完整。因爲,整體字(或字首或字身或次字首或次字身)是一個不可切的區塊。
在下方#8樓的操作表,其實是《通則流程圖表格形式》的擴展表現,再在表的週邊加上附則、原則,和在整體字框內附上「筆劃相連原則」。這樣,便把倉頡所有的規則全包括在一個表內了。
註:整體字所包含的例外字祇有三種:複合字、難字和特殊字;不含同碼的重復字。複合字、難字有既訂的編碼等於無法依正常規則去切分,特殊字是支架型,這三種都相當於具有連體字的不可切的特性。 假如把流程圖化作操作表,相信更易於瞭解及作輔助取碼用:
操作實例,以五個中華族徽字作範例如下:
好复杂啊,不过总结的不错
——————————————————————————————————————
WOW Gold Buy|GW2 CD Key|Rs Money 好复杂啊,不过总结的不错
多謝了,複雜是本人整理說明的功力不足。
不過.....
哈哈,應該是:好复杂啊,不过总结【得】不错
最近十多年來,發現網上把該是【得】的地方錯用了【的】。【得】是獲得、到達,作副詞,是指做一個動作做到了一個指定之狀況或程度。上述,总结【得】不错=總結這個動作,做到了「不錯」這樣的地步/程度。而【的】,通常就是所有格的表示,如:我的老師,你的書,妹妹的鞋子。(詳細還有,不贅述)
這都是漢拼太流行而造成同音或近音錯字滿天飛的後遺癥。 学习了!!感谢楼主分享了! 很好!!谢谢楼主分享!!对我很有帮助!!
Rs Gold|wow gold 好复杂啊 谢谢分享!
___________
Buy lineage2 adena 如果覺得複雜,先看#8樓的操作表,那是主題(通則&附則),知道怎麼切區塊取字形得碼,你已懂倉頡了。(附則就是難字、複合字和複合字首,用鄭碼的概念看,就相當是中間層字根的副根、形近根。因有指定碼就視爲一區塊。)。其餘的「整體字/區塊&筆劃相連原則」是輔助。至於「原則的1.2.」其實是所有輸入法都必會遵守的規則而倉頡特別提出,及「原則的3. 4.」是倉頡在掌握字形特徵的設計理念下所衍生的,祇算是對某些個字該注意的地方。 本帖最後由 鍾靈 於 24-9-2014 12:17 PM 編輯
之前的#8樓操作表祇做五代。最新版操作表,分五代及三代,各代操作表並附輔表給操作表的左下角「筆劃相連原則」和右側「【原則】」附上字例作解說。五代表有黑白文本和彩色word兩版。(依序上傳圖片,但顯示的卻不依序,讀者下載後依檔名自然可排好) 本帖最後由 鍾靈 於 23-9-2014 05:49 PM 編輯
五代與三代之差:
1.輔助字形增兩個:{犀-尸牛}=水、ㅑ=尸
2.通則:筆劃相連原則:基本上相同,但整理得較清楚;並正式將「例外字-重複字」納入整體字定義。
3.原則:尾碼包含省略:刪三個「土工王」,增四個「(瓦-、)(匃-人)廿コ」
3.附則:三代複合字在五代刪三個「目鬼几」,改一個「吂→{贏-貝}」。
4. 三代整體字首十個在五代改作明訂的複合字首八個:刪「䧹厤鴈雁厥府」,增「麻(ㄦ)合薛气」
(原气在三代實踐上使用而沒正式納入)。
5. 特殊字(支架型)在五代比三代多加七戈兩個。
6.取碼字形改依《標準字形》字集。
7.三代到五代改碼字有五原因:一、配合標準字體改碼者。
二、增加輔助字形,以方便取碼者。
三、增加複合字首或改變原複合字的取碼,以避免重複字者。
四、取消特殊規定,以方便取碼者。(註:多在支架型的特殊字)
五、取碼原則不一致者,使其統一。 操作示範四張圖。是四種取碼情況的格式:4-- 23- 221 212
整字
鳥=整體字 ≦4 - -
字首 整字身
龍=組合字具整體字身 ≦2 +≦3 -
字首 次字首 次字身
轉=組合字具組合字身 ≦2 +2 +1
踼=組合字具組合字身 ≦2 +1 +≦2
細一看,這彩圖做得超讚!!!
http://www.fed.cuhk.edu.hk/readwrite/typing/chartable3.jpg
此圖加字母表,倉頡迅速學會!!! 這是三代手冊的圖,原本是點陣字形(那時最漂亮就祇有24點陣字),現把它重描得更漂亮並加彩色了。不過有兩個輔助字形是不對或半對:
卜的亠,上方是點不是橫。田的(母-÷),囗中間沒有一橫。 宋體字形的字根表原是阿勤製作的,我拿來加工加上33個不同形的輔助字形(稍有不同就當作另一字形)
楷體字形的是我製的,一張純表,另一張把114+2+33=149個字根歸成70小組,容易掌握。
頁:
[1]
2