本帖最後由 鍾靈 於 3-8-2011 12:10 AM 編輯
倉頡輸入法流程總結
手冊上的取碼流程其實是指切分字首字身的程序,就是下方 一、(通則),至於其他的規則則述諸文字,沒有像其他輸入法,如五筆,把它們編輯整理在一頁內,方便參閱。請把下文標示起來,貼入《筆記本》存檔即可。
1. 首身字形或字碼分隔符: 字首_字身;字首_次字首_次字身
2. 字形構式括弧:{上下疊} [左右列] (外內包) 不表構式字形組合:<字形> "強調字形"
+ = 兩字形相連處 - = 自-號前字形刪除-號後字形
3. 省略表示符: x = (尾碼)包含省略(一或多個字形) ~ = (首身中間)部份省略一字形 ~ = (首身中間)部份省略多個字形
4. 取碼=,不用括弧,碼用中文字母,酌用鍵位羅馬字母。 X = 錯誤取碼(碼用中文字母,酌用鍵位羅馬字母)或錯誤取用字形
依三代手冊方式約化整個倉頡輸入法為三大規則(通則=取碼方法、原則=取碼規則、附則=例外字):
(不採五代手冊的濃縮說法,因嫌不夠清楚。)
一、(通則)各個區塊取碼個數規定(共有20種組合,但祇需記得二刀貫切法即可)
┌▲第一刀切 ┌◆第二刀切
(外上左)
┌字首(≦2碼) ┌次字首1碼+次字身≦2碼
│ 首尾、首 │ 首 首尾、尾
┌1.分體字(≦5碼)┤ ┌分體字身(≦3碼)┤
字┤ └字身(≦3碼┤ └次字首2碼+次字身1碼
└2.連體字(≦4碼) └連體字身(≦3碼) 首尾 尾
首次三尾 首次尾
口訣:
連體一字一區塊,連體字碼不過4,首次三尾是4碼。分體一字多區塊,區塊首身次首身,左上首起右下尾。
分體字首2身3,分身再切次首身,次首1首次身2、次首2次身1尾;連身不切最多3,3碼便是首次尾。
改流程圖為表格: (▲是第一刀切,◆是第二刀切)
┌────────────────────────────────────────────┐
│ 字 │
├─────────────────────────────────┬──────────┤
│ 分體字/組合字≦5碼 │連體字/整體字≦4碼│
├─────▲───────────────────────────┼──────────┤
│字首≦2碼│ 字身≦3碼 │ 首、次、三、尾 │
├─────┼─────────────────┬─────────┤ 首、次、尾 │
│ 首、尾 │ 分體字身≦3碼 │ 連體字身≦3碼 │ 首、尾 │
│ 首 ├─────────◆───────┼─────────┤ 首 │
│ │ │ 首、次、尾 │ │
│ │次字首2碼=首、尾;次字身=尾 │ 首、尾 │ │
│ │次字首1碼=首 ;次字身=首、尾│ │ │
│ │次字首1碼=首 ;次字身=首 │ 首 │ │
└─────┴─────────────────┴─────────┴──────────┘
(本網頁看來表格線條都不整齊。本帖是在筆記本上打字再貼上來的,表格完全是對齊的。各位可把本帖文字標示後,貼到筆記本新開的檔上,就可見到整齊的表格。)
二、區塊切分取碼流程: (左上角起, 右下角終)
中文字
│
↓
切-(通則):區塊定義=字形群組區域:明顯跟別的群組分離獨立、有外廓圍起來的、依原則視作連起來的
分離:跟別的群組分離獨立:碼=石馬;語=言五口;體=骨曲豆;字=宀子;連=辶車;.....
外廓:有包圍四三二面共九大類:囗、冂、凵、匚、コ、厂、𠃍、𠃊、𠃎。
形勢(筆劃相連原則):1. 單純之丨和ノ筆畫與其上的字形相連:焉步賓亟卑
┌→區 2. 儿、ハ,丷、ㄦ 視為與上相連:見兀臖舉頁商酉
│ 3. 丶附屬於整個字形, 視為其一部份:寸永兔甫犬
│ 4. 卜、フ,ノ、𠂊、ㅛ,䒑與下相連:𣖴甬自兔業
│ 塊-(附則:例外字):(等同一區塊)
│ │ 複合字=(三代十個:門=日弓 目=月山 鬼=竹戈(三代) 几=竹弓 鬥=中弓
│ │ 阝=弓中 隹=人土 虍=卜心 {畿-田}=女戈 吂=卜口)
│ │ (五代七個:門=日弓 (不列) (取消) (不列) 鬥=中弓
│ │ 阝=弓中 隹=人土 虍=卜心 {畿-田}=女戈 {贏-貝}=卜弓)
│ │ (五代複合字首:麻=戈金 麻=戈木 厭=一大 辰=一女
│ │ 气=人弓 合=人口 羽=尸一 薛=廿十)
│ │ 難字 =十二個:身=竹難竹 慶=戈難水 廌=戈難火 鹿=戈難心 𠂔=中難竹 𣶒=中難中
│ │ 龜=弓難山 黽=口難山 兼=廿難金 臼=竹難 肅=中難 齊=卜難
│ │ 特殊字=(三代)木、大、火;(五代)木、大、火、戈、七。特殊字形毋需分割, 先取支架:
│ │ (先取特殊字形後, 剩餘字形仍要合乎完整原則(故不受字形特徵原則所控,取過仍可再取。)
│ │ 如: 柬中間⺌的丨仍要取,得⺌取火,不是變成丷取金。)
│ │ 東→木"田" 夷→大"弓" 卷→火"手"尸山 戋→戈"十" 长→七"人"
下 │
一 取-字母表
區 字-(原則)精簡:多種解碼, 取碼數最少者:王→一土 X<一十一>
塊 形 羊→{䒑キ}=廿手 X<丷一キ> X<金一手>
│ │ 完整:多種解碼而碼數同, 先取繁複字形。(五代合併「精簡、完整、字形特徵」在「完整」之下)
│ │ 夫→{キ乀}=手人 X<十大> 堇→{廿中キ一}=廿中手一 X<廿中十土>
│ │ 字形特徵:保留原字形特徵 1. 避免取碼重疊(取過不再取;但特殊字、封閉字形「囗日」例外)
│ │ 也→[七カ]=心木 X<卄𠃌乚> 者→{十𠂇日}=十大日 X<土ノ日>
│ │ 1-1. 囗、日等封閉字形, 有其他字形貫穿其間時, 必須切割, 保持封閉字形特徵:
│ │ 曱→{囗一丨丨}=田一中中 X<囗一丨> 甴→{丨囗丨一}=中田中一 X<丨囗一>
│ │ 註:冉→土月(冂不是封閉字形,故土上端可跨越冂上部。)
│ │ 2. 避免在轉角處分割
│ │ 力→[𠂇𠃌]=大尸 X<𠂇亅> 之→{丶フㄟ}=戈弓人 X<亠ノㄟ>
│ │ 省略:1. 部份省略:依(通則)取碼個數規定,區塊字形數>2,省略~~中間字形不取,祇取首尾
│ │ 鬱={[木缶木]冖[鬯彡]}=木~木_冖_凵~ノ=木木_月_山竹
│ │ (字首~、次字身~部份省略)
│ │ 2. 包含省略:字首、字身、次字首或次字身在取尾碼時,其尾碼字形完全被三面或四面包
│ │ 含著,優先省略x包含在內字形, 只取外形作尾碼。
│ │ 三代:囗、(母-÷)、冂、凵、匚、几、𠂊、乃、土、工、王。
│ │ 靈=雨_𠱠_巫=一~冂x_口~口_工x=一月_口口_一
│ │ (省<雨>內<丶𠁼>、<工>內<人人>)(三代)
│ │ 五代:囗、(母-÷)、(瓦-丶)、(匃-人)、冂、凵、匚、コ、廿、几、𠂊、乃
│ │ (五代取消三代:土工王) 靈=一~冂x_口~口_~人=一月_口口_人
│ │ 1)字首包含省略:獻=鬳_犬=卜~冂x(省𢆉)__丶大=卜月_戈大
│ │ 粵={粵-丂}_丂=ノ囗x(省采)__一𠃊𠃌=竹田_一女尸
│ │ 2)字身包含省略:璃=王_离=一土_亠凵x_~冂x=一土__卜山_月
│ │ (次字首 省乂、次字身 省厶)
│ │ 海=氵_每=氵_?_(𠃊𠃌)亠x=水__人_田卜
│ │ (次字身 省丶)
│ 得-(通則)區塊取碼個數:如上
└←碼-(附則:例外字):特殊字=如上
│ 重複字=(軟體有顯示同碼字選字窗,本則等同虚設)
│ 取碼相同者, 以使用頻率較高、或能自動組合者作本字;
│ 本字外作重複字, 首碼加引碼 重(X), 全字取碼超過5碼, 則尾碼省略。
│ 晚 → 日弓日山;冕 → 重日弓日山 日 → 日;曰 → 重日
↓
全字得碼 |