倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
駁嘸蝦米擁躉對倉頡的失實批評 - 中文輸入法學術論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 16172|回復: 6

駁嘸蝦米擁躉對倉頡的失實批評

  [複製鏈接]
發表於 30-4-2020 19:24:58 | 顯示全部樓層 |閱讀模式
昨晚一位名爲「oao」的新註冊用戶第一次發帖,題爲〈比較多種形碼輸入法〉,卻處處袒護嘸蝦米並攻擊其他輸入法,恕一郎無法苟同這人士的言論和比較。

首先,世上有不同的人,各皆有其習慣。某些東西,對一些人來說是優點,對另一些人來說是缺點。因此,儘管某些衡量標準是有理的,但衡量的結果並不是要已習慣某種輸入法的人放棄它。不同輸入法都只是各適其適而已。這人士聲稱要「選擇唯一一種最優秀的形碼輸入法」,用它來取代其他形碼,未免太霸道。

其次,這人士許多觀點,都以嘸蝦米輸入法爲中心,本身就預設了「嘸蝦米比較好」這立場,戴着有色眼鏡去比較。單看這人士列出各種輸入法的優點和缺點數量,以及在比較時經常都說嘸蝦米比當前的輸入法好,即可知道。這也跟嘸蝦米官方沆瀣一氣,嘸蝦米官方向來以攻擊其他輸入法作爲文宣,尤其是倉頡,默默吃過他的不少明槍暗箭。

數年前,一郎在部落格上就已經寫過〈平反倉頡(上)〉、〈平反倉頡(下)〉等的一些文章,反駁其他輸入法的失實攻擊。現在就容一郎抄錄一些相關的段落,如下:



文宣:倉頡要背各式各樣的字根,又易忘記。我們則以英文字母象形來歸納字根,不易忘記。光是這輸入法是編成英文這一點,我覺得就很難讓我學別的輸入法了。

眞相:英文字母與漢字部件系統差異極大,要是中文輸入法以英文字母象形歸根,一定有甚多牽強的歸納。比較快碼、嘸蝦米兩套以字母象形作賣點的輸入法,「辶」快碼歸「L」,嘸蝦米歸「W」;「了」快碼歸「Z」,嘸蝦米歸「W」;「戶」快碼歸「P」,嘸蝦米歸「F」;「厂」快碼歸「F」,嘸蝦米歸「L」;「山」快碼歸「V」,嘸蝦米歸「E」;「幺」快碼歸「S」,嘸蝦米歸「W」;「亞」快碼歸「5(五)」,嘸蝦米歸「O」。可見所謂的字母象形歸根有多主觀、牽強,一樣需要學習者死記。而且,中文常用部件有許多,單以英文字母象形,難以囊括所有字根。因此,在同一套輸入法中,還有大量字根,並不能用跟英文字母象形去記憶。例如快碼的「土、士、⺧」歸「G」、「車、東、朿」歸「0」;嘸蝦米的「弗、鬼、佳、衤」歸「V」,「兼、弓、犭、丈」歸「Q」,再牽強都無法與字母繫之以形。即是說,這些輸入法的學習者不但要強背死記,還要在記憶不同字根時,用不同的記憶或聯想方法。這極容易引起混亂,造成大量記錯與遺忘,絕不可能如文宣所說般易記。

至於倉頡,主輔根加起來只有百餘個,而且輔根皆是主根或其他輔根的形狀變化、衍生,簡單、清楚、好記,絕不易忘。

文宣:倉頡要死背口訣,以記憶中文字母的位置。我們跟英文鍵盤是吻合的,直接用英文字母,不用另外再背誦口訣,會英文打字的人直接上手,不會打的可以在練中文打字時同時練成英文打字。

眞相:任何輸入法都必須記憶字根歸鍵的位置。倉頡雖用中文字根來歸鍵,但只有二十四個主根,要使手指的神經「記得」字根位置並不難,且莫說絕大多數中文鍵盤都印有倉頡主根,方便學習者上手。至於用口訣來把中文字母轉換作英文字母,根本是走了歪路,不是正確的學習方法。

要是一套中文輸入法直接以英文字母歸鍵,一來,使用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母,然後以手指按動英文字母所在的鍵,不會因此而減低記憶負擔。二來,因爲英文字母與漢字部件系統差異極大,必有許多字根要強記,記它們會比記歸鍵位置難(如上方所述),結果是得不償失,對記憶的負擔還加重了。況且,即使它以英文鍵來歸根,中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合,難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串,手指已條件反射地記得字串的指法嗎嗎?實際上還是要練習。

文宣:倉頡的拆碼規則很「龜毛」(「婆媽」),很複雜,很難學。

眞相:倉頡的拆碼規則是仔細,的確相比好些輸入法會顯得繁複,一般輸入法都不會對字身再分拆。然而,倉頡這做法符合漢字特徵2)。規則定得仔細,不等於難學。輸入法眞正難學之處,在於要死記死背誦、因字而異的地方。至於規則,只要製定得能適用於任何情況,就能一理通,百理明。良好的規則,是用來理解、用來明白的,不是用來背誦的。無論把漢字分拆成字首、字身,抑或把字身拆成次字首、次字身,原理都一樣,並不困難。眞的怕「龜毛」的話,學大新倉頡、快倉也行,它們都避開了最「龜毛」的取碼規則,因此也適合作過渡原版倉頡的跳板。

相反,說人家難學的輸入法,自己是否眞的易學?它們當然會說是,並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?它們的取碼規則統一嗎?有沒有許多「不依靠例外就幾乎不行了」的情況?官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。

文宣:倉頡很容易忘記。例如哪個朋友的遠親,沒用半年、數個月,便幾乎忘記了怎麼打中文。我們的輸入法好學好記。

眞相:自從學會倉頡以來,我從未忘記過。許多朋友也如此。誠然,要是有人丟下了一段長時間,變得生疏了也不太出奇,但任何中文輸入法也一樣,甚至單說英文打字也一樣,不單單是倉頡。而且,倉頡字根少,拆碼規則是略爲複雜但細緻,只要概念清晰,一明白了便不易忘記。不像那些此以攻擊倉頡的輸入法,邊強記了這堆字根歸在哪鍵,邊又忘記另一些,這才是眞正的容易忘記。

文宣:倉頡打一字要五鍵,速度慢。不及我家輸入法快速、按鍵少。

眞相:倉頡最多取五鍵,但許多常用字,都可以用一、二、三鍵輸入,平均數爲三碼多,與一般輸入法的平均數相差不大。當中不含要強記的簡速碼,平均三碼多就是平均三碼多,沒有摻進水份。況且取五碼之設計,來自嚴謹的統計與分析,有效區別不同的形塊。其他輸入法取碼數少於倉頡,卻引致輔根數量大增,或重碼率大增(甚至輔根數量與重碼率都大增)。有些甚至不靠開外掛(例如簡速碼)就難以達到高速輸入,其取碼平均數有「呃秤」(摻水份、欺詐)之嫌。

文宣:我們有許多「簡速字根」、「一碼字」、「兩碼字」等,都是精華所在,讓使用者提升速度。倉頡都沒有。

眞相:但凡簡速碼,都是外掛,在正常規則以外架牀疊屋,以例外取代通則,增加學習者的記憶負荷。對於想在中文輸入速度比賽中得獎的人來說,肯犧牲腦汁去換取數百字之便宜,周瑜打黃蓋,也無可厚非。但一般使用者應當不必依靠之,單以正常規則來取碼,即可得到相對較快、足以應付一般情況有餘的速度。要是一套輸入法不斷強調這些簡速碼,其實側面反映了它的編碼設計本身有缺陷,不靠這些例外難以達成高速輸入。如果你喜歡簡速碼,想背簡速碼去提升速度,在輸入比賽中得獎,可以學大新倉頡、快倉等改良版。大新倉頡還創了全球最高速的紀錄。若不需要,單是學習原版倉頡,已足夠日常應用有餘,不難達到頗高的速度。
 樓主| 發表於 30-4-2020 19:28:47 | 顯示全部樓層
文宣:我們的輸入法重碼率或選字率很低,適合盲打。

眞相:依實際數據分析(泰瑞:〈老話一句:不要學嘸蝦米,學倉頡!〉),倉頡輸入法才是重碼率最低的,這和它的取碼設計有關(詳見筆者的〈我學中文輸入法(四)〉)。如此宣稱的牟利輸入法,它們的重碼率可能一點也不低,或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避,取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算,玩弄語言僞術。

文宣:我們是最具國際觀的,能夠輸入多國語言漢字,貫通正、簡、日,外國人也適合學習使用。

眞相:倉頡早就支援超大漢字集,無論是Unicode,還是朱邦復先生那收字更多的「倉頡系統」,編碼都老早就公開。對倉頡來說,不論正、簡、日、韓,所有漢字都地位平等,在相同模式下,按同一套拆碼規則輸入,重碼率還很低。因爲在設計字碼階段時,朱邦復先生已顧及這問題,像「場、场」、「穗、穂」或「營、营、営」等字組,都不重碼。

相反,有些宣稱自己支援大字集,卻不見支援Unicode的官方編碼,只有民間擁躉補完。更甚者,那些輸入法,字根不區分正、簡、日寫法,例如「釒、钅」或「貝、贝」等正簡字組,組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼,來輸入正體字,當要同時輸入正簡字元時,就會構成嚴重重碼。結果,它必須區分開正體模式、簡體模式、日韓模式,要麼只能出正體字,要麼只能出簡體字,要麼只能出日韓漢字,無法同時輸入各種寫法的漢字。這根本就是沒有國際觀,不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字,支援漢字並不等於支援多國語言。

文宣:不論你怎麼寫,用甚麼字形來拆碼,我們的輸入法都支援。倉頡卻不支援異體字。

眞相:倉頡並非不支援異體字,在「倉頡系統」中,異體字有不同編碼,使用者以哪個寫法來取碼,就能輸入該寫法的異體。例如以「竹人木手弓」得出「衛」字,用「竹人木月弓」鍵入「衞」字。本來中文系統就不應該排除異體,應該像倉頡系統般,讓使用者輸入不同的寫法。然而,過往市場上的正體中文作業系統,都採用不支援異體的Big5編碼,削去了倉頡支援異體的功能。現在Unicode支援部份異體字,像上述的「衛」與「衞」,它們已立即能夠用倉頡輸入。但Unicode也合併了的異體,例如「令」字,就無法支援較符合字理、下方從「ㄗ」的寫法,這不是倉頡的錯,是Unicode、Big5編碼的錯。改用倉頡系統的話,兩個「令」字皆可正確輸入和顯示。

至於過去那些宣稱支援異體的輸入法,其實只是讓你想着異體來拆碼,卻打出Big5中的臺標字形。你明明想打「衞」字,拆碼正確,卻變成系統裏的「衛」字,顯示不正確。若需要這樣的倉頡,以往在DOS裏運行的國喬系統就有,許多改良版的免費倉頡也有提供,使用者都可以合法地取得、安裝和使用。「不支援異體字」,只是「依Big5版本的倉頡」之問題,不是倉頡本身之問題。

再說有些標榜支援異體的輸入法,連明顯是錯別字的寫法也「支援」。好像「眔」字,粵音「踏」,北音「dà」,「懷」、「鰥」等字從之。有輸入法卻當成是「眾」字的異體,拆「眔」形出「眾」字。這又是否好事呢?

文宣:倉頡沒有容錯碼、簡易的符號輸入碼、假名或諺文輸入、同音字功能、萬用碼功能、打正出簡(或打簡出正)功能、詞組模式。我家的有啊。

眞相:許多改良版倉頡都添加了這些功能,喜歡甚至在意它們的使用者,可選擇這些改良版。甚至我可以說,即使沒有任何改良版本令你滿意,但倉頡發明人早就公開宣佈放棄版權,你可以用他的編碼表去改良,自製合你心水的版本。隨着系統更新,即使是作業系統的預設版本,也加入了部份功能。這些新增功能,並不影響原來輸入法拆字編碼之優劣評價。要動用這些來作攻擊倉頡的武器,是否在主體上輸給別人,就拿無關宏旨的東西來攻擊呢?

文宣:我們是首創唯一只用二十六個英文字母的中文輸入法,智能電話系統也能用。

眞相:倉頡字母只用二十五鍵,還留下了「Z」鍵作特殊功能用。也一樣能用於智能電話系統中。

文宣:倉頡有版本差異,出了新版本後,過去的學習者就要跟舊版一起「共存亡」。

眞相:倉頡是開源的,出了新版並不會取締、消滅舊版。即使出了新版,使用者也可繼續合法、免費、方便地使用過去的版本;即使增新了輸入軟件,也仍會繼續合法、免費地支援過去版本的倉頡編碼。而它流通過的,只有三代及五代,兩者間差異極少,亦隨處都有合法、免費、方便的輸入軟件支援,誰都可自由選擇使用哪代的編碼。相反,作出這種攻擊的輸入法,它本身是有專利的,只要公司推出新版時,改變了舊版編碼,不再支援,那麼使用者就眞的要與舊版一起「共存亡」。而有關公司也眞的做過這種事,例如在新版本中改變過簡速碼、放棄過舊版本使用的簡速字根等。使用者除非堅持不升級,並且確保他那臺電腦永不壞掉,否則就只能跟隨公司的新版,改變過往習慣。由民間擁躉編寫的査碼網站,更因此而要列出不同版本的編碼,對學習者帶來不便。



剛開始時,一郎只是想抄錄適合的段落,結果動手抄錄時,卻發現幾乎每段都適用。這是始料不及的。

一郎自問並不是要主動攻擊其他輸入法。過往寫這些文章,也只是看不過眼倉頡飽受無理攻擊,希望以親身體驗到的事實,平衡一下外間那傾側且失實的言論大氣。輸入法這回事,跟人的習慣有關,可說是百貨應百客。因此即使我在文中批評過該輸入法的缺點,但你覺得合適自己的話,請繼續使用它、喜歡它,我對此絕對尊重。只是若眞的要討論,我希望無論哪方都能以事實和公理作依歸。要是你還未接觸中文輸入法,現在或將來要挑選,我更希望你能具有慧眼,不要受像上方那些失實文宣所蒙蔽。
 樓主| 發表於 30-4-2020 19:29:43 | 顯示全部樓層
此外,觀樓主的措辭和口吻,諸如「批評的人有聽說過嗎?」、「有人批評說嘸蝦米選字率有點高,這是因為他們沒有學好」等句子,似乎是認爲批評嘸蝦米的人並不認識嘸蝦米。我不知道其他人如何,但一郎自己是認眞地學習過的。一郎也在這裏轉貼部落格上的舊文〈我學中文輸入法(二):嘸蝦米〉:



 我先從輸入法的理論、系統、設計着手,學習多種正體中文使用者間常見的輸入法。結果,我最快放棄嘸蝦米。主要原因是:它的字根設計得太亂、太無理。請留意,我不是嫌它341個基本字根、156個簡速字根(註1)太多。嘸蝦米是大根輸入法,字根多是難免的,但它把字根歸類得很沒有系統,這才是致命傷。

 蝦米族當然會不同意這觀點。他們會說,字根雖多,但歸類得很易記,只不過是取形、音、義相關而已。可是,哪些字根取形?哪些取音?哪些取義?官方說「只要唸得出聲音來,大部份都取其音」,卻有大量例外,例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等,都明顯唸得出來。蝦米族說只要「多看多練」就可。不過,有哪種輸入法不是這樣的?對我這種講究道理的人來說,這不是答案。能看出規律、練出法門嗎?還是要走馬看花般看,囫圇吞棗地練,學得迷糊含混?尤其是嘸蝦米所謂取義的字根,又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的(註2);所謂取音的字根,也包含了像「亡、辛、牛、云、且、聿」等不是取音的;所謂取形(與英文字母象形)的字根,也包含了像「(D)、扌(J)、彡(M)、マ(T)、亞(O)、辶(W)、(H)」等難以聯想的。

 再說,取音是取聲母、韻母、英文字母諧音,還是哪種?「不、方、立、皮、竹」取聲母,「也」取韻母,「耳、爾、寅」取韻尾,「西、夕、雨、魚、于」取英文字母諧音,「月、又」取聲母和介音的英文字母諧音,「尹(註3)、永」取去掉韻尾的英文字母諧音,「酉、與、髟」等聲稱取音卻不知取甚麼音,怎唸都不像4)!「小、少、身、生、世」取聲母歸「S」,但「食、氏、升」卻歸「X」;「方、丰、飛」歸「F」,但「弗」歸「V」;「瓜、甘」歸「G」,但「弓、冎」歸「Q」。更離譜的是,「卜」取聲母卻歸「P」而非「B」;「臼」歸「G」而非「J(北語)」或「K(粵語)」;「戶」歸「F」而非「H(北語)」或「W(粵語)」(但「乎」則正常地依北語歸「H」);「黽」讀「敏」,卻取「繩」音歸「X」;「虍」唸「呼」,卻依「據」音歸「Z」(但「據」的漢拼爲「jù」。此外,「Z」、「J」的取音輔根也歸得一片凌亂。);「糸」一般讀「覓」,卻似乎被當作「絲」音歸「S」。這次第,怎一個「亂」字了得!

 況且它取音的字根,也以官話北語(包括大陸普通話、臺灣華語)爲主。如「午、瓦、文、巫」歸「W」,但前兩者粵語讀「ng」聲母,後二字粵語唸「m」聲母。還有一些字根,因爲與北語的註音符號同形,就按註音符號而歸鍵。這些歸鍵,都不易讓香港人(或其他非操北語的漢語使用者)習慣,增加了非臺灣使用者的學習難度。一個拆字輸入法,本應單純以字形出發,不論其音,跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時,就已高高築起這種屏障。

 但我還未說到戲肉。嘸蝦米歸形的字根中,竟有一部份是依靠簡化漢字作聯繫的!留意,我並不是反對形碼輸入法兼及簡體字拆碼,讓簡體使用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字,不致於有字無碼,始終是件好事。但我要指出的是,嘸蝦米有些輔根的歸形,以正簡轉換作聯繫。使用者要先懂得那字根的正、簡兩種寫法,才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」,才知道「婁省掉女」這輔根歸入「米」根;你得知道「堅」簡體寫作「坚」,才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法,而不必學簡化漢字嗎?可以嗎?可以嗎?!更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

 順帶一提,嘸蝦米的官方字根表中,其實漏掉了好些形狀相似的形塊,即是有若干實際應用上會碰到的字根沒有列出來。這不是嘸蝦米獨有的問題,不少輸入法的字根列表,也會這樣省掉一些形狀相似的形塊,例如只列「食」而省掉「飠(食偏旁)」,只列「金」而省掉「釒」等。要是省略得合理,一般人靠列出的根都能關聯到省去的根,也不疑事。但嘸蝦米只列出「夂」而省掉「攵」,只列出「佳」而省掉「隹」,未免太超過了吧?這些形塊雖然外貌相似,但絕大多數人都知道是不同的字或部件。不一併列出來,難免會令人困惑。又像只列出「歹」而省掉「」,使用者要拆「互」字時就難免抓破頭顱。更弊的是,一向強調容錯碼很多的嘸蝦米,偏偏不替「互」字設任何容錯碼。只列出「」而省掉「」,也使「留」的拆碼變得難記。

 嘸蝦米還有一堆簡速字根,可是簡速字根又如何歸類?繼續取形、音、義?「俞」可能取形,「並」可能取音,但有很多也不知何解,官方亦隻字不提,沒有人解釋到是依甚麼系統。蝦米族說,簡速字根可以不記,用本來的字根也可以輸入漢字,不記得就不用簡速字根。但蝦米族也說簡速字根是提升速度和減低重碼的關鍵。迴避它們,始終不是我要聽到的答案。

 輸入法規則設計上,嘸蝦米的「補短」規則也很挫敗人。一個字的末根既已取了,還要再把它「反芻」,再拆開它的尾部,取出眞末根。這種「反芻拆出眞末根」的做法,唯一好處是減低重碼率。同一鍵背負太多字根,重碼率自然高。例如說,把「少、身、生、世」都歸在「S」鍵,那麼「鈔、銵、鉎、鉪」就會重碼。但因爲要反芻再取眞末根,「鈔」的眞實取碼就是「金少㇒(ASP)」,「銵」的眞實取碼就是「金身ナ(註5)(ASX)」,「鉎」的眞實取碼就是「金生一(ASE)」,「鉪」的眞實取碼就是「金世㇗(註6)(ASL)」,它們就不重碼了。然而,要是輸入法設計者在定義字根時,就已經把這些形狀裁小,分拆成兩個字根,也能達致相同效果。那麼爲何要定義這片大形塊作字根,不把它拆開,變成兩塊較細小的字根?

 有時同一個部件或形塊,要補甚麼末根,也是隨機的!例如「八」字作右偏旁的字。當中「扒」字在甚麼模式都能補「㇏(N)」或「丶(A)」。「叭」字在正體中文模式只能補「㇏(N)」,在簡體模式卻可補「㇏(N)」或「丶(A)」。「汃」、「釟」、「朳」中則只能補「㇏(N)」。如果說「扒」字補「丶(A)」是容錯,爲甚麼「叭」字只在簡體模式才需要容錯?而另一些「八」偏旁的字就不用容錯嗎?

 「反芻拆出眞末根」的設計是很不必要的。這做法令使用者在拆字過程上,並不是一直線順着去。拆字思路流程會變得不順暢。有時眞末根甚至不是原末根的一部份,而是全部,就更令人無言。比如「卒」字取「十十(JJJ)」,原末根「十」反芻,再取眞末根「十」,結果「十」這部件就被取了兩次。「口」和「囗」二字都取「口口(OO)」,整個字都反芻取兩次碼。「回」字取「口口口(OOO)」,第一個「口」是外框,第二個「口」是裏面的原末根,它反芻再取出眞末根「口」,內裏的「口」部件又取了兩次,還跟「品」重碼。(「品」字本身已取了三碼或已上,不用補末根,因此不是「口口口口(OOOO)」。)

(未完)
 樓主| 發表於 30-4-2020 19:30:16 | 顯示全部樓層
(續上層)

 再說,嘸蝦米即使用這方法,重碼率仍然相當高(註7),它的使用者可以勝出輸入速度比賽,靠的是簡速編碼。除了上方提及的簡速字根,還有個別漢字的簡速碼,例如一碼字、兩碼字、兩碼字借作字根(但有些兩碼字則不能)、加V鍵快速字等。就如上述的「回」與「品」重碼,「回」可以用「OOV」或「OOOV」出字,「品」可以用「OV」出字。這輸入法靠這些正常規則以外的特殊編碼,去簡化按鍵數目,提升速度和支援盲打。

 但這種簡速碼,根本就是開外掛。要記這些簡速編碼,基本上都要逐字去記,每個字有個別的、不同的簡速編碼,很難說得上有甚麼系統、甚麼解釋。就像我唸高中時的那個化學科老師,不仔細說清化學原理的系統、解釋,只管一味說甚麼地方公開試必出,這裏那裏多少條化學公式要死背,甚麼關鍵字不可缺少或串錯,不能用同義詞代替,原因是:「你猜改卷的評分員,會有時間逐字去嗅你的萬言論文麼?哪管你寫得狗屁不通,意思相反了,只要看到有這些關鍵字,一個都不少、不算錯,就給你滿分。」有些同學很受落這套類近補習社式的敎法,但我因此而完全讀不進腦。若要靠死背去開外掛,爲何不把這些時間花在理解正式原理、規則之上?反正都是要花時間去記、去熟習,要是去記一些表面上略爲複雜的規則,我可以一理通,百理明。要是去記這些因字而異的簡速編碼,囫圇吞棗地爲拿分、爲高速而死背死記,不求甚解,我受不了。

 官方開外掛,靠外掛才可以贏,其實在一定程度上,也反映本身的拆字系統設計並不夠理想。而且,其他輸入法也可以用同類方法開外掛。倉頡輸入法開了外掛,進化成快倉或大新倉頡,也有同樣效果,速度上更勝嘸蝦米。要單純追求速度的話,學嘸蝦米不如用大新倉頡或快倉。至於一般使用者,根本就不應額外去記去背一大堆簡速碼,應該用正規的拆碼規則,取得不錯的、足夠日常應用有餘的速度,這已很好。

 誠然,蝦米族的擁躉也有不少,這種輸入法雖然不適合我,卻適合不少人。百貨應百客,我絕對尊重蝦米族對嘸蝦米輸入法的喜愛。不過看到嘸蝦米官方不時熱中於踩倉抬嘸,有些蝦米族也中了這毒,例如把自己爭取到學校中文打字課程棄倉投嘸,視爲人生的功績(註8),我想我也有必要表達另一邊的感受和觀點。要記數量龐大卻雜亂無章的字根與編碼組合——341個基本字根、156個簡速字根,472個兩碼字(註9),還有加V鍵快速字、兩碼字能借作字根的部份,諸如此類,不勝枚擧。甚至有些字,擁躉還建議靠簡體拆碼來打才會有效率(註10),要我在輸入正體字時想着簡體形狀。不論蝦米族如何緊跟官方說法,四處拿着大聲公高喊「一點也不難」,對好些人來說就是難,就是亂,就是沒條理,就是不適合。所謂的「多看多練」、「看個幾次就會了,不用背啦」,只不過是任何輸入法皆可高擧的宣傳口號。蝦米族說兩三個月內(甚至說一個月內、數週內、一週內)一定學會,但是有使用者就是學不會。栽在嘸蝦米凌亂的設計和字根中,以及官方外掛裏的學習者,是大有人在的。

註1)
我依官網基本字根表和官網簡速字根表數的。執筆時,維基百科「字根」條目說「嘸蝦米輸入法的基本字根總共有290個」,「有79個簡速字根」,皆欺詐也。2018年晚夏再査,其說已修正。我數的時候,已沒有補上「隹」、「攵」這類被官方省掉卻會應用到的形似字根,因此實際字根數量會更多。

註2)
爲了節省篇幅,我已不在正文裏質疑屬於取義但取得怪的字根了。好像「佳」取「very good」歸入「V」鍵,但明明「佳」只是「good」;「斤」取「kilo」歸入「K」鍵,但明明「kilo」只是「千」。至於「日」爲何是「day」不是較直接的「sun」,「木」爲何是「tree」不是較直接的「wood」,反正不是說不通,我就由它了……

註3)
可是在北語裏,「尹」與「寅」是同聲同韻的,都唸yin。結果「寅」只取韻尾歸「N」,「尹」卻去掉韻尾,歸英文字母諧音「E」。氣煞人也!

註4)
在北語裏,「酉」與「又」同聲同韻,都唸you,「又」歸「U」,「酉」卻歸風馬牛不相及的「E」;「與」跟「雨、魚、于」同聲同韻,都讀yu,「雨、魚、于」歸「U」,「與」卻莫名其妙地歸「E」。還有,「髟」讀biāo,清清楚楚是重脣聲母,一點兒也不輕脣,卻歸了「V」,簡直是亂來!且莫說輕脣也應歸「F」而非「V」。

註5)
這眞末根是「斜交」。

註6)
官方只列「乚」而省掉「㇗」。

註7)
嘸蝦米官方網站說這輸入法「選字率低」,但輸入法研究者泰瑞分析過,嘸蝦米重碼率是數種常見形碼輸入法之冠,在一萬三千多個Big5碼漢字中,竟有五成以上、近七千個漢字重碼!

註8)
見楊曜檜:〈經驗談〉。

註9)
蝦米族樂園所說,已扣除標準字根中的兩碼字、簡速字根中的兩碼字、佔兩位置的兩碼字、標點符號的兩碼字。這數字準確否?抱歉,我已沒有精力去細數求證了……

註10)
見蝦米族樂園:〈嘸蝦米與簡體字〉、林董:〈老掉牙的中文輸入法感想〉。
發表於 18-6-2020 12:23:06 | 顯示全部樓層
本帖最後由 ceku 於 18-6-2020 10:14 PM 編輯
文宣:倉頡的拆碼規則很「龜毛」(「婆媽」),很複雜,很難學。

眞相:倉頡的拆碼規則是仔細,的確相比好些輸入法會顯得繁複,一般輸入法都不會對字身再分拆。然而,倉頡這做法符合漢字特徵2)。規則定得仔細,不等於難學。輸入法眞正難學之處,在於要死記死背誦、因字而異的地方。至於規則,只要製定得能適用於任何情況,就能一理通,百理明。良好的規則,是用來理解、用來明白的,不是用來背誦的。無論把漢字分拆成字首、字身,抑或把字身拆成次字首、次字身,原理都一樣,並不困難。眞的怕「龜毛」的話,學大新倉頡、快倉也行,它們都避開了最「龜毛」的取碼規則,因此也適合作過渡原版倉頡的跳板。

相反,說人家難學的輸入法,自己是否眞的易學?它們當然會說是,並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?它們的取碼規則統一嗎?有沒有許多「不依靠例外就幾乎不行了」的情況?官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。


抱歉逆風一下。

對於其他輸入法的批評大部分都同意。身為倉頡老用戶,我也一貫認為倉頡整體而言是最好、最值得學的形碼輸入法。不過談到規則繁複,我認為的確是倉頡的痛腳之一。

當初學者抱怨倉頡規則繁雜,講的不只是規則多,還包括它經常模稜兩可,讓人無所適從。事實上,連官方自己都有不少前後不一,雖然這些前後不一只佔較低比例,但就足以令初學者卻步,畢竟初學者看到一個字要取碼時,可分不清是符合規則或是例外。

  • 整體字和分體字怎麼判定?哪些筆畫視為相連,哪些不視為相連?這裡面就有許多矛盾,比如「八」是否與上相連,「焉」「汞」連體或分體,「丷」「大」是否與上相連等等,都是大坑。
  • 精簡、先繁後簡、字形特徵原則彼此衝突時,何者優先?沒有定義。
  • 取碼順序方面,「𦙃」、「亾」等形要先取什麼,類似形怎麼取?沒有定義。「坐」取「人人土」是因為取碼字形確實「从在上,土在下」,或是有其他原因?
  • 字形特徵原則究竟有多少細則?沒有定義。即使我們長期努力下大致整理出了「區塊、轉角、跨越」等細則,仍舊還有不引入更多未明言的潛規則無法解釋的實例。比如最近才談到的:為何「目」要取「月山」不取「月一」?為何「𢦏」要取「十戈」不取「土戈」?為何「巳」取「口山」不取「尸山」?越是深究,就發現越不單純。
  • 包含省略適用的形塊究竟有哪些?官方有列舉,但顯然不夠完整,很多還是後人整理出來的。為何適用「几」卻不適用「戊」?官方也只有個不怎麼圓的說法。
  • 「木」「大」等字形何時適用特殊字,何時不適用?沒有定義。
  • 字形問題雖然很多形碼輸入法都有,但倉頡因為取小根,加上開發時所據字形與目前主流字形不同,比其他形碼輸入法嚴重得多。這些問題甚至根深地固到即使開發者想加兼容碼,都可能顧慮重碼增加太多、影響老用戶習慣而作罷,比如「沒」、「卑」、「婁」等等。結果就是初學者還要特地去記憶不少常用字形的取碼字形。


光以上這些模稜兩可之處,就足以殺死無數初學者。很多老手其實也只是用久習慣了,真要細究,能給出完全一致、毫無例外解答的,我想也是屈指可數。

相較之下,像大易或行列嚴格按照筆順取首二三四,不只規則簡單,也幾乎沒有模稜兩可之處。基本上借用國語文教育體系的筆順規則算是一種外掛,的確可讓多數受教育者容易上手,也可以避免大多數的模稜兩可。這些做法當然有不足之處,但單就是否繁複、難學、難用這個面向來說,應該是大勝倉頡無疑。

當然,其實倉頡的這些問題只佔相當小的比例,可能對多數使用者影響不大,純粹是因為我對倉頡認識夠深,才會放大它們。或許我們目前認為倉頡太模稜兩可的規則其實都可以找出一以貫之的道理解決;也或許其他輸入法真有比倉頡更嚴重的規則缺失或模稜兩可,歡迎有深入研究者來打臉。(看得出來一郎挑了不少,可惜還未搔到癢處)

可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?


我覺得這點根本不該放在這裡說。字根分配是否合理是另一個議題,而且前面其他點也提過了。既然這裡的主題是規則是否繁雜,就不應該把字根的問題摻和進來。

如果主題是談易學性,或許勉強可摻著談,但即使如此我也不認為「字根繁雜、規則簡單」相較於「字根精簡、規則繁雜」(這應是倉頡與其他形碼輸入法的最關鍵差異)何者易學是可以簡單辯論出來的,這需要有足夠科學的研究才能證明,即使有結果,還可能只是個統計結論,實際上仍因人而異的。

官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)


『說好了「頭尾」事實卻依賴「頭頭尾」等』這個批評似乎是針對華象?不曉得嘸蝦米、大易、行列有沒有這種實例?

拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。


要說「非線性」或「反芻」反直覺,我認為還是比較主觀的,若要類比,倉頡規則強迫把「順」拆成「丨」「丨丨頁」、把「釁」的「八」視作和上面的「酉」相連,也是非常反直覺,何者導致難學更多一點,恐怕難講。

不過整體而言,我認為規則模稜兩可才是真正的初學者殺手,程序繁瑣還算是容易習慣的,只要照著做能保證正確取碼,對易學性影響就不會太大。所以這幾個問題我認為都不是論證一個輸入法「難學」的好理由。




總地來說,我完全同意倉頡輸入法相較於其他形碼輸入法有許多好處,不過就「易學性」這方面而言,我個人還是傾向保守的。
 樓主| 發表於 31-8-2020 22:51:51 | 顯示全部樓層
本帖最後由 Ichirou 於 10-5-2021 11:06 PM 編輯

因爲Qwerasd123推了上來,現在才看到Ceku的評論。坦白說,個人覺得Ceku有點偏離了我開帖的意思。我在文首已開宗明義,說明這帖是反駁那名叫Oao的新註冊用戶之言。如果Ceku有其他說話,並非與我這目的有關,其實應該到相關的帖裏回應,或者另開新帖去討論,才比較恰當。

至於Ceku提出的問題,主要是細則未說得夠細,這方面是有少許的,也不是沒有嘗試過說仔細些,就只差在有沒有能定音的音量而已。本來,面對眾人的不同理解力,有時會令一些說明反而變得折騰。況復現在還有人別有居心搞玄學還企圖指鹿爲馬、以紫亂朱,至今未休,大家眞的覺得能置身事外不受影響嗎?

Ceku說「很多老手其實也只是用久習慣了,真要細究,能給出完全一致、毫無例外解答的,我想也是屈指可數。」我就不敢苟同。比如Jackchows他們在開源社群裏維護的碼表,如果由我來定規則,本來有些處理方法會不同的。但依照他們補充說明了的做法(當然,也有賴他們的補充說明足夠清楚),大家的取碼結果幾乎都一模一樣。

相反,大易和行列我也認眞學過,但眞的「幾乎沒有模稜兩可之處」嗎?Ceku說的「國語文敎育體系的筆順規則」就已是一大模稜兩可點了。Ceku應該接受臺灣的「國語文敎育」吧?我接受的是香港中文敎育。當中的不同,已是一大筆。我小時也學書法,這又拉出了另一大筆不同。倉頡就是在處理這方面,比大易、行列公平得多,我才取倉頡,捨大易行列。

臺灣的敎育字形、敎育筆順,都有許多地方跟傳統中文習慣不同。香港那一套也有跟傳統中文習慣不一樣的地方,卻不見得就像臺灣。因此,三者都有異的地方是不少的。如果一套輸入法,只側重臺灣的敎育字形和筆順,它並不是一套對不同地區漢字使用者都公平的輸入法。至少,在臺灣以外,它不見得會受歡迎。

至於輔根數量多少,輔根與主根間的關係是否統一好記,完完全全跟我的開帖宗旨尤關。我不知道爲甚麼Ceku可以無視我開宗明義說明的意思,自行定義這帖「主題是規則是否繁雜」。說實話,Ceku這樣說,個人覺得挺不尊重,說得難聽甚至有騎劫這帖之嫌。

『說好了「頭尾」事實卻依賴「頭頭尾」』,是快碼。至於「順」字的倉頡字首,我不覺得如何「反直覺」。基本上這是很早就已說明的規則,覺得接受不了就另作他選。接受到,就一直這麼拆,一直通行無阻。
 樓主| 發表於 31-8-2020 22:54:04 | 顯示全部樓層
順帶一提,這論壇的總版主大人是大馬朋友。大馬的中文敎育,也有不同的字形和筆順吧。倉頡雖尚未完美,但對不同字形和筆順的處理上,在現行字形輸入法中,大概是比較持平的一個吧。
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 23-11-2024 08:21 PM , Processed in 0.024009 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版