所謂書上的自相矛盾地方, 是真的書上所載前後不一致, 不能自圓其說? 或是在現實操作時發現跟書上的不合? 對於後者我認為是書沒有寫得詳細, 及各系統的倉頡在編碼時的疏漏。因為現時各系統之間確有存在少數一些字具有不盡相同的編碼, 以這些事實來反證書上所說(又剛好書上沒有明載該字); 但似乎這個反證本身就是我們無法確實地說對錯的, 這是值得商榷的。還不如真的去問朱先生。
還有, 這些在現實操作時所遇矛盾的證據, 如果能達一定比例(也許20%,...), 可以說倉頡系統的設計有問題, 如果跟一萬多字比(用big5字集)或跟四五千字常用字集比, 只佔極低比例, 我會選擇再回到書中思考, 若有所得又或許會認為是編碼者的疏漏。
我認為如果手冊能寫得夠清楚應該可解決一些疑問。對於前者, 我還沒看到手冊裡自相矛盾地方; 湛森兄如果有發現, 請告知大家來研究。
對於手冊明確寫清楚而又與事實不合的, 當然是編碼問題; 因為編碼是應依手冊所說的規則來編的。所以對於“登”、“合”、“春”、“薛”這些是明確在第五代手冊訂的; 事實不合, 我會認為是第三代「遺毒」(那確是第三代的取碼)。如果那系統的編碼者是朱先生, 我提醒朱先生有錯。手冊記的是規則, 自然必須遵從。
我看待手冊的態度與湛森兄有異, 但請湛森兄不要覺得「同你討論係嘥氣」。雙方結論交集少也正好是切磋機會。
我自民國74年起(1985)開始自習倉頡, 只是個人使用者, 不像湛森兄是在教學生, 我只要能打得出來, 大概不太會深究吧。有時確看到一些字的取碼, 不明道理, 但礙於事實上的使用需求, 也只好妥協於面前所使用的系統, 否則就是打不出所要的字。像蟗睾兩字, 我使用微軟, 我不打成如湛森兄所說的不合理取碼, 就是得不到所要的字, 心中不願但行動上不妥協也不行。誇張地說, IBM5550即是我心中的痛, 那時用得很不服氣, 但冇法啦。
對於「叢」或可用來證明手冊有自相矛盾的地方,因手冊上p63有明載「叢」作整體字看, 取碼"廿金廿水"。但似乎作組合字看, 左上角那堆筆劃是字首、右下角的「又」是字身較為合理。
基本上我覺得是書上未明確寫清楚整體字的定義, 手冊的舉例仍不足。或許這可能步上湛森兄所說的代聖立言之路吧。既然有不足, 就會想補足, 使書看來可自圓其說, 作個「自我安慰」。(這與基督徒討論新約舊約類似, 但稍有不同的是, 新約及舊約中自圓其說的矛盾是存在的, 只是他們「相信」了, 忽略過去。因為他們的精神意志完全繫於那個GOD, LORD, 沒有了人生就等於完全完蛋, 跟跌入地獄一樣。這個GOD成了他們生命的一切。唉!)
對了, 「其他的上方和左邊兩面包圍的內外形分體字」, 請舉例....不會是:友、產、皮、壓...之類吧?(我想應該是左上兩方要是筆劃多的連體字形)
「兔」和「勉」在第五代確是被看待成不同結構, 兔是整體字, 勉是組合字(在第三代兩者是被視為同一結構)。兔那最後一點是被視為與免相連的, 在第五代手冊中已說明白了; 我說「此話不盡然」即指此。
「勉」「尷」「彪」「颶」這些字我都看作
┌┬┐
│││
└┴┘結構, 因為無法把那個乚字根從左邊切掉, 乚是明顯連著於左邊的, 是左邊字形的一部份,所以不管看成
┌┬┐
│└┤
└─┘或是上面的「吅」結構, 對取碼並不造成影響。看作「吅」結構也不可能把乚字根拆離而歸到右邊去。當然, 以幾何學觀點, 第二個的形狀結構比較對。這是用鐵絲框框起來的。
我個人對於切分的結構形狀, 只當是用繩圈把切開部份圍起來, 所以形狀是正或長方形, 還是L形或Γ形都不緊要, 反正當作是一個取碼步驟(一個字首或字身或次字首或次字身或連體字)。在拓樸學上這兩個形狀結構是等效的。
我越來越相信所謂「有意義」(像我發那個《外內、上下、左右, 孰先?》的帖所講的), 把乚字根歸入右邊, 就使左邊的字形失去意義。看這字結構, 免表聲, 力是表義, 屬"形聲", 寫字時組合成第二個形狀是美觀, 原本即是第一個形的組合。所以, 把勉看作[免][力]兩字根並排放一起。
再者, 倉五手冊p53, p54兩頁, 也說明: 「凡字首有部份向右方或下方延伸, 不能截然劃分成兩部者, 為取碼上的方便, 亦視為字首。」並且舉例有:...風、爪、毛、𢦏、九、尢.....等。(在這裡, 我就覺得有些字例舉得不太妥當切題。像:門、广、戊、疒、勹、尸、囗, 辶等明顯就是字首, 不會混淆。)
尨=本站下載之倉五世紀版取碼"戈山 竹竹竹", 另容錯取碼"戈大山 竹"也可(當尨是整體字)。用微軟倉頡取碼"戈山 竹竹竹"。這表示當尤為一整體,作字首。「尨」即是「吅」結構。
駹=尸火 戈山 竹 => 表明當尤是整體看作次字首, 彡作次字身。是𠱠結構。
彪=卜山 竹竹竹; 跟「尨」相同結構。虎作字首, 彡作字身。是吅結構。
看來沒有矛盾。
(不過, 我第一次打駹是打"尸火戈大心", 因字太小, 以為右邊是如簡體「龙」,中間多了兩撇在乚字根上。等貼到word上再放大才看清楚。尤是左邊, 彡在右邊)
....咦! 怪哉! 我才把本帖貼上, 再把這三個字複製貼到word上放大, 馬上所見右邊彡是跟尤的乚黏上的, 如此就應取把整個尨當整體字取"戈大竹竹心", 作字身就應取"戈大心"。
唔, 看來, 字形會變呢!!!!, 找到了:
http://140.111.1.40/yitib/frb/frb00763.htm
彡確是在尤的右邊, 尨是組合字。
....再進來本帖一看, 本網頁所顯示字形, 駹尨的彡是會黏到乚上的,....; 唔,我看還是依異體字典的字形為準好了。反正, 應與彪同形。
對於
┌─┬─┐ ┌─┬─┐
│A│B│ │X│Y│
│ │ │ │ └─┤
└─┴─┘和└───┘, 我突然有個想法:
如果X小Y大、X右下腳很矮(筆劃少, 像上例的只有一個乚字根伸過來),如兦、這,要先取X後Y。即如上面右圖感覺, 相當於變成上面左圖
如果X右下腳很高(筆劃多,字形大)、X大Y小, 那就如犬,要先取Y後X; 這個已相當於變成了上下組合了:
┌┬─┐
││Y│
│└─┤
│ X│
└──┘在我眼中, 這種「變化」全是一種視實際如何而為的拓樸之變。所以, 用一條繩子圈起來, 那個部份較重(筆劃多)自然就會變形; 所以總的歸類只有上下和左右兩種組合形態。
而當X倒置過來的,
┌──┐┌──┐
│X ││ X│
│┌─┤├─┐│
││Y││Y││
└┴─┘└─┴┘故事稍有不同。
照原本倉頡設計, 所有上部是𠩵麻麻㢈㕍雁䧹鴈厭府....等的字, 本來的字首就只是厂、广, 次字首才是林𣏟隹倠𠌵猒...., 次字身才是下部的筆劃。後來為調整重碼字太多現象, 而造成了專把這些「上部」作字首取碼, 這樣一代二代三代四代五代, 疊有變異, 便有所謂「當字首」「不當字首」....到現在複合字首。
先看左圖, 這又可牽涉到「叢」字了, 是否X大Y太小, 於是給X吃掉了變成整體字看待? (像犬字那樣)。反過來, X小Y大的, 像皮、廄、廚..., {皮-又}、广等, X就是字首。
再看右圖, 像勾、匐、易、氣...., X小Y大, X是字首。那如馬、鳥、裊、....(一時想不起其他的組合字).., X大Y小, Y給吃掉變整體字了?
我用一條繩來圍圈圈, 也許較容易思考。圈起來的範圍即是一個取碼步驟或範圍(字首、字身、次字首、次字身)。
不知湛森兄有何高見?
裡和裏只是互為異體字, 以筆劃類輸入法來說就當成「不同字」, 編碼時當然應該分開編才對。不過, 我曾聽台灣某人物說, 不論是否打簡的編碼都應要求電腦出示繁體(只許繁體出現), 這是政治性的意氣用事, 不可取。固然大陸的簡化字有許多缺點, 當初設計時就是急就章, 而且目的只在作為把漢字轉化到abc拉丁化拼音字過程中的一個過渡吧了, 根本是隨便弄一弄暫時交差的。不過, 我們現在確是無法忽視大陸的影響, 這樣簡化字再爛用處還在, 只是它卻大大地阻礙了下一代傳承傳統文化的能力, 令人憂心。
日本佬編「馬」為"尸中尸火slsf", 是取用"尸s"碼之{耳-十}的輔助字形, 其左上角是丅, 那一橫向左突出, 不對。應取匚的輔助字形才對, 這自然就得碼"尸手尸火sqsf"。這是編錯碼。可見, 中國的文字、文化還是要中國人自己處理、發展, 靠別人是沒有用的。像之前我提的日本字模問題, 次字被改成了[冫欠]而非原本的[二欠]就是最明顯的。為了中文電腦的發展, 台灣教育部請學者專家依古文獻整理中文字, 終於整理出正確的字形, 名為標準字體, 可供全世界中文使用者來參考。但大陸及香港似乎並未注意到, 只在蒐羅民間用字整理, 尤其大陸作人為規範; 但所謂民間早經污染變亂, 莫衷一是。
[ Last edited by 鍾靈 on 30-12-2005 at 12:18 PM ] |