倉頡之友 。馬來西亞
自 學 倉 頡 輸 入 法
主頁 | Unicode九萬漢字 | 最新消息 | 課程 | 字典 | 論壇 | 下載 | 網上輸入法 | 友站 | 資料 | 聯絡 | 捐助本站
爲甚麼「长」字,微軟會取「人心卜口女」? - 倉頡論壇 - 倉頡之友 - Powered by Discuz!
請選擇 進入手機版 | 繼續訪問電腦版

倉頡之友

 找回密碼
 注册
搜索
熱搜: 活動 交友 discuz
查看: 271|回復: 0

爲甚麼「长」字,微軟會取「人心卜口女」?

[複製鏈接]
發表於 29-4-2021 17:02:51 | 顯示全部樓層 |閱讀模式
昨天有網友詢問:爲甚麼「长」字,微軟會取「人心卜口女」?

顯而易見,「长」字怎麼拆,都不可能拆到「人心卜口女」,這絕對是錯碼。能取出「人心卜口女」這編碼的字形,是「镶」或「锿」。

問題是,爲甚麼會錯成這樣?

其實,微軟倉頡的取碼,Big-5以外的字(包括簡化字)都是微軟員工自行補編的,而負責的微軟員工能力不高,弄出大量錯碼,本來已司空見慣,可參見「維基敎科書」倉頡敎程的「特別注意」:
https://zh.wikibooks.org/wiki/倉頡輸入法/特別注意#微軟倉頡的編碼訛誤

不過,「金、長、門」剛好是三個順序的部首,而微軟倉頡裏的「门」字,也被誤編成「心人」——這個本應屬於「长」字的編碼。再數下去,「门」部的簡化字也有大量錯碼,例如:
闩(戈尸)、闪(戈尸一)、闫(戈尸人)、闬(戈尸一一一)、闭(戈尸一十)、问(戈尸木竹)、闯(戈尸口)

可以看出,微軟員工誤認爲「门」取碼「戈尸」(這是不對的,正確的取碼,在1999年版五代爲「中戈尸」,在1987年版五代爲「中尸」)。然後,扣除「戈尸」這字首部份,餘下的字身部份,皆是對應前方那一個字。

因此我們可以推論,微軟員工處理碼表時,不愼把碼表中一部分的漢字與對應編碼移了位。例如本來的碼表,可能長成這個樣子:
人心卜口女
人心卜口女
心人
戈尸
戈尸一
戈尸人
戈尸一一一
戈尸一十
戈尸木竹
戈尸口
戈尸弓女一

結果在微軟員工的不謹愼處理後,錯誤地移位成這樣:
人心卜口女
人心卜口女
心人
戈尸
戈尸一
戈尸人
戈尸一一一
戈尸一十
戈尸木竹
戈尸口
戈尸弓女一


於是微軟倉頡就無法以「人心卜口女」打出「镶」字,卻反而可以打出「长」字,並造成「门」部若干簡化字的一系列錯碼。
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|倉頡論壇

GMT+8, 16-5-2021 01:57 PM , Processed in 0.072825 second(s), 6 queries , File On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表