倉頡五代字詞重碼統計(不含標點)
本帖最後由 惜緣 於 11-3-2012 07:17 PM 編輯註:以下的重碼統計已將——「鬻」組做「弓月」類似「嬴」組處理
一、單字
1、BIG5內重碼統計:
單字:13356
重碼組數: 690
重碼個數:1448
重碼率(以重碼組數計算):690/13356=5.166%
重碼率(以重碼個數計算):1448/13356=10.842%
2、UNICODE內重碼統計:
單字:76787
重碼組數:10401
重碼個數:25240
重碼率(以重碼組數計算):10401/76787=13.545%
重碼率(以重碼個數計算):25240/76787=32.870%
二、單字+詞彙
1、BIG5內重碼統計:
單字+詞彙:97484(見下載區:倉頡2012平台中的繁體詞彙「乃已編碼詞彙,非聯想詞彙」)
重碼組數: 6372
重碼個數:13737
重碼率(以重碼組數計算):6372/97484=6.536%
重碼率(以重碼個數計算):13737/97484=14.092%
2、UNICODE(含76787單字)內重碼統計:
單字+詞彙:160915
重碼組數:17663
重碼個數:41878
重碼率(以重碼組數計算):17663/160915=10.977%
重碼率(以重碼個數計算):41878/160915=26.025%
若有異議,請不吝賜教,共同探討。 恩 恩 没错呀~~ 那就是44個具有以下結構的同碼字:
[弓*弓]
[鬲]
將上面的結構當作複合字首看了。很好,但又多了一個複合字首了。不過碼表是否也要配合修改?
頁:
[1]