倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
讓華族在繁體字與簡體字上的糾結,在倉頡輸入法里消解 - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 20930|回復: 6

讓華族在繁體字與簡體字上的糾結,在倉頡輸入法里消解

 火... [複製鏈接]
發表於 2-5-2010 13:24:28 | 顯示全部樓層 |閱讀模式
1111.jpg

我現在想做兩個碼表:
一個是簡轉繁的完美碼表,能使大陸人從簡體字平滑地過渡到繁體字;
一個是繁轉簡的完美碼表,能使大陸人最終熟悉繁體字後,不再用簡體字思維,腦子裏想的字完全是繁體字,在大陸需要的時候,便打繁出簡,或者打繁出繁。

北大中文論壇 簡繁字討論專區
http://www.pkucn.com/forumdisplay.php?fid=144&page=1

這個論壇很好,初步想把這個論壇里提到的簡繁字辨析、異體字辨析,都做進完美版的簡繁互轉碼表中


我現在想先找一個比較完全的簡繁對應碼表,然後在這個基礎上再補充,誰有?
請發到我的郵箱:LJWGD#YAHOO.COM.CN(請將#改爲@)

又:我在小小輸入法論壇發的帖子:
建议增加在候选框旁边同步显示注释的功能
http://yong.uueasy.com/read.php?tid=1255
發表於 2-5-2010 15:42:15 | 顯示全部樓層
简繁汉字转换

  国际标准汉字集是简繁并存的,一般的报章是以简体或繁体字为主。不过马来西亚是比较特别的地方,以马来西亚第一大报《星洲日报》为例,报章的标题是繁体字,內容则是简化字。这应算是个好处,不管是简化字或繁体字,马来西亚华人多多少少都能阅读简繁体中文文章。

  国际标准汉字集同时收录简繁汉字是一个优点,它可以同时处理简繁汉字。但对于大部份民众而言,使用简化字的占了绝大多数,目前仍旧使用繁体字的地区主要是台湾和香港。为使各地区的民众都看得懂简繁文章,计算机的简繁转换功能就成为大家讨论的焦点。

  随着互联网的发达与普及,繁简的交流也日益增加,故计算机的简繁转换也成为计算机汉字需要迫切研究的课题之一。不论是简转繁或繁转简,汉字都存一对多的问题,即一简对多繁或一繁对多简的问题。

  要在计算机上制作简繁转换功能,首先必需拥有两个表,即简转繁表和繁转简表,简繁一对一的转换是很容易的,但简繁一对多就要特别注意一简对多繁的转換,举例说:

1、“头发”错误转成繁体的“頭發”,正确的繁体是“頭髮”。
2、“日历”错误转成繁体的“日歷”,正确的繁体是“日曆”。
3、“手表”错误转成繁体的“手表”,正确的繁体是“手錶”。
4、“中文系”错误转成繁体的“中文係”,正确的繁体是“中文系”。
  以上的例子是常遇到的,要避开一简对多繁的问题,就要有一个齐全的表,下面整理出需要注意的一简对多繁的字表,共有274组①,如下:

001.万->万萬 002.丑->丑醜 003.专->專耑 004.个->個箇 005.丰->丰豐 006.乃->乃迺 007.么->么麼 008.云->云雲 009.仆->仆僕 010.仑->侖崙 011.价->价價 012.仿->仿倣彷 013.体->体體 014.余->余馀 015.佛->佛彿 016.佣->佣傭 017.修->修脩 018.借->借藉 019.儿->儿兒 020.克->克剋 021.党->党黨 022.冢->冢塚 023.冬->冬咚鼕 024.冲->沖衝 025.凄->淒悽 026.准->准準 027.几->几幾 028.凶->凶兇 029.出->出齣 030.划->划劃 031.刨->刨鉋鑤 032.别->别彆 033.刮->刮颳 034.制->制製 035.剩->剩賸 036.剿->剿勦 037.勋->勛勳 038.匹->匹疋 039.千->千韆 040.升->升陞昇 041.卜->卜蔔 042.占->占佔 043.卤->鹵滷 044.卷->卷捲 045.厂->厂廠庵 046.历->歷曆 047.发->發髮 048.只->只隻祇 049.台->台臺檯颱 050.叶->叶葉 051.叹->嘆歎 052.吁->吁籲 053.吃->吃喫 054.合->合閤 055.吊->吊弔 056.后->后後 057.向->向嚮 058.听->听聽 059.周->周週 060.咨(谘)->咨諮 061.咱->咱偺 062.咸->咸鹹 063.咽->咽嚥 064.哄->哄鬨 065.哗->嘩譁 066.唇->唇脣 067.啖->啖啗 068.啮->嚙齧 069.喂->喂餵 070.嗔->嗔瞋 071.嘻->嘻譆 072.噪->噪譟 073.回->回迴 074.团->團糰 075.困->困睏 076.圭->圭珪 077.坏->坏壞 078.坑->坑阬 079.坛->壇罈 080.堤->堤隄 081.复->復複 082.夫->夫伕 083.夸->夸誇 084.奸->奸姦 085.姜->姜薑 086.娘->娘孃 087.宁->寧甯 088.它->它牠祂 089.家->家傢 090.尝->嘗嚐 091.尸->尸屍 092.尽->盡儘 093.局->局侷跼 094.岩->岩巖 095.岳->岳嶽 096.嵩->嵩崧 097.巨->巨鉅 098.布->布佈 099.帘->帘簾 100.席->席蓆 101.干->干乾榦幹 102.并->并併並 103.幸->幸倖 104.广->广廣 105.庵->庵菴 106.弥->彌瀰 107.弦->弦絃 108.强->強彊 109.当->當噹 110.彩->彩綵 111.彷->彷徬 112.征->征徵 113.径->徑逕 114.御->御禦 115.志->志誌 116.念->念唸 117.恤->恤卹 118.恶->惡噁 119.悯->憫愍 120.愈->愈瘉癒 121.愿->愿願 122.戚->戚慼 123.才->才纔 124.扎->扎札 125.扑->扑撲 126.托->托託 127.扣->扣釦 128.扬->揚颺 129.抵->抵牴 130.拈->拈捻 131.拐->拐枴 132.挂->挂掛 133.挽->挽輓 134.捆->捆綑 135.据->据據 136.搜->搜蒐 137.摆->擺襬 138.效->效傚 139.斗->斗鬥 140.旋->旋鏇 141.昆->昆崑 142.晒->晒曬 143.暖->暖煖 144.曲->曲麯 145.术->朮術 146.朱->朱硃 147.朴->朴樸 148.杆->杆桿 149.杠->杠槓 150.杯->杯盃 151.杰->杰傑 152.松->松鬆 153.板->板闆 154.构->構搆 155.枪->槍鎗 156.柜->柜櫃 157.栗->栗慄 158.梁->梁樑 159.棰->棰槌 160.棹->棹櫂 161.榨->榨搾 162.模->模糢 163.檐->檐簷 164.欲->欲慾 165.殷->殷慇 166.毁->毁燬 167.汇->匯彙 168.污->汚汙 169.沄->沄澐 170.沈->沉沈瀋 171.沾->沾霑 172.泄->泄洩 173.泛->泛氾汎 174.注->注註 175.浚->浚濬 176.涂->涂塗 177.涌->涌湧 178.淀->淀澱 179.淋->淋痳 180.游->游遊 181.湿->濕溼 182.溪->溪谿 183.漓->漓灕 184.炉->爐鑪 185.炖->炖燉 186.炮->炮砲 187.炼->煉鍊 188.烟->烟菸煙 189.焊->焊銲 190.焰->焰燄 191.照->照炤 192.熏->熏燻 193.狸->狸貍 194.球->球毬 195.琅->琅瑯 196.璃->璃瓈 197.症->症癥 198.痴->痴癡 199.盘->盤槃 200.眺->眺覜 201.确->确確 202.碰->碰踫 203.磷->磷燐 204.秋->秋鞦 205.种->种種 206.秘->秘祕 207.移->移迻 208.筋->筋觔 209.筑->筑築 210.筱->筱篠 211.签->簽籤 212.箬->箬篛 213.系->系係繫 214.累->累纍 215.纤->纖縴 216.绩->績勣 217.罗->羅儸 218.翻->翻繙 219.肴->肴餚 220.胄->胄冑 221.背->背揹 222.胡->胡鬍 223.脏->髒臟 224.腊->腊臘 225.腌->腌醃 226.膻->膻羶 227.致->致緻 228.舍->舍捨 229.艳->艷豔 230.芸->芸蕓 231.苏->蘇甦囌 232.范->范範 233.荐->荐薦 234.荡->蕩盪 235.药->葯藥 236.获->獲穫 237.菱->菱蔆 238.蒙->蒙濛懞矇 239.蓑->蓑簑 240.蔑->蔑衊 241.薯->薯藷 242.藤->藤籐 243.虫->虫蟲 244.虱->虱蝨 245.蜡->蜡蠟 246.蜷->蜷踡 247.衔->銜啣 248.表->表錶 249.证->証證 250.谷->谷榖 251.赞->贊讚 252.辟->辟闢 253.迤->迤迆 254.迹->跡蹟 255.适->适適 256.郁->郁鬱 257.酸->酸痠 258.采->采採 259.里->里裏 260.鉴->鑒鑑 261.钟->鍾鐘 262.钳->鉗拑 263.铲->鏟剷 264.锤->錘鎚 265.镶->鑲瓖 266.闲->閑閒 267.雇->雇僱 268.雕->雕彫 269.霉->霉黴 270.面->面麵 271.须->須鬚 272.饥->飢饑 273.馈->饋餽 274.麻->麻痲

  至于繁转简也是一样的,主要也是一繁对多简的问题,如:

1、繁体的“乾凈”可转成简体的“干净”,但繁体的“乾隆”不能转成简体的“干隆”,简体仍用“乾隆”。
2、繁体的“瞭解”可转成简体的“了解”,但繁体的“瞭望”不能转成简体的“了望”,简体仍用“瞭望”。
3、繁体的“衣著”可转成简体的“衣着”,但繁体的“著作”不能转成简体的“着作”,简体仍用“著作”。

  与一简对多繁比较,一繁对多简就较少有这个问题,常见的一繁对多简是著作写成“着作”(台湾著名作家戴晨志的简体中文版著作如《赢在华文》②、《爱,让孩子更优秀》③都犯这个错误),一繁对多简表如下:

01.乾->干乾 02.夥->伙夥 03.藉->借藉 04.瞭->了瞭 05.麼->么麽 06.餘->余馀 07.摺->折摺 08.徵->征徵 09.著->着著 10.蘋->苹蘋 11.兒->儿兒 12.剋->克剋

  以上的两个简繁对应表,还要大量的加入相关词语,才能准确过滤简繁双向转换。由于中文词语太多,而且有时一个词又和另一个词有关联,结果转来转去也难达到百分之百的简繁转换,即如简体的“太后”转成繁体的“太后”是没错,但若遇上“站在‘太后’面”,这时则要转成繁体的“站在‘太後’面”,什么时侯要把“太后”转成“太後”,又什么时侯要把“太后”转成“太后”?遇到这类词也真的令人和计算机太沉重了。

  不管是国际标准汉字集还是其他国家、地区汉字集,这个问题对于目前的中国规范来说,要使计算机处理简繁汉字都是很繁杂的。除非中国的新规范能做相关的改变,即简繁只有一对一的转换,不然以上的简繁问题永远没完没了,大大的浪费人力物力与时间。

--------------------------------------------------------------------------------
①《汉字“简一繁多”对应表》,《语文建设通讯》第90期,香港中国语文学会,2008年10月,34页。
②戴晨志《赢在华文》,台湾:时报文化出版,2008。
③戴晨志《爱,让孩子更优秀》,台湾:时报文化出版,2008。
④胡百华《“一繁对多简”究竟有几组?》,《语文建设通讯》第90期,香港中国语文学会,2008年10月,33页。
發表於 6-6-2010 09:59:11 | 顯示全部樓層
一早又来看……简繁完美互转~这个要支持~希望LZ早日成功~~嘎嘎
發表於 4-4-2011 10:53:08 | 顯示全部樓層
我下過一箇叫 TextPro 的軟體,對簡繁轉換支持的比較不錯,起碼沒有 头发 譯成 頭發
發表於 4-4-2011 19:49:03 | 顯示全部樓層
這不是對著跟政策幹了,是變著法跟政策幹。
    用繁體字思維?
    我沒意見,但行不通。
    當然我是喜歡,但簡化恐怕早晚都要進行。
    我不想因為少數愛繁愛古者而耽誤了多數的求簡求便者。
    當然,我是存疑派,不必復繁,不必廢簡,不必挺簡,不必汰繁。
    等到哪天繁體字能被證明效率真的高於簡化字,我才真的 不避嫌地 鼓吹!
    我想,一對一,連義項也是一對一,簡化所有繁體字──在合理基礎上,是很好的和必要的。
    這可以作為手寫非正式用字。但是不會造成文字混亂了吧?就算是不太合理, 不造成混亂,誰又能說甚麼呢?
    我想兩套準則都要堅持,簡有簡規,繁有繁法。
    真信孔子才是中國人,而他說過一句:毋意毋必毋固毋我。
發表於 5-5-2011 15:07:45 | 顯示全部樓層
有些簡化字還是不錯的,建議將所有字簡化成傳統漢字的草書寫法,類以 為(为)...
發表於 5-5-2011 15:09:30 | 顯示全部樓層
當然某些自造的字,類似 塵=尘,我是不贊成的
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 22-12-2024 11:53 PM , Processed in 0.015002 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版