设为首页| 收藏本站| 切换到宽版
查看: 5214|回复: 0

关于为汉字编制“数码”的探索

[复制链接]

174

主题

1214

回帖

3万

积分

超级版主

建公支下绩北坦头“世承堂”汪氏

Rank: 8Rank: 8

积分
32646
发表于 2008-4-27 12:24:20 | 显示全部楼层 |阅读模式
汪翔:关于为汉字编制“数码”的探索
[日期:2007-09-27] 来源:  作者:汪翔

我国方块汉字字形复杂、数量庞大,给学习和使用带来一些难度。但是汉字有它独特的长处。它的突出优点是:很多汉字的形、音、义能够一起体现出来,看到一个字就能意会到它的含义。学习时的确会难一点,但如果有一个科学的、简便的、合理的方法,就能化解难点,变难为易。这就是我为汉字编制“数码”的初衷。  

经过几年摸索,我设置了“中文字元代码”。“字元”是组成汉字的基本单元,以数字为代码,给每一个汉字编码,按照编码查字、打字,会很容易。只要掌握了三千多个常用字,就能应对日常需要。我的体会,拼音文字只是字母的组合和排列,字义要从上下文关联中揣摩,遇到同音字(词)还容易产生歧义。如:“国旗(guóqí)”和“国企(guóqǐ)”,“国事(guóshì)”和“国是(guóshì)”这两组字,读音相近或相同,看到汉字,立即可以知道其意义,若是拼音,必须根据上下文才能领会。

电脑输入汉字比输入拼音文字难度大,因此很多人开动脑筋创造汉字输入法,据说至今已有上千种。但基本上不外乎:音码、形码、音形码、笔画码、数字码等,这几种码,我都试过。我曾经接触到了“数字码”输入法——南京季林彧先生创造的《几何数码输入法》。无论笔画多少、认识不认识,打1个、最多4个数字,就可以打出一个单字、一个词组、或者一段短文。只要单手敲击小键盘上十个数字键,就能轻松写文章。它对构字元素代码的设置比较形象、好记,几年来我一直使用它。在2004年11月北京召开的“全国汉字数字码输入技术应用高峰论坛”上(季林彧先生也与会),由于“几何码”在组成汉字元素的代码设置上与国家标准有悖,不被支持。现在我把“横、竖、撇、点、折”用国家语委规定的“1、2、3、4、5”作为“基准字元代码”,另用“6、7、8、9、0”作为“扩展字元代码”,分别代表“特例、相交、对合、开口、包围”。所有汉字笔形,归纳成十类“字元”,其中:带“折”的笔形全部以“5”作代码;“特例(6)”是为了减少同码率而设置,记忆起来有点难度,但它可以大量减少同码字;它们一共只有九个字元(亠、宀、广、疒、羽、髟、雨、竹、亦),学习时特别注意一下,用过几次也就能记得了。有的读者还很看好这个“特例”呢! “交叉(7)”是横、竖、斜线条的相交(十、丰、井、卅、艹、卄、廾、卌、?、乂……),不限线条多少;“对合(8)”是线段一头大、一头小的对合,象中文数字“八”;“开口(9)”是三面包围、留有出路,与“9”有缺口的写法相似;“包围(0)”则是四面筑墙,密不透风。凡遇到“开口”、“包围”这种笔形,先取“9”或“0”,然后再取包围圈内的笔画,如果包围圈内的笔形只有“横、竖”两种,则视作包容、省略,只取外框“9”或“0”。(季林彧先生支持我作的改变,提过很多宝贵的意见)。原则上“基准字元”按国家标准笔顺取码,“扩展字元”则优先取码。每个汉字有自己专有的、固定的、唯一的数码,组词、造句就都有章可循。(我称它为“汉字的身份证号码)。有的输入法设置了“容错码”,专家认为并不好,对生成词组不利。因为用惯了“容错码”,如果词组不用“容错码”,就不行,用了“容错码”,则势必每个“容错码”都要相应设置一套词组,等于要求学员既要学“标准码”,又要学“容错码”,太繁琐了。两年多来,我以《现代汉语词典》第5版、《新华字典》第10版和《现代汉语规范词典》2004年第1版为蓝本,对每一个单字重新编了数码,制成一本《数码汉语字典》。由于数字本身有它的自然顺序,就为汉字的检索创造了优越的条件。按照数字顺序直接寻找,速度快,找一个字只要几秒钟,比用部首几分钟查一个字可以提高效率几十倍。“拼音”查字,其实也很麻烦,按理:“拼音”也有顺序,应该容易查找,但如果错了一个字母,原来按某一顺序查找的操作过程又要重新推倒再来,化时更多。如“唱”字,先查“cang”,不对,再查“chang” ,对了,走了冤枉路,时间也多化了。而读错音的字是常有的,尤其是南方人。“说”字有三个读音,字典上在三处出现,而《中文字元》编码组字,“说”字只要查“4805”,会在同一个地方出现。节省时间是最大的节约,常常用到字典的人,在查字上大量节省时间应该会受到欢迎。可以先从查字典开始。会查字典也就会电脑打字、也会手机发短信。暂时没有电脑的人单拿一本字典都可以学。如果有手机,那更方便,因为手机就是一台“手持电脑”,手机上有十个数字键,用“数码输入法”打字发短信,比用其他输入法要容易得多,熟练了既能发短信,又能上电脑打字,这样:查字、打字、发短信一举三得,真的非常理想。(手机发短信要制作芯片,目前我还没有做到这一步)。《中文字元代码》按照国家规范设置,依据笔画、笔顺取码,如果从小学生起就教“数码查字”,掌握了编码规则,看到一个汉字,脑子里立即出现一个数码,就可循序寻找。能够快速、熟练地查字典,对规范汉字教学、提高语文水平,会有一定的帮助,也为在电脑上输入汉字打下了基础。在成人中推广,也可以更好地扫除我国的老、新文盲和普及电脑。(联合国教科文组织指出:不会使用电脑的人为“新文盲”)。我已经请编程专家开发了《中文字元数码输入软件》,可以输入汉字及符号21000个,词组6万多条,繁体字也可直接上屏。

到现在为止,我已经把《现代汉语词典》、《新华字典》、和《现代汉语规范词典》等几本字(词)典中的单字编制成一本《数码汉语字典》,其中163个汉字现有电脑软件只能打繁体字,用“简、繁体字转换法”也无法改变,我在字旁注“*”号表示。另有500余个字各种输入法都打不出来,我已用“造字法”造出来补充进去了,也在字旁注“*”号表示。不过这些都是生僻字,无大碍。我是想,既然字典上有的字,一定也要能够在电脑上打出来。另外,从几本“字(词)典”的对比中发现,各有近500个单字“此有彼无,彼有此无”,这应该是由于各“典”编者的视点不同而导致的选字差异。例如:“吋、呎、哩、浬”四个字,《新华》有,《规范》没有。虽然国家规定以“英寸、英尺、英里、海里”来代替而明令淘汰,但在百姓日常生活中仍在使用,在不太久远的文字资料中还常见到,废弃不收似不太好,我觉得,既然是“典”,就要照顾到全面和长远,还是要收,属于淘汰的则另外注明。所以我的《数码汉语字典》收录在册的字数比它们的要多一、二千,共10200个汉字。但我这本《数码汉语字典》力求简明,所以对几本辞书上所有的繁体字、异体字、生僻字、罕用字均未列入。《中文字元码》经过编程制成软件,每个单字只保留一个,共可输入汉字21000个,《数码汉语字典》排序后,所有单字分成十类,这比现有字典201个部首简单多了。“部首”查字,许多字的部首很难确定,有的一个字却有几个部首(如“老”字在《新华字典》就分属四个部首)。有的难定部首的字,还要数着笔画到“难检字笔画索引”中去找。化的时间很多。我觉得《数码汉语字典》是一本比较实用的、简明的、高效的字典。我在编排字典过程中,还把上述几本辞书中所有单字的页码作了标注,这对需要使用其中任何一本字典的人更方便,更实惠。

根据“字元代码表”,一个汉字可以由一个数字、最多四个数字组成,例如:中(02)、华(8357)、人(8)、民(9515)、共(718)、和(30)、国(0174)这个词组,如单个打,就打括号里的数码,如果按词组打,只要打“0880”四个数字,“中华人民共和国”这七个字就都出来了(取1、2、3、末四个字的首码);词组、成语、常用问候语、短文(简历、厂史等,一百来个单字)也可以经过组合用四个数字一下打出来。

汉字是一笔一画组成的,有时稍有一点变化,意义就不同;有时看似相同,实际并不一样,这是我们学习汉语的关键,也是难点。“字元数码组字法”可以简便地加以区别。例如:打“7”“8”两键,同时出来“木、未、末、耒”、打“6504”四键,出来“赢、嬴、羸、蠃”等几个字,你就能够清楚地把它们的字形、意义、用法等加以比较、区分。又如:“降(5352)”和“解(3537)”,它们最后一个笔形看上去很相似,实际并不同,所以最后一个代码也不同,一个是“2(竖)”、一个是“7(交叉)”。又如:“今、令”二字,其代码,一个是“845”、一个是“8454”,细微的差异都能区别,对规范汉字结构、纠正笔误很有帮助。学习汉语,每个单字的写法(笔画、走势等)非常重要,必需仔细辨认,稍不留意,就会出错。使用数码组字,必需正确使用字元代码,否则查不到字、打不出字,这会逼迫学员认真对待,注意笔形,从而准确学好汉语。由于有不少汉字多音、多调,一般字典都是按照拼音的顺序排列,分别在几个地方出现,在每一处再注明:“又读××音,另见××页”。如:“说”字有三个读音(shuì、shuō、yuè);“呵”字有六个读音(ā、ǎ、à、a、hē、kē),分别在三处和六处出现。《新华字典》在每个“呵”字所在的字条处都另有五条不同读音的“见××页”的注解,显得很累赘,浪费许多篇幅;(顺便说一句:《现代汉语规范词典》对同形、异音、异调字只注拼音,不注页码,这对拼音不熟的人十分不便,如果要看另一个读音,必须重新按“部首”查找。)《数码汉语字典》就不是,因为代码相同,它们都会排在一起(可以只列一个字条,分别注音),查到一个字,所有异音、异调、异义的字都看到了,既节省了时间,又便于分辨每个字不同的读音、声调、意义和用途。便于比较、选用。

以上表达了我的一些想法,目的是想向大家介绍一种简便的查字、打字的方法,因为我自己觉得这个方法的确很容易,能够帮助人们迅速提高汉语水平和普及电脑知识。其中错误和不足一定很多,到底怎样,当然要经过实践的检验。希望能够得到专家、学者以及对这方面感兴趣的朋友们的批评指正。更期望《语言文字网》的专家们不嫌麻烦给我以指导。谢谢各位。

汪翔联系电话:0571-86478246  81336022  13735541571  

E-mail:wxwx9009@163.com  邮编:310020  汪翔中文字元数码输入法工作室

地址:杭州市秋涛北路192号 艺都大酒店 西5楼
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ| 小黑屋|手机版|Archiver| 汪氏宗亲网     

Copyright © 2001-2013 Comsenz Inc.   All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备20001616号-1 )

快速回复 返回顶部 返回列表

皖公网安备 34100202000237号