《智慧之旅》

下载本书

添加书签

智慧之旅- 第165节


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
  在圈外人来看,这是个简单的问题,是吗?试想有一个大型的集会吧!假定是在没有现代化设备的深山中举行,而且一次来了四五万人。要给这些人造个名册,绝对不是小事一桩!好不容易造好了,突然又有一些人拥过来,说他们的名字不在名册当中!
  真的吗?当然要查!怎么查?名册是有,但是没有“字序”(以内码做字序,恐怕世界上没有一个人能按顺序背出五万九千个字来)。从何查起?有人说,在计算机中呀!计算机不是很容易查阅吗?这就是不懂中文信息的人最直接的反应!
  “字序”两个字人人都认识,但很少人知道它真正的价值。中文最大的缺点,也可以说唯一的缺点,就是没有字序!有人以笔画及部首为序,姑不论孰先孰后,查过电话号码簿的人都知道。当查到贵大姓时,再查到十画到十五画的名字时,便必须慢慢地数了。
  字序应是“文字的序数,与人熟记的序数相等”,有了字序,人才能随时知道该文字的排列位置。人需要熟记的序数不多,十进制是一种,九九表是另一种。拼音字母的序数约三十个,从小就背熟了,就如十个数字一样,一看就知道前后。
  凡是超过三十个以上的符号,就很难记忆,中文部首有二百多个,不能做字序。笔画更不直观,不仅要会数(写得正确不见得就数得正确),数时还要花时间。因此用部首、笔画为索引的字序法,始终不能让人熟记,更遑论灵活应用!
  国人喜欢享用现成的,不事观念上的改进,便用死方法,硬给每一个中文字形一个内码。使用时再用代码页对应各种输入码表,有对注音的,有对部首笔画的。这种方法表面上可以用了,可以卖了,直到下次出问题前,不再有人会过问。
  等到新的问题产生时,大家就胡涂了,又有一大堆专家,再建一个对照表。读者或许无法理解,这样又有哪点不对?是的,这不只是中文计算机界编码有问题而已,这是整个时代都有问题,大家只会头痛医头,脚痛医脚。就像台湾的都市一样,有地先盖房子,盖完再铺路,路铺好才发觉电线要埋管,于是再把路挖开。过些时,水管又要挖,水管过后,又是煤气管。每挖一次劳民伤财不说,工地交通不便,路基越来越坏。不久,捷运工程又成为建设重点,能不挖吗?挖的结果,有的电不通,有的渗水,有的瓦斯爆炸,有的整个地基崩塌!
  每个人都是事后明的专家,而且为了表示自己有见解,群起开骂,骂来骂去,发泄完了,情况依然。几十年来台湾各种层出不穷的事故,有哪一件不是事先任由少数人一手遮天,没有全面的规划,有功吹嘘自己,有过推诿他人,最后好官自为!
  新字的问题首先是“这算得上是字吗”?那些新字的“原稿”接近天书,无从查证,也难以认定算不算字!由于这种工作没有大利,所以没有专门机构负责。
  其次,就算是字,如何取码?在无输入码之前,任何计算机一定查无此号!如果取码的人不是原始定码者,麻烦就来了,这个字很可能一收再收,一字多码!
  就算这个问题也解决了,这是个新字,可以放在某一个位置吧!至于为什么是这个位置呢?有人说那不重要。文字是人应用的概念工具,放是放上去了,却不知道在哪里,那不是标准的敷衍塞责吗?如果要知道在哪里,则一定要有字序。(就像查英文字典时,一看字就知道前后!)
  还有一个尚未发生的问题,目前仅仅台北高雄两市就已经如此,以后全省实施时又是如何呢?不断地修改、造字,上千个事务所,未来如何维护?
  事到如今,谢振孟是好心,我却看得明明白白,内政部又背了一个烂摊子(前一个自然是全民健保)。我能怎样?时到今日,皮之不存,毛将焉附?我只能在输入码上略尽心力,义务替内政部编码,把字集继续扩充下去。
  资策会受标准局之托,希望能设计一套统一的仓颉输入码。此举立意至佳,只是考虑不周,竟然把我这个发明人给忘了。谢振孟自是感觉不平,我认为他们若真能统一仓颉码,只要做得更好,我绝不反对。
  可是,当谢振孟弄了一份改码的方案来时,我不能再事缄默了。自从我发表仓颉码之后,人人都以为编码非常容易,只要把我已经整理好的规律,搬搬移移,改个名字就行。人的学习能力来自天,能创造一种输入法,当然不是坏事。可是要把事情做好,却涉能力、毅力及敬业精神。很多人没有逻辑思维,也没有正确判断的能力,以致常常把很简单的事,加了很多自以为是的傻见,反而弄得一塌糊涂。
  由于户政司所用的五万五千多字,沉红莲已花了一个月的时间,全部编码校对完毕。而资策会所做的,也是为了配合户政系统,如果两者有矛盾,将来又会有好几个版本。因此,我不得不厚着脸皮,毛遂自荐,参加了资策会的“仓颉编码小组”。
  除此之外,对中文计算机而言,我已经仁至义尽,今后将全力从事传统文化的研究。至于其它的技术,我一概传授给学生,能完成多少全看他们的造化了。
  介于计算机与文化之间的,就是中文概念,我毕生绝大部分的时间,都耗费在概念的分析与整理上。受了《易经》的影响,对事物养成了分类的习惯,随时拿着一把刀,逢事就砍。以至于事事都与他人看法不同,虽有所得,亦有所失。
  “仓颉法则”就是中文的功能分类,一般人只知道仓颉输入法,其实那仅是仓颉法则应用的功能之一。可是不论我怎么说,人们眼睛没看到,手没摸到,总是不愿相信的。我年事已高,这些理想可能难以实现,书之于此,说不定未来有人将之发扬光大。
  仓颉法则包括文字的六大功能,分别是字码,字序,字形,字辨,字音,字义。由于理论与实践涉及太多专业知识及技术,在此仅能概略地介绍。
  字码就是文字的编码,以供文字实际的应用,包括键盘输入,文字索引等。二十六键中我只取用了二十四键编码,余下两键供扩充之用。
  字序是仓颉字母的顺序,相当于英文字序,有了字母的观念后,相应于每一中文字的每一字码,就有了一定的前后顺序。由于我已经把仓颉的著作权放弃了,任何人有兴趣都可以用这种顺序来编字典、做目录,欢迎应用。
  字形为一种视觉效应,利用明暗、强弱的对比,人得以辨识其特征而判别其所代表之概念。既然仓颉字母可以用作取码的符号,也就表示字母中有些性质具有字形的特征。根据取码规则,把各种字形符号以程控,便可以还原为字形。我的中文大字库便是利用这种原理,以最直接的手段完成的。
  人用眼睛看到字形,便得到一组字码,如果换了计算机“看到字”,应该同样可以得到字码,这就是所谓的字辨,也就是计算机的文字辨识。仓颉码的符号少,计算机辨识极为容易。计算机辨识的程序,沉红莲在大陆时就已经设计好了,可是基于多种原因,我们一直没有机会把它做成产品。现在已由封家麒负责,将在1995年年底完成,后继的产品很多,也将一一上市。
  字音是供语音输入之用,中文有百分之九十是形声字,大约有八千个声符,一千多种音。这也是我的学生们在努力的工作,几年之内,将会实现。
  字义是中文最值得称道的功能,文字是传达讯息的工具,讯息就是人对一般事物所认知的常识、知识。如果一种文字的字义需要靠死记,这种文字的价值就难以发挥。拉丁文是拼音文字中最有结构性的,有字头、字身、字尾的变化,所以各种学术上的名称,在习惯上都以拉丁文定义。
  中文的功能更强,以数百个部首来做分类定义,因此字义相当明确。只可惜中国人太信仰西方神话了,又没有能力、工夫将自己的文字功能整理出来,所以处处追随他人。值此信息时代,概念的分类与编码的机能将是自然语言的核心,读者切勿轻忽之。
  将此六大功能统一设计在仓颉法则中,的确是煞费心机。在过去没有中文计算机之际,人人都以为我神经不正常,今天中文计算机虽然有了,只不过用来做些简单的文字处理功能,成千上万的计算机专家,收入颇丰,有谁愿意放下身段来干这些苦活?
  我无意责怪别人,书之于此,也不过留供历史借镜。当一个时代中,人人只知求名逐利,除了吃不完的大鱼大肉,用不尽的华宅美车,又能留下什么?但愿后贤记取我们这一代的教训,人间该走的路实在太长太多了。
  就以中文概念为例,在未来高科技发展的趋势上,必然成为最有价值的技术。因为人类对人工智能的追求,是永远不会终止的。而人工智能的首要条件,就是机器有能力与人沟通。要使机器与人沟通,唯有彻底了解文字的概念定义与结构,否则不可能实现。
  当今人工智能的各种技术皆已成熟,所匮乏的只有人对概念的认知。人能用概念,以之与他人沟通,可是对其中的体用因果却是讳莫如深。
  正因为概念为未来科技之关键,而目前并没有这一门学问,学者不知,求教无门。在此我特地略作解说,真有兴趣的读者,将来也许可以参阅拙著《新易》。
  这里我先解释一个问题,就是前面提过的“混沌”观念。有人把它说得很玄,其实“混沌”是一种单纯的状况,只是人不知此状况为何而已。
  任何系统的原始状况都可以假设为一,当系统展开后,由量变到一极限,必然会分裂成为质变(即“混沌”理论中的周期三曲线)。如果我们继续把这种分裂当作原系统的延伸,每分裂一次,其对系统的殊异成级数增加一次,于是便成为混沌。
  以《易经》为例,原系统为一,一分为二,二分为四,四分为八,相当于三个分裂周期。原系统为太极(意为最最原始),太极生两仪,两仪生四象,四象生八卦。须知两仪代表相对现象,四象已经变为时空象征,八卦则为万事万物的象征,所展开的六十四卦已可以表达宇宙中的一切变化(“混沌说”中“周期三”与此相同)。
  为什么中国人不提混沌呢?这正是中西文化分岐所在。中国文化重视整体观,由一看万,是为大公。一般人做不到,所以就有圣贤茹苦含辛地,牺牲小我完成大我。西方重视自我,由万来看一,人见人殊,各人看法不同。看法不同,意见迥异,于是争取自由、独立,活在世间只为了在混沌之中争得一席之地。
  由一看万,即由大同观殊异,我们称之为有序。因为万是由一万个一,一一排列组合而得,其中的一种排列,是由小而大。如果换一种排列方式,集合性质相同者为一群,群中有序,这可以是社会组织,又何尝不可以是文字、事物的分类呢?
  对人而言,概念是一,而概念所涵盖的感受则是万。因此,以西方的观念来看,概念系统可以说是一种“混沌”。概念是“模糊系统”,所谓的“模糊”就是混沌之一。事实上,同一个概念对任何人说来,都不尽相同。但是在这“不尽相同”之中,却有概略相同的基础,用之与他人沟通,由同见异,由异求同,正是宇宙变化的原动力。
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架