您有新信

 
【佛教电脑资讯库功德会】会议记录 (2/3)
#1
Post Gateway
发信站: 由 狮子吼站 收信 (cctwin.ee.ntu.edu.tw , 信区: BudaTech)
Subject: Buddhism Canon Input Conference 2/3

□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□
□                                                              □
□            主    题:佛教电脑资讯库功德会座谈会              □
□                                                              □
□            主 持 人:沈家桢博士                              □
□                                                              □
□            时    间:84.5.6                                  □
□                                                              □
□            地    点:台北慧炬杂志社                          □
□                                                              □
□            录音整理:摩诃工作室                              □
□                                                              □
□            编    辑:慧炬杂志                                □
□                                                              □
□            ※ 本文刊载於 84.7.30 《慧炬》 373 期 ※          □
□                                                              □
□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□

续上信:
—————————————————————————————————

    沈家桢:我简单的报告一下,我们这八个月已经做了一点什麽东西,同
时又碰到了什麽困难。

    今天本来的意思是希望「慧炬」弄一个圆桌,大家在讨论上可以方便一
点,不像今天这样的方式。不过因为人数太多,没有这麽大的圆桌,所以只
好这样。但是希望各位在心里面想这是一个讨论会,并不是上面在讲、下面
在听。所以我现在向各位报告这几个月来以美国为中心的资讯库功德会已经
做到什麽程度,希望多得到各位的意见指示。

    到现在为止,可以分三个部份来报告。

    第一部份,现在所谓的会员并没有一定的义务跟权利,所有的会员都是
很自由的,而且所有的会员都各有专长,有的是电脑专家,有的是佛经高手
,有的很能够做校对工作,有的是做扫瞄辨识这一套东西,可以说各式各样
的人都有。在我离开纽约那一天,我们有二百五十个会员,分散在各地。

    总会现在是在世界宗教研究院图书馆为场所,做为分散在世界各地会员
的工作联合中心。选择工作的时候,以会员的志趣为第一考虑对象。譬如说
哪一分会的会员对《妙法莲华经》有特别兴趣,他们就做与《妙法莲华经》
有关的经论。譬如有的分会愿以观世音菩萨为对象,也是可以的。将来我们
极可能有一个光碟是以观世音菩萨为主,这里面有观世音菩萨教义性的东西
,譬如<普门品>、<大悲咒>之类的,但是也可以将许许多多的「灵感录
」放在里面。甚至於我们有些光碟,可以在里面画许多漫画,是小孩子喜欢
看的,可以培养小孩子的宗教信念,对於将来都很有关系。

    所以我们并不纯粹是学术性的,也并不是说一定是商业性的,而是目的
要使得我们的後代以及後代的後代,能够因为这一个开创而得到好处,这是
一个最重要的目的。根据这个原则,我们已经把七十四种经论输入电脑,只
是还没有做光碟。

    第二,现在我们用三种输入的方法。第一种最基本的是所谓打码输入,
就是用电脑打字打进去。第二是用扫瞄机,就是把一个经本扫瞄过去,它就
自己进到电脑里面去了。昨天晚上我已经睡了,十一点钟于凌波教授打电话
给我,他说他已经弄到两部新式的扫瞄机;现在我们已经有五部扫瞄机在用
,他说比那五部更新式,可以说一放进去,它就马上到电脑里面去。他捐两
部给我们,他也是我们会员。第三个方法,台湾有一种叫「精灵笔」,就是
用笔来输入;这个我们大部分是用来做校对的工作,现在在庄严寺有两位法
师在做,一位叫宏源法师,一位叫仁定法师。现在又有第四种就要出来了,
我们得到的消息是明年就要上市,是中央研究院李院长发明的,叫「金声三
号」,用声音来输入。所以说将来输入电脑的工作会越来越进步,输入东西
的速度越来越快、越来越正确,辨识的精确度越来越高。

    第三部份是把输入的东西做校对。这一点,因为我们是佛教徒,我们知
道因果的关系,最重要的是我们做出来的光碟,将来的人看到了不会有错误
。各位都知道,光碟不能改,大家都觉得这是很权威性的东西,可是如果里
面有错的,就引发人一个错误的观念,这个因果是很严重的。所以,准确性
是我们现在最大的目标,也是最大的困难。目前我们规定,至少要有四次校
对。譬如说用扫瞄扫进去了,到电脑里面辨识出来,在电脑上校对一次,这
是第一次。第二次是在校对之後就印出来,我们要两个不同的人分别校对,
一个是第二校,一个是第三校。之後再把它放到电脑里面去,然後再印出来
校,这是第四校,第四校要一个字也没有错才可以过关,这是预备将来可以
用到光碟里面的;如果第四校发生问题,包括字和标点的问题,有问题就要
第五校、第六校;总而言之,最後一校要没有问题才可以定稿。所以,校对
实际上是一个很大的问题。

    这是今天我们所做的。而我们所碰到的困难,第一个是输入资料的困难
问题,困难是在选择版本。譬如说《六祖坛经》版本很多,版本间不同的地
方也很多。所以将来放在里面的《六祖坛经》,是把市面上所有的都摆进去
呢,还是选择哪一版本,这是一个问题。

    第二个大的问题是版权问题,现在很多出版的书是有版权的,有版权的
不能放进去。

    第三是造字的问题,因为现在电脑里面的字只有一万多一点,它现在大
概还有五千多个空的位置,但是佛经里面有很多很多的字是电脑所没有的。
中央研究院已经造了很多字,它有它的系统;佛光山也造了很多字,它有它
的系统。这两个系统并不相同,就是说究竟用哪一个系统好。中央图书馆的
谢教授有另外一个意见,是说用另外一个方法来造另外一个更好的系统;这
在理论上很对,我也希望他能够造得出来。可是谢教授讲,什麽时候能造出
来,他没有把握。所以,我们不能等这个最合理的系统。不过假定我们用了
另外一个系统,如果它有一个国家政府标准的系统出来,我们还是可以换。

    这里有三位弥勒内院的法师对这方面很有经验,他们已经做了很多,等
一下请他们发表意见。

    我们第四个面临的困难,就是对热心的人,怎麽样才能够利用他们的时
间而不影响他们的生活,或使他们生活得更愉快。现在功效最大的是在家的
主妇,我是以美国的情形来讲,有许多家庭主妇并未在外面做事,比较空□
,她们可以把时间挪出来做校对的工作,可以来做电脑输入的工作,可以来
做标点的工作。

    这就像沈乃宣居士所讲的,有好几位做得十分高兴。譬如她本来念《金
刚经》,念过就算,漏了一两个字并不希奇;现在硬要她一个字一个字的校
对,不能错一个字,她才觉得受益很大,所以这是一个没有想到而得到的好
处。

    还有我最近知道有一对夫妻,太太的父母也来美国。这对父母本来在家
很无聊,语言又不通,女儿一早就出去做事,他们两个就在家里,又没有朋
友。他们本来是预备要回国的,说是住不下去,後来听说有这件事,他们四
个人都加入做了会员。这位父亲原来是做编辑的,太太是做校对的。所以正
好,现在家里四个人都很高兴,大家共同来做这个事情,这也是料想不到的
。所以我想:有好的因就会有好的果出来。

—————————————————————————————————

    弥勒内院法师:我们只累积一点点经验,跟佛光山或中华百科全书基金
会来比,我们的经验很浅薄。但是我们这边有一些针对造字方面的资料,我
们愿意提供出来。

    目前我们收集到的原始的还没有经过对比的资料,造字的部份将近三千
字,已经整理出来;还没有整理出来的,可能要跟中央研究院的那个「偏旁
」系统来对比,以及上次跟沈博士这边拿到的一份电脑字跟一般字的对比表
,再对比出来的话,可能将近有三千出头的字,可能是需要造字的部份。听
了刚刚沈博士所说的话,任何有需要的单位,我们都愿意提供,我们也希望
能够把造字这个问题提早解决,让任何一本经典能够成为一本真正完整的经
典,那麽将来在学术网路或各个网路上面就可以达到世界性一致的地位,不
要说这个网路上看得到的字在别的网路上看不到。

    在这个造字问题上,我们发觉,比方说我们国内比较大的一家,在北部
的是「正丰」排版,我们今天早上拿到它两千字的造字,可是他们常常跟我
们讲一个很大的问题,就是说现在他们的造字系统五千字已经完全造满了。
所以变成说,我们原先很期望从它那边拿到一些佛教咒语的用字,或是一些
我们佛教的常用字,可是它给我们的回答是现在他们的系统里面,佛经中如
果不是常出现的字,他们必须用拼凑的方式,他们不再造进去了。这个代表
累积在一定的量的话,以我们现在佛教的印刷界来说,他们已经碰到这种造
字的瓶颈。

    我私下找过一位淡江大学的宗兴海教授,曾经讨论造字的问题,还有跟
慧灯、大乘精舍或是其它单位讨论,结果是各个业者很愿意把手边的造字公
布出来,可是他们很希望将来回来的东西也要兼顾到它使用的频率;就是说
他们现在的系统已经达到一个瓶颈,可是他们要所要用的字用起来很方便,
所以也希望将来在编排上能够兼顾到方便使用的形式问题。这个问题我们只
做一个现象的整理跟收集,来提供给任何有心的单位继续发心的工作,这是
第一点。

    第二点,我们这边目前可以提供出来的,有《指月录》、《高僧语录》
等有关禅宗典籍;另外林光明居士那边有一些《心经》、《金刚经》、《法
华经》、《六祖坛经》、《无量寿经》等典籍,比较偏重在中英对译方面。
将来我们会以弥勒内院来提供所有《慈航法师全集》,我们希望把它公布出
来。林居士那边的档案或研究资料很多,需要的话,可以跟他联络。我们输
入电脑的资料都没有版权,可以开放给所有需要的人,将来上网路後可以给
所有需要的人。

—————————————————————————————————

    周宝珠:慧炬是第三个分会,希望将来在台湾我们是一个统筹的单位,
不希望各会员在家里面做而没有跟我们联络,然後变成大家都在做同样一件
工作。如果能够跟慧炬保持密切的联系,我们可以分工合作,这件事情很快
就可以完成。

—————————————————————————————————

    吴宝原:刚才听沈博士说过去在美国八个月的工作期间遇到一些问题,
譬如说有关造字的问题,还有版本、版权的问题。这是一个问题没错,但是
过去沈博士是怎麽样去处理它、解决它。譬如说造字,你们那边是怎麽做?

—————————————————————————————————

    沈家桢:到现在为止,我们认为造字最好能够统一,比如由中央研究院
统一造字。不过,各位要了解这是一个现实的问题,并不是短时间内所能完
成的。所以到今天为止,佛典里的罕有字,在电脑里面没有的,而字典里面
讲有哪一个字可以通用,我们就用这个通用字,而这个通用字在电脑里面就
有。所以已经有三百多个这种字,有一张表,就是说佛典里面是什麽字,通
用字是什麽字,而这些通用字都是电脑里面有的,这可以解决一部份。

    第二个问题,假如没有通用字,有很多字是没有通用字的,到现在为止
还是一个黑圈圈,还是等在那边,等我们决定应该如何做。

    关於版权的问题,尤其是在台湾,譬如佛陀教育基金会、大乘精舍、慧
炬,许多有版权的单位都已把版权放弃了,让我们可以放在光碟里面去;其
它的单位到现在还没有很广泛的把版权问题解决。我们的办法是一本书出版
,上面说「版权所有翻印必究」的,我们现在就不放进去。

    我们不要有一个观念,认为光碟一出来,书本就用不到了。书本有书本
的价值,光碟有光碟的用途,所以书本在将来还是需要的,光碟甚至於可以
帮助书店,做为它的宣传品。以我个人的经验,我们读佛经,譬如说要翻丁
福保的大辞典,有时候很困扰,花了很多时间还找不到要找的名相,因为它
那个部首索引弄了半天还没有找出来。将来这个问题有人帮忙了,什麽人帮
你?电脑帮你忙,它很快的帮你查出来,你想这样可以节省多少时间。

    还有现在,譬如你念《圆觉经》,在里面看到一个名相,除了查辞典之
外,恐怕你没有别的办法。你想知道这《圆觉经》,太虚大师是怎麽讲的,
印顺大师是怎麽讲的,憨山大师是怎麽请的,你要查得出来谈何容易,你想
找到一本憨山大师《圆觉经》的注解就很不容易。将来你在光碟里面,你想
看看古时候的大德究竟对这个名相怎麽解释,它在里面一下子就出来了。所
以对将来的人研究佛经,我觉得实在可以方便很多很多。这一个也实在是我
们推动这件事的主要目标。

—————————————————————————————————

    吴宝原:沈博士你也知道,以目前的中文系统只能造五千八百多字,我
们或弥勒内院的师父会不会耽心以後这五千八百多字真的不够用?另外版权
的问题,现在比较流通的藏经是日本的大正藏,那如果我们用大正藏来输入
电脑,有没有版权的问题?

—————————————————————————————————

    沈家桢: 我只晓得一个事实,  星云大师在西来寺本来有  Professor
Lancaster 帮他在做大正藏的输入工作,准备制光碟,做了两年停下来了,
其中一个主要的问题是日本抗议,说:「大正藏是我们的版权,你不能弄。
」这个我晓得,至於对不对、是不是,我就不敢讲了。

    不过对於版权问题,我们要注意一点,所谓大正藏的版权,实际上并不
是指整部大正藏的内容,内容是没有版权的。编大正藏的这些人加上去许许
多多注解,这才是他们的版权。譬如说,只输入经的正文,没有版权的问题
;如果把它整部大藏经用扫瞄机扫进去了,这就有问题了。

—————————————————————————————————

    某听众:刚刚沈博士讲得很好,佛经的经文本身没有版权,版权是释迦
牟尼佛的。所以经典本文是没有版权问题,人家写的那个注释才有问题。

    我有一个建议,我不晓得慧炬本身有没有 BBS,或者说我们可以考虑请
求中央研究院的协助,因为现在 INTERNET 在全球很方便,如果中央研究院
肯协助的话,我们可以把资料放在它的电脑里面,那麽所有网路上的任何一
个使用者,因为它是 OPEN 的,大家都可以从它那里抓资料,然後去把他个
人的心得、注释写在里面。 如果慧炬有 BBS 的话,在家有 PC 的人就可以
直接上线;慧炬希望会员做什麽事的话,直接在上面公布出来;就是说我现
在有什麽工作要人家来做什麽事情,然後已经完成了什麽工作,大家就不会
重复了。像这样有个好处,就是不必定时开会,只要直接上站,我就知道现
在的进度到哪里、我该做的是什麽,我想这样也可以集思广益。而且不是会
员的人在网路上也可以插一脚,不一定是会员才能够来做这件事情。据我所
知, 政大图书馆的 BBS 站里面就有佛经的一些注释在里面,但是不是我们
需要的我不知道,也就是说目前大学有人在做这方面的工作,有很多大学生
可以参与。

—————————————————————————————————

    沈家桢:这位大德讲得很对,我想将来所谓的 INTERNET 总归是必经之
路。主要一点,我常常讲的我们四个困难里面的一点,就是正确性、可靠性
,这是将来的一个大问题。假定说,有一位同学用 INTERNET 把一部佛典广
送各地,它的可靠性能到什麽程度?这是将来我们最大的一个问题。因为第
一,释迦牟尼佛本人没有写东西;第二,就是释迦牟尼佛那时候写的东西,
很可能现在已经不存在了,被破坏了,正确性实在是一个问题。所以佛经大
部分都是後人写的,而经过这些年来的改变、破坏。

    譬如说《金刚经》,我对《金刚经》近几年来用功比较多一点,《金刚
经》在开始时,须菩提问「应云何住,云何降服其心」,後面也有「云何应
住,云何降服其心」,但是我们所有的流通本,前後都是「云何应住,云何
降服其心」。因为一个字的上下不同,解释就变了很多,许多大德就想尽脑
筋来注解为什麽这两句都是问的一样。有的是著重方法来解释,有的说第一
句的意思浅、第二句的意思深,有各种解释,就因为这一个字的不同。後来
江味农居士做了很多校对考证,他的校正本里面写前面问的是问「应云何住
,云何降服其心」,那时候就是说发了阿耨多罗三藐三菩提心,应该如何保
持,如何降伏妄心。後头问的「云何应住,云何降服其心」,就是问说为什
麽讲什麽东西什麽东西都是虚妄的,而叫我们还是要用阿耨多罗三藐三菩提
心。所以後半部中,就特别强调没有阿耨多罗三藐三菩提心可得,也根本没
有阿耨多罗三藐三菩提心可发。

    一个字的差别,就有这麽不同的意义,这是我们将来一个很大的困难。

—————————————————————————————————

    邱大刚:我觉得刚刚那位居士的意思是说我们可以用 INTERNET, 譬如
说美国和台湾这边可以立刻连线。像我从台湾送一封信到美国,假如用电子
邮件的话,可能不到一分钟的时间。假如美国庄严寺要从中央研究院得到资
讯的话,可以直接由中研院把资料传到美国去,一分钟的时间就可以传到,
主要是这个作用。

    另外就现在网路上已经有的资源来说,有人常常有用电脑抄经的习惯,
经部大概有一百多部经,不过校对是不太严谨,我觉得这可以用来做原始资
料,就是说等於跟 OCR 是平等地位。因为现在用 OCR 输入的经典,一般来
讲辨识率不到九成;假如用这个的话,错误率一般是不到百分之一,所以用
已经有的档案来做会省很多的时间。当然在校对之前是不能让一般使用者传
回家的,但是我们可以用 INTERNET 来做一个很好的沟通,也就是美国跟台
湾可以有互相连线的作用。

—————————————————————————————————

    沈家桢:各位能不能看得出来,这就是我们前途的希望。我今年八十三
岁,这位朋友,你几岁?十八岁。十八岁的人思想已经到这麽样一个程度,
我这个八十三岁的已经算是了不起了,还拼命跟在後面跑。所以这是我们的
前途,各位要掌握住这个前途,只要掌握住这个前途,佛教就跑在前面。这
个是我们功德会要想推动的目标,我很谢谢你,十八岁了不起!

—————————————————————————————————

    某听众:据我了解,在中央研究院历史研究所那边有《大正藏》在里面
,或其它的地方,像佛光山都有。目前我们功德会这里,如何想办法收集,
不管是个人或出版界或研究单位,收集这些已经打进去的资料,然後来减少
输入的时间,在这方面有没有一个作业的程序?

—————————————————————————————————

    沈家桢:我们在这方面还只做了一小部份,所以这次到台湾来,也希望
慧炬能够把这些事尽快的促成。也就是说,台湾个人或团体、学校在做的东
西很多,但是到今天为止,这些大德、团体都没有连系起来,都是各做各的
,这样就浪费了很多时间,也使这个事情做不大。所以,怎麽样能够使大家
把这个力量合起来,是当务之急!

    我在美国四十七年,觉得中国人有一个最大的缺点,就是都要做老大,
都很难跟别人合作,所以团结不起来。看看日本人或者是朝鲜人,团结的力
量都比我们强得多。这是在美国一个地方,我想沈乃宣先生对这方面的经验
很多。在同一个地方,韩国店往往是一大群,很团结;中国的就不行,中国
的这个店就骂那个店,那个店就骂这个店,互相批评。这一点当然不是说一
朝一夕可以改变,但是我们要了解有这样一个缺点,要怎样才可以避免这个
缺点。

—————————————————————————————————

    杨毅:刚刚沈博士讲的很多问题,我想我可以回答,但我同样有很多问
题要请教。在这之前,我想请教谢清俊教授有没有在这边?杨国屏博士有没
有在座?都没有过来!在回答一些问题之前,有几个问题想请教一下。

    在藏经光碟化以後,光碟我们是以免费赠送的方式,还是以销售方式来
推广佛法?因为问题很多,我可能讲起来可能会有九个问题,恐怕你们会记
不住,所以我一个一个问,你们一个一个随意回答。不晓得目前有没有这个
决议?

—————————————————————————————————

    沈家桢:实际上并没有一定的规定。目前,我们是以收回成本为原则,
以流通佛法为宗旨。所以假定今天各位大德有许多捐款,单是靠捐款就可以
了。像这一批西藏文的东西,它就是赠送的,赠送了一万多片出去。所以这
第一个问题,实际上等於是以赠送为目标,以收回成本为原则。

—————————————————————————————————

    杨毅:第二个问题是说,虽然是赠送,不过是功德会发展出来的,虽然
是集众人之力量,那还是会有版权的问题,版权是属於我们的,别人引用的
时候,我们是免费让他引用呢?还是要跟他收取若干的费用?

—————————————————————————————————

    沈家桢:免费。照我了解,对不对我不晓得,光碟你自己也可以拷贝,
对不对?

—————————————————————————————————

    杨毅:免费让他引用,即使对方是商业单位?譬如说我是一个电脑科技
公司,我想现在佛法满兴盛的,我想赚这个钱,那麽我自己发展软体,我就
引用我们(指功德会)资讯库的资料来卖东西。那这是属於商业化行为,可
是他是用我们的资料,像这种情况要不要跟他收费用?

—————————————————————————————————

    沈家桢:ROACH 所做的,它上面是写著有版权的,不过实际上他都是送
的。这一点我们现在没有公定的方案,不过照我个人的见解,既然我们的目
的是希望流传佛法,那麽有更多人流通,岂不是众生得益更多?有人为得合
理的利润来流通,只要有人向他买,那於无妨,当然不希望因为这样子使得
某个人增加他的贪心,因此只要我们的经济力量能够支付,我觉得尽量赠送
,或者尽量照成本计算,那数目就很小。

—————————————————————————————————

    杨毅:您讲了很多事情,讲了很多问题,我现在大概可以回答一下。对
!另外还有一个问题,美国现在佛经电脑化是用什麽中文系统,是用什麽内
码?是用倚天系统的BIG-5内码,还是用什麽?

—————————————————————————————————

    沈家桢:我们是用BIG-5。

—————————————————————————————————

    杨毅:那麽是倚天或国乔这方面。

—————————————————————————————————

    沈家桢:你不要问我太TECHNICAL的东西,我真的会答不出来。

—————————————————————————————————

    杨毅:我想电脑化最主要的问题,刚开始可能就是版权问题,我想这个
没问题;第二个就是输入的问题,您也讲了好几个方式;第三个就是 AP 应
用软体的问题,要怎麽样输入才比较快的问题,目前你们在美国用的是哪一
个输入软体?是用汉书、PE2,还是用 WINDOWS 里面的软体?

—————————————————————————————————

    沈家桢:差不多现在都有, 手工输入的也有, 我们一共有六台扫瞄机
。

—————————————————————————————————

    杨毅:我想各自发心,软体应该没问题,主要是取得这个资料,资料能
够共通嘛,是不是这个意思!

    关於缺字的问题, 因为 BIG-5 是五千八百多个字,我们台湾公会码的
造字档是六千多字,刚刚弥勒内院也讲过正丰的造字超过五千多个字,所以
我们可以了解 BIG-5 这个东西不能用,用了以後会有很多问题, 因为它的
字(造字码空间)不够,所以说要找一个容量比较大的东西。

    这个问题,我自己有找一些平台厂商,目前全世界解决的方式,据我所
知有两种方式,一个是 UNICODE,它是 ISO10646 的 BMP。ISO 本身的规格
是四个 BYTES,可是目前这 UNICODE 是由 MICROSOFT 率领其它 AP 的软体
厂商加以制定,他们以後要 SUPPORT。目前我们软体是用 ASCIICODE,是属
於美方的标准,它是一个 BYTE,在台湾的几个内码, 有 BIG-5,还有 TCA
——就是公会码, 还有 SHIFT TCA ——就是倚天码,我们常用的是 BIG-5
内码。 这个 BIG-5 不能用嘛,所以解决方式就是用 UNICODE,它本身能够
定义的字,据我所知有六万四千多个字,它可以做世界上各种文字的交换。

    在软体 AP 方面,AP 目前据我所知, 好像还没有 SUPPORT UNICODE,
可是这个系统已经有了,好像是 WINDOWS NT,它是属於一个 SERVER,是用
在网路上面的。 目前刚刚出来的 WINDOWS 95,它本身存取的是四个 BYTES
,不过据我所知它没有 SUPPORT UNICODE。

    所以说, 我们解决的方式,第一个要用 UNICODE 内码去做中文输入,
而且同时它可以做世界各种文字的输入,那麽藏文、梵文、巴利文等文字的
藏经都可以收进去, 那就不会局限於只是单纯的 BIG-5 中文不够,这是第
一种方式。 第二种叫 CCCII 内码,这是由文建会的国字整理小组所整理出
来的,目前这个工作据我所知已经移转到中央图书馆电脑组,我跟里面电脑
组的主管宋顾问连络过了。

    在台湾目前用的内码,以後扩展性比较大的有两种。一种是属於 CCCII
内码,这是用在图书馆系列,美国图书馆他们承认,他们称之为 EAC , 里
面的藏字有二万一千多个字,是用撷取 CCCII 内码的字集去做的; 他们现
在给了一个 ANSY,名字我忘了,不知道 Z 多少,也就是说美国他们用中文
字的话,  是把  CCCII  内码的字型借来用, 所以说这个内码有长久性。
CCCII 内码本身是三个 BYTES,它能够定义八十三万个字, 比 UNICODE 还
多,但是比 ISO10646 的规格要少。我记得 ISO10646 可以定义一亿多个字
,有多少要算一下才知道:(一)共有 Groups 7F 个( 112 个)。(二)
每个 Group 有 Planes FF 个( 256 个)。(三)每个 Planesjb 2256 ×
256 个 Cells。(四)共得 1879048192 个 Cells。(五)第(四)项未扣
除禁制码,所以它能定义非常多。

    另外一种扩展性比较大的是,你可能不知道,前两年台湾要整合户政系
统、医疗系统以及教育行政系统的一些资料,譬如说我们姓名什麽的,很多
字都打不出来,台湾各区就各自造字,现在要整合了,整合的结果是彼此的
造字都没办法沟通,也像是我们现在面临的问题。所以政府现在发展一个叫
做 CNS11643,它本身就是一个国标码,是国家承认的一个码。 它本身也是
TWO FOUR BYTES,它的第一、二字面是 TWO BYTES,我记得全部有十七个字
面,目前已经用了七个字面。它目前的造字,前一阵子是四万八千多个字,
现在据说已经有六万五千多个字。

    CCCII 本身已经扩展到八万四千多个字,这个资料已经取得了;可是在
系统方面,目前只有五万八千多个字。

    我再整理一下。可以用的方式就是 UNICODE,可是它没有 AP 软体,你
没办法用,也就是说,即使我现在让你用,你也没办法用,恐怕要等两、三
年以後才能够去做输入,所以这个可能以後要做转码工作。

    第二个就是用 CCCII,我刚从厂商那边过来,他们现在有一个汉书,汉
书我们通常都用在 BIG-5 码,可是它现在已经发展 CCCII 的版本。不知道
你们美国有没有用汉书,它满好用的,它是一个 EDITOR。 如果做中文输入
,除了 OCR、金声三号语音输入没办法以外,你用 KEYBOARD KEYIN 的话,
可以用汉书,因为在 CCCII 上面它可以做了。 而且它缺字的情况可能不多
,它里面含有五万八千多个字,像富有的「富」,上面少一点,我看过的经
典上面有过这麽一个字, 我去看 CCCII 厂商发展的平台,我发觉它也有这
个字,称为异体字,我们通常常用的叫做正体字;所以它有五万八千多个字
,比我们造的两万多个字、BIG-5 的一万三千多字还多,我想我们就不用造
了。关於它本身的售价方式,我慢慢来报告。所以说,目前的解决方式就是
用 CCCII,而且它已经有 AP 了。我想大家如果采用这个系统内码的话,可
以解决这个困扰。

    它还有一个好处, 它本身可以转码,就是你目前已经在 BIG-5 内码里
面造的字,我们不是面临大家都不一样吗?中央研究院、佛光山都不一样,
那麽它可以转码,把码直接转到 CCCII 系统里面; 也就是转过去以後,大
家只要把这个码稍微对一下, 就没有什麽问题了, 可是它的限制是 24 ×
24 的字。

    这是关於内码方面以及缺字方面的问题。

    之前有讲到需要 CDROM 的母机,这个在台湾满多的, 有二倍速、四倍
速,PHILLIP 二倍速的大概九万六千多元就可以,所以这个在台湾都不是问
题。这个厂商的资料、电话我可以提供。

    还有你讲到这光碟明年可以在电视上看到里面的资料,现在台湾这个也
可以看到了,在电脑上面播放的节目,电视上也可以看到,现在已经有这个
东西,不用等明年。

    刚刚有莲友建议做 INTERNET,INTERNET 也是面临到内码问题。他的问
题就是说, 第一个,INTERNET 在台湾目前要登记,而且我记得化育文教基
金会和慧炬在凯讯里面有一个 W3 的节点, W3 本身是建立在 INTERNET 的
上面,但是据我所知 INTERNET 跟 W3 目前在台湾都要登记,那明年可能有
厂商会 SUPPORT (指有 CCCII 内码的系统及软体),可是,可能是明年的
事情。即使说现在大家能够登记,可是不一定每个人都会登记,那是要金钱
的,每个月要花一些费用的。大家做事情发心可以,花钱有时候就不一定。
即使能够做到,还是会有问题,就是说有很多字你仍然打不出来。所以说,
我这边有一套能够打出所有字的系统,你那边也必须有一套才可以,这样子
彼此才能够沟通,否则我这边能够有五万八千多个字,你那边没有,你那个
是 BIG-5 一万三千多个字,你就打不出来,所以这个是彼此都要的。

    我们还提到要请中研院来做资料传输,据我所知,谢教授本身就是中研
院史研所的主持人,我跟他们连络过了,他们是属於公家单位,我们是佛教
团体,他们只能说在他们工作□围之内 SUPPORT 我们, 就是说刚好,他做
古籍检索,佛教在这方面科判比较详细,所以他直接弄佛教的,但并不表示
他会为我们做事;我问过他们,因为他们领公家的钱,替我们做事比较不恰
当,但是如果刚好工作项目重叠,他可以服务,这是他们的立场。

—————————————————————————————————

    沈家桢:你讲的东西都增加我们了我们的信心和乐观,有许多问题都已
经解决或将要解决。我现在有一个要求,就是可不可以把你的通讯地址留下
来。

—————————————————————————————————

    杨毅:我已经留给慧炬了。

—————————————————————————————————

    沈家桢:这样太好了,我们在美国的几位负责人可以跟你连系,以得到
你的许多指导,我们要保持连络。

—————————————————————————————————

    杨毅:因为我还有一些问题没有问,我还有一些建议。我觉得问题实在
很多,您且听一下。

    我们目前是以什麽藏为主来做电脑化?大正藏?乾隆藏?或高丽藏等等
?我收集的资料,目前有二十六个藏,加上日本最近有一个新的叫做刷版藏
,共有二十七藏,所以我们是先以哪一个藏来电脑化?我想这个您应该先思
考,要不然的话,以後电脑化的时候,变成乾隆藏一部、碛砂藏一部、龙藏
一部、北藏一部、南藏一部,变成大家所取的地方不一样。以後新出来的资
料我们是不是要给它称一个藏别?譬如说叫「慧炬藏」。所以我们现在要先
决定到底用哪一个藏入电脑化,这是第一个问题。

    第二个问题是,到底要有几藏?我们一定要入几藏?因为每个藏的版本
不一样,虽然大部分是一样的。

    沈家桢:一个一个来好不好!藏经大部份都有版权问题,所以我们第一
阶段,也是目前的重心,是放在工具书上。一部是丁福保的《佛学大辞典》
,一部是《佛光大辞典》,还有一部是《中华佛教百科全书》,就是传道法
师他们在做的,它已经印好了。到现在为止,丁福保的大辞典,我们已经全
部输入了,正在做最後的校对;佛光山的佛光大辞典曾得到星云法师的同意
,他们也不要版权,可以放到我们的光碟里面去,不过现在还不敢讲究竟它
什麽时候可以完成、什麽时候可以放到光碟里面去。

    前天我们到传道法师那边看他的四库全书,做得很不错,他也同意把这
四库全书全部放到光碟里面去。这是在我们眼光里面所谓的工具书,尽管是
大藏经,或者是任何经典都一样需要工具书。还有一本我们就要做好的,是
《翻译名义集》,也是一本工具书。这许多工具书,在每一张光碟里面都需
要放进去,不论是《金刚经》、《阿弥陀经》或任何经论都需要基本工具书
来查名相。这几本工具书可以说是我们现在力量放得最多的。

—————————————————————————————————

    杨毅:也就是说目前大藏经还没有电脑化,现在是做工具书吗?

—————————————————————————————————

    沈家桢:其它的佛典则是零零碎碎的在做,主要的是迎合会员的兴趣及
专长,所以各种经典、经论都有,大藏经里的也有。

—————————————————————————————————

    杨毅:我想其它问题,我把我的一些意见提供出来参考;我提一些自己
的建议,那其它的问题也就迎刃而解。

    我认为,一个资料弄上去,那是死的,死的本身比较没有什麽作用,让
我们看出来只是一部藏经而已,就像我们看书的藏经一样,那就是藏经而已
,它本身不能给你一些解答。所以说,我建议要做另外一个软体,就是谢教
授他们做的那个在  WINDOWS  里面的检索软体。  可是它的软体本身是  2
BYTES,2BYTES 本身有一个问题,还是有字不够的问题。目前可以先用那个
,可是以後要有一个专责单位。

    这个专责单位就是您现在成立的这个藏经电脑化的单位,它负责维修。
也就是说,现在我们用的资料是一种存取方式,也许过十年以後有更进步的
记忆体存取方式,你目前的存取方式可能就不适用了。我做过比喻,现在你
这个藏经是放在图书馆右边的这个门,我们现在进去拿这个资料一定是走右
边的门,可是十年以後大家不用右边的门了,觉得走右边的门要经过很多障
碍,不方便,会跌倒,会怎样一大堆,现在我开左边一个门,可是很麻烦,
左边的门一开,里面没资料,我们的资料是放在右边的,这是目前记忆体存
取方式的一种。所以可能过若干年以後这个就已经落伍了,当大家都不用这
个存取方式的时候,大家用的软体都不是这种方式的时候,你要流通可能就
比较不适用,所以说要有一个专责的维护单位,它依照每年的电脑发展去做
若干的修正。这个维护单位就需要一些费用,如果是兼职的人,做事情零零
落落,进度也会很慢,不是不能做啦,会有点慢就是了。所以说要有一个专
责单位,那个专责单位可能就需要专家,这些人的费用可能就是一些发心的
人来做,生活费支持得过去就可以了,不过那个还是需要费用。这是第一个
问题。

    我刚刚说我们要做另外一个检索软体,我把它的叫做「阅读编辑器」,
它除了能够阅读资料以外,第一个功能是检索。第二个功能是比较,可能是
龙藏跟大正藏要比较,我看这个《大正藏》有问题,我把《龙藏》叫出来;
假如我们已经有很多藏经入藏,那麽我可以比较。说到这里,其它的藏经要
电脑化,是不是变成二十六套都要电脑化?我要比较二十六套啊,我这个人
的知识比较不一样啊,你的程度比较深,所以我要比较好多套,因为我比较
有学识。如果他要比较那麽多套的时候,我们是不是每套都要入电脑化呢?
不用!谢教授用 ISO 好像 9077 SGML (正确为 88 79 ), 它是一种检索
方式的规格,那个资料谢教授他们可以提供,它本身可以把同样的一个内文
键入,我们不用再重新做, 我们在 AP 上面设一个 API 、一个 INTERFACE
,就是一个介面,然後直接把内文引用出来就好了。实际上我们二十六套全
部入电脑化,顶多是做两藏的功夫,我相信大概只有这样子而已,这样二十
六套就全部都可以电脑化。这是第二个功能。

    当然它还有其它的功能,除了阅读、比较、检索,另外我们可能要下注
解、我们自己看的心得,所以说要有编辑功能,这个我称为「阅读编辑器」
。我想这个可能需要做,这样我们才能够迅速把佛法流通,否则我们看的话
仍然是看不懂,只是说存取携带方便而已,仍然没有多大意义,没有人来解
释。所以,我们可以在藏经电脑化以後,请一些高僧大德、对佛学比较有研
究的来做注解,也就是提供一个注解功能,可以把高僧大德的注解叫出来。

    可能有的第四个功能是把它白话,譬如说「佛教资讯」,他不懂「资讯
」的意思,那个「资讯」这两个字就对应到一串字列,譬如说「资讯」就是
「资料的讯息」这五个字,然後这个白话一出来就全部都出来了,这个藏经
、《金刚经》全部白话都出来了。

    这个功能还可以做这个我刚刚讲的「富」没有上面那一点,我看不懂这
个字,可是我们 AP 里面有。这个功能,我们可以按个键把它直接转成现在
教育部部颁的正体字。这是属於阅读编辑器要做的方面。

—————————————————————————————————

    沈家桢:你了解得很多,这些功能将来恐怕越来越多,各式各样的功能
应该都包括在里面。

—————————————————————————————————

    杨毅:刚刚您讲过佛学字典已经弄上去了,这个在阅读编辑器里面也可
以做连结,连结後按个键,相关的解答就出来了。我有很多的问题,但大概
就是这样。我有很多计画,这个要一步一步来执行。大约是如此,可能还有
其它的,您讲一讲,我可能还有补充的。

—————————————————————————————————

    蒋启贤:目前我是在做一件管理资讯化的软体,这套软体是全 WINDOWS
的。目前我们做起来,这一套资讯化软体,我们感觉是做得相当的不错。刚
刚我有跟庄董事长谈到,未来如果在佛教里教学,比如说我现在这边,假如
这个是一个电脑的画面,主要的经文就在这个地方,那这边有英文、有日文
、有韩文、有泰文、有阿拉伯文、有法文都可以,然後只要这边经文按出来
之後中文就跑出来, 跑出来後我这边用一个指头,就是那个 SENSOR,指一
下法文,法文就能够针对这段自动翻译出来;教学以後再撷取,这一段的中
文是怎麽样,然後它的日文是怎麽翻译,指一下日文就跑出来。

    历届祖师大德对这些经文里的一些重要注解,就直接在这边有一个小视
窗,翻出来看这一段经文,第一代的祖师大德他所讲的就在这个地方,很容
易就跑出来。

    另外关於造字的问题,未来假如这个字造错了,那要怎麽办?我们可以
,假如这边打一个新的字进去,只要电脑里面有这样的错字,现在全部转变
成一个正确的字,整个资料库就可以重整。万一以後你造字造错,没有关系
,你说这个字错的话会误导大家,那资料库可以重整。所以我们的字未来好
像就是 R11、R12,或是 WINDOWS 第几版、第几版,一直在更新,更新到最
後,我们的错误率几乎就没有。写出来的软体一定会有 BUGS,BUGS 很难避
免,但是可以慢慢修正。

    目前我们这一套资料库是美国非常有名的公司叫做 UNISYS 公司的,我
想沈博士大概知道。 我们用过其它的 WINDOWS 资料库的软体,IBM 或是其
它任何 WINDOWS 都比不上这一套。

    关於印表,假如我针对<法界品>,要把<法界品>的日文印出来,马
上就可以印表,很方便,印出来就是你实际的资料。

    我感觉这个资料库很好,我不知道沈博士这边是不是在规画,未来想让
这样的佛教教学软体做到全世界各种语文都能够容纳在里面,历届祖师大德
的注解都在里面,而且要资料库重整或印什麽表很容易来执行。我感觉这个
资料库不错,因为这个是我目前在专业里面执行的,能提供大家一个参考的
资讯。

—————————————————————————————————

    沈家桢:各位看看,他们两位讲的东西已经是很专精很实用了,所以这
东西前途无量,但是前途也是种类繁多。我们怎麽样把这种力量合起来,而
且这个力量合起来了,要大家发心。所以我倒很希望将来慧炬分库能够来做
这个连系工作,今天只有两个钟点,只能谈一般性的问题,将来很希望这里
面有五位、十位大家聚在一起,有一个问题就大家来尽量交换意见。还有,
譬如他原来有一个公司,做这种营业,很可能他做出来的软体要卖钱,也可
以啊,要卖钱也是合理啊,他也许可以特别廉价卖这个软体,因为是佛教的
工作。

    我们要把这种力量尽量结合起来,这是将来的工作之一,我们可以早点
召开这种小组会议。

—————————————————————————————————

    杨毅:关於引用佛教资料商业化,倒是有一个 IDEA。 我们可以制定各
国当年的国民平均所得的千分之一以下,这个软体卖的费用是这样子,台湾
是一万块美金的话,千分之一就是十块美金,十块美金相当於两百五十块台
币。如果这个软体他卖两百五十块的话,我们不收费;超过这个费用,我们
斟酌收一些费用。

    刚刚这位居士讲的那个资料库软体,它那个软体目前发展出来有几种文
字可以使用?

—————————————————————————————————

    蒋启贤:这个软体是一个系统,但是你可以做这样的一个编辑,它里面
就是空空的,是个平台。

—————————————————————————————————

    杨毅:它本身是用UNICODE的吗?

—————————————————————————————————

    蒋启贤:不是!它是用 UNISYS 公司的,目前都是用在银行。我现在举
个例子,比如说,今天的利率是八%,但是明天的利率要改成九%,全省的
PC 假如有十万台,你要怎麽用硬体去改,你没有办法, 现在就在总公司台
湾银行那边打一个键说明天的利率改成九点零%, 整个台湾省明天全部 PC
开出来就是九点零%的利率,它有这样资料库很好的功能,它最主要是一个
平台、一个系统。

—————————————————————————————————

    杨毅:因为我想我们这个藏经最大的问题是字的问题,你那个如果没办
法 SUPPORT UNICODE,以後还是会有造字的问题, 就是说会像 BIG-5 的情
况一样;虽然说它这个 AP 很好用,还是会有问题。

    我早上在厂商那边,  了解到那个厂商本身有做一个   CCCII  内码的
WINDOWS。 它那个 API 是一个介面,我们只要呼叫那个介面, 跟它 MATCH
相合的话,我们就可以在 WINDOWS 上面做编辑。 不过它只是一个介面而已
,我们必须再发展一个软体,就是一个 EDITOR 在上面用,这个软体在上面
用的话才能够用 CCCII, 不过它已经给我们以後一个在 WINDOWS 上面使用
的曙光。

    刚刚这个居士建议的,就是有内码的问题,我们必须再研究。

    因应佛经电脑化的问题,我可能发展一套输入法,我给它暂时的名称叫
「大师」。我这个输入法有两种输入方式,一种是各国专用,是中文就用中
文的专业方式输入,日文由日本的当地人专业输入,这样输入才会快;另外
一种是属於万国的输入法,我现在暂名为「大师通」,如果是中文就叫做「
大师中」,如果是日文输入法就叫做「大师日」,如果是各国的输入法就叫
做「大师通」,它可以打世界各国文字。

    我想有问题的文字大概是阿拉伯文,因为它可能字根会比较多;中文,
汉字最多,所以说在汉字系统上面发展出来的话,就能够解决世界各国的输
入障碍。它可以打中文、日文、韩文、简体字、印尼文、越南文、希伯来文
、阿拉伯文,世界各国文字都可以打。

    这是我因应佛经电脑化所发展出来的,我预计在半年以後出版。我准备
给个人的消费者免费使用,厂商就另外说,这是我目前所预计的。在这里顺
便讲一下, 我那个软体里面有一个叫「内码产生器」, 里面有一个内码的
TABLE 自动帮你对应,也就是说你目前即使用 BIG-5,以後你仍然可以对应
CCCII。 BIG-5 里面有一万八千多个字, 我只要每个字把它定义说到CCCII
里面是什麽字,以後你只要在里面转一转,只要我的输入法配合的话,即使
你用 BIG-5,仍然可以在 CCCII 里面打出来。 这是目前我为电脑化做的一
些事情

—————————————————————————————————
Fri Mar 29 17:41:44 1996
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org