您有新信

 
Re: 佛光大辞典光碟版=统一造字?
#1
发信站: 国立中山大学网路组 Mailing List (tpts1.seed.net.tw>, 信区: BudaTech)
以下这封信是昨天在连线网路佛教版发现的,可能 budatech mailing list的朋
友们看不到,因为很值得参考,所以我把全文都引了(技术犯规),并回应於信
末。

  huiqun@usa.net wrote:

  大家都热切希望中文系统到头来不再是现在这副德性,但还要等待多久?未实现
  之前怎麽办?大家都希望有一套统一造字,却人人都有一套自己造的字。如果都
  不肯采纳一个共同基础,何来统一造字的力量?

  如果大家认为FK-DICT已经走出了一步,日後仍会继续使用FK-DICT和其他
  FK-XXXX等电子书的话,便该接受FK-DICT的造字档(下称FK-EUCD),因为
  FK-EUCD会如影随形的挂在大家的系统里面。现在教界散布著许多造字档,不
  见得FK-EUCD是较佳的版本。但由於FK-DICT和日後FK-XXXX等电子书的
  实用性,不妨就先以FK-EUCD作为基础,大家同心协力把统一造字这个美梦实
  现。(其实是希望大家一起设计慧开法师和慧瑞法师,藉此因缘把统一造字的担
  子推给他们!)

  弟作了一点功课,愿与大家分享。但才疏学浅,一气呵成又懒得回头检查,故不
  免错误百出,请大家不吝指正。解开夹档FKEudc.zip(23KB如夹不上请来信索取)
  便得下列四个附件要正确阅读附件,必须已挂上FK-DICT之Win95造字档
  eudc.euf(1424kb)和eudc.tte(1077kb)。没有FK-DICT的人其实也可以,只要请
  佛光山把eudc.euf和eudc.tte放到网站让大家抓便行。有版权耶,不要叫我传给
  你,尤其是加起来2.5MB。

  一、附件 Repeated.txt :
  FK-EUDC造字2653个,其中汉字1925个,梵字、日字、符号、其他共728个。
  弟只能处理汉字的部份。1925个汉字中,弟认为有77个与内建字重覆,及185
  个造字交互重覆,即共有262个重覆。弟大胆删除,请大家提供意见。

  二、附件 SuCheng.txt :
  扣除262个重覆字後,实剩的汉字有1663个。弟不自量力,每个字都订了「速
  成」输入码,请大家提供意见,修正後大家都可以利用此等输入码来抓字。尤其
  中注有38项疑问处,更请特别注意。

  三、附件 SuCheng.tbl :
  弟透过Win95的造字程式,把暂订的1663组「速成」输入码按SuCheng.txt逐一
  键入,产生了关联档SuCheng.tbl。大家用Win95造字程式把SuCheng.tbl挂上
  後,全部1663个字都可以用「速成」输入法抓得到。由於弟只会土法□钢,或许
  键入时打错字,又不懂如何可以事後编辑*.tbl档案,所以如果有抓不到的字,
  请检查一下其关联码是否错了。(会事後编辑*.tbl档案的请赐教一下。此外,
  弟会"修改"个别造字的关联输入码,但不懂如何"拿掉"之。会的人也麻烦教一
  下。台湾微软有够user_friendly!)

  四、附件 Similar.txt :
  在1663个字中,弟有察觉相似,随便摘录下来有138个,分别是与内建字相似
  的56个,及造字交互相似的82个。除此以外,其他相似的字和走了眼的当然还
  有很多,这些都只是浏览一下随便摘录下来的,给大家有空时研究一下。

  弟只是抛砖引玉,希望这一步经过大家合力整理後,成立一个有实用性的共同基
  础,大家可以称之为FK-EUDC_v.1.0或什麽的。更请佛光山慈悲采纳,并在日
  後应用在其他FK-XXXX电子书中,和陆续推出FK-EUDC修订版。下一步当然
  盼望把造字分类,及按部首和笔划重新编排次序,使应用上更一目了然。只要大
  家有个共同基础,也就是一样的造字档,不怕日後一再修订,只要用一个自动转
  码执行档便行。最後更希望能帮字型整容一下,让其大小粗细比较整齐,登其大
  雅之堂。就这样子,见笑之处请大家包涵

--------

很佩服huiqun的研究态度及实作精神,刚看了 FKEudc.zip 里的四个档,我想这
一定带给佛光山很大的帮助。竟有人抓出这麽一堆的重复字及相似字,在下很好
奇huiqun的「土法炼钢」有何巧妙之处?

佛光山是很有能力及意愿来从事电子佛典事业,但这并不是说以後中文电子佛典
就只此一家、别无分号。早在佛光辞典测试版出现前,沈家桢居士所发起的「资
功会」(EBS)已生产了「金刚经专集测试版」,而其正式版近日也发行了(
目前仅限於北美地区),为了进一步测试,我手上就有这麽一片。所以,我的电
脑早些日子是安装中研院造字档,前阵子是安装著佛光山造字档,昨天开始改安
装资功会造字档(大概是目前最漂亮的佛典点阵造字档),好不热闹。可以想像
得出来,在未来各家中文电子佛典纷纷出炉後,我们对於造字档的改装一定得要
非常熟悉不可。这让我联想到,倒是可以写一支中文造字档改装小程式,只要按
个钮、点一下就OK了——熟悉 WINDOWS程式设计的人可以开始动手做做看哦!

如果佛典造字档真是无法统一,上面所说的造字档改装程式就不是笑话。

说到「大家一起设计慧开法师和慧瑞法师,藉此因缘把统一造字的担子推给他们
」,这个公开的阳谋,各位以为如何?

想过去这一、两年,为了佛典造字问题,参加了几次由中研院资讯所及台大佛研
中心合办的研讨会。个人赞同将这个问题交给教界与学界合作解决,由教界提供
实务资料,让学界去分析整理。目前的状况是,据我的了解,中研院早已完成佛
典补字集(现置於台大佛研中心 WWW),算是已经完成其阶段性任务,但是最近
先後出版的「佛光辞典」及「金刚经专集」两片光碟并没有采用中研院这个造字
档。为什麽会这样?我不想妄加揣测,也许当事者有其不得已的苦衷吧!

我们都理论的知道统一造字档对於中文佛典的资讯交换非常重要,但是过去有关
这方面的资讯交换量并不大,所以尽管我们叫叫叫,但其实尚未感受到什麽痛□
,所以好像还刺激不到「运动神经」。现在,逐渐开始了,当电子佛典成品越来
越多时,那个痛苦的感觉越来越明显;当时候到了,或许大家就会比较清醒的知
道该起来做些什麽。

                                                          maha 6/30/97
Mon Jun 30 12:40:27 1997
回覆 | 转寄 | 返回

Re: 佛光大辞典光碟版=统一造字?
#2
发信站: 国立中山大学网路组 Mailing List (tpts1.seed.net.tw>, 信区: BudaTech)
huiqun@usa.net wrote:
> 
> 关於你的「败在速成」,弟做了如下「土法练钢」式实验。

(抱歉!以下若全引会过长,只好略掉。)

我家里另有一台电脑,是我太太在用的。她的95版本比我的还新,我的是
4.00.950a,她的是4.00.950B——也就是所谓的「OSR2」版。今天偷跑去
她的电脑测试以上这个问题,结果以我之前使用 reg的方法,很顺利的把
「速成」搞定了。所以,不知道这是因为我这个95版本的 bug?还是因为
我的95环境玩得太复杂了?能不能请您到[控制台]/[系统],把您的 95版
本让我知道?

另外,在造字程式里欲汇入 tbl时,[连结]跟[批次连结]有什麽重大不同
?我这里常在[批次连结]时当机。微软在这里的使用说明,实在找不到只
言半句!

> 关於「拿掉个别造字的关联输入」,并非拿掉整个.tbl档连结:
> 1. 以为「佛」字是「人中」,所以抓不到,跑去自造一个。
> 2. 造好了,给它输入码:
>     编辑=>连结=>「人中」=>空白键=>登记。成功!
> 3. 错了,「佛」字应该是「人弓」,好在可以修改:
>     编辑=>连结=>「人弓」=>空白键=>登记。改了!
> 4. 不对,原来「佛」字内建已有,如何把自造的拿掉?
>     唯有将它涂白,变成没有笔划的「  」字,而非没有字???
> 5. 再把输入码拿掉:
>     编辑=>连结=>删除「人弓」=>登记.........不行???

我试了试,确实这时候无法把此一内码的输入法整个拿掉,只能合理修改
,不能删除。这真是一个缺失。不知道 win3.1以及DOS版倚天中文的情况
怎样?对了,您那边的电脑是不是有DOS版的倚天中文以及中文版WINDOWS
3.1 ?您知道这些使用者造字档的输入法表(.tbl),是不是从倚天中文
到win31到win95,都是一模一样的格式?

最近我会针对上回您所提的问题,也就是如何编辑 tbl档,去查一些资料
看看。您若有什麽心得,敬请公布给budatech的朋友们参考。在budatech
这里,请不要有献丑不献丑的问题,只要是为了解决问题所做的思考与努
力,都是值得发表并受到注意的。

                                                     maha 7/8/97
Tue Jul 8 17:10:24 1997
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org