看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1068/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: 一个总比没有好的简便组字法
发信站: (NEWS/INFO) National Sun Yat-San University (Tue Dec  9 11:46:15 1997)
转信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
来  源: buddha.nsysu.edu.tw

这个灵感得自前阵子读到德明的信,也有感於郁婷最近在扫瞄辨识作业
上的困难。

虽然 Heaven 说仓颉造字很有成就感,但对一些门外汉或短期从事电子
佛典工作者而言,他们对这个成就感兴趣缺缺,他们希望最好是通通打
大黑点,以便他们把手上的工作快快结束掉。可是,这大黑点却是留给
往後的缺字整理者一个大烂摊子。

对於大量作业初期的缺字处理,因为参与工作者未必有足够的专业知识
与热情,我们实在也不必过於苛求。於是我想,或许我们可将以往的组
字法加以简化,让一般人以普通的习惯即可将大部份缺字形容出来。因
为并不是精确表达,所以到後来还是要再做一次缺字整理,但实在比大
黑点好太多了,因此我戏称之为「总比没有好」的组字法。

这个「总比没有好」的组字法,其实行之有年,在过去很多人都是这样
玩。基本上,它主要还是建立在过去我们所习惯的组字法上,但是:

  1.省略 +-*/@()等符号:略去逻辑运算符号,以从左至右、从上至下
    、从外至内的原则,将缺字各组成字根输入。
    例如:[目*侯]          写成[目侯]
          [和/心]          写成[和心]
          [斗@(豆*寸)]     写成[斗豆寸]
          [门/(人/(人*人))]写成[门人人人]

  2.简化偏旁的表示:对於无法输入的偏旁部首,以现有文字依一般的
    认识来直接叙述。
    例如:[何-可+尔]写成[人尔]
          [徒-走+扁]写成[人人扁]
          [怡-台+在]写成[心在]
          [折-斤+只]写成[手只]
          [路-各+专]写成[足专]
          [陈-东+登]写成[耳登]
          [泳-永+替]写成[水替]
          [萌-明+朋]写成[草朋]
          [袱-伏+戒]写成[衣戒]
          [猿-袁+爰]写成[犬爰]
          [这-言+向]写成[之向]

  3.以问号来表示字根打不出来
    例如:[□-曼+弟]写成[?弟]
          [病-丙+乐]写成[?乐]
          [爵-(舀-臼)+(木*爻*木)]写成[木爻木四?寸]

反正,面对一个电脑打不出来的缺字,将这个缺字的字形结构分解成一
般相当的文字直接打出,有打不出来的部份就以?表示。这样子,尽管
没有交代上下、左右、包含等关系,但至少九成以上还是猜得出来,这
对以後的缺字整理是大有帮助的。

对於郁婷的作业,我希望她考虑一下我这个方法,让底下的工作人员采
用这个方法,凡是遇到电脑缺字,请不要以通用字代,也不要以大正藏
底下的校勘文字代,而是尽量以这套简便的方法保持住文字的原状原貌。

对於佛教藏OCR小组,作业时可以采用通用字。若没有通用字的,如
果你已经上路了,可采用之前所用的精确表示法;如果你还是不习惯,
没关系,但请至少得采用这个「总比没有好」的组字法。因为有了这个
新方法,所以之前所说「若缺字不好组,请打一个●来表示」,现在要
改成「若缺字不好组,请利用简便组字法并配合?来尽量表示」。

以下是一些应用实例:

  1.尔时,世尊食时,著衣持[金本],入舍卫大城乞食(金刚经)
  2.罗[目侯]罗、□梵波提、宾头卢颇罗堕、迦留陀夷、摩诃劫宾那、
    薄拘罗、阿[少兔]楼驮(阿弥陀经)
  3.其二沙弥东方作佛。一名阿[门人人人]在欢喜国(法华经)
  4.离[心龙]□心。不调故。发大车心(六十华严)
  5.□檀为[草积]。供养佛身。而以烧之(法华经)
  6.右膝[足胡]跪一心合掌。恭敬供养。作如是言(六十华严)
  7.鼻不匾[ㄈ?虎]。亦不曲戾。面色不黑(法华经)
  8.亦如众鸟类    出[士?卵□]音不同(六十华严)

最後,特别再声明,这是一个不得已的非常手段,专用在目前的几个非
常状况。我还是期盼一个让大家轻松愉快且成熟有效的缺字处理方式能
够早日诞生。

□□□□□□□□□□□□□□□□□
 摩诃工作室.吴宝原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□□

阅读文章: 第 1068/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org