看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 1068/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech 标 题: 一个总比没有好的简便组字法 发信站: (NEWS/INFO) National Sun Yat-San University (Tue Dec 9 11:46:15 1997) 转信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail 来 源: buddha.nsysu.edu.tw 这个灵感得自前阵子读到德明的信,也有感於郁婷最近在扫瞄辨识作业 上的困难。 虽然 Heaven 说仓颉造字很有成就感,但对一些门外汉或短期从事电子 佛典工作者而言,他们对这个成就感兴趣缺缺,他们希望最好是通通打 大黑点,以便他们把手上的工作快快结束掉。可是,这大黑点却是留给 往後的缺字整理者一个大烂摊子。 对於大量作业初期的缺字处理,因为参与工作者未必有足够的专业知识 与热情,我们实在也不必过於苛求。於是我想,或许我们可将以往的组 字法加以简化,让一般人以普通的习惯即可将大部份缺字形容出来。因 为并不是精确表达,所以到後来还是要再做一次缺字整理,但实在比大 黑点好太多了,因此我戏称之为「总比没有好」的组字法。 这个「总比没有好」的组字法,其实行之有年,在过去很多人都是这样 玩。基本上,它主要还是建立在过去我们所习惯的组字法上,但是: 1.省略 +-*/@()等符号:略去逻辑运算符号,以从左至右、从上至下 、从外至内的原则,将缺字各组成字根输入。 例如:[目*侯] 写成[目侯] [和/心] 写成[和心] [斗@(豆*寸)] 写成[斗豆寸] [门/(人/(人*人))]写成[门人人人] 2.简化偏旁的表示:对於无法输入的偏旁部首,以现有文字依一般的 认识来直接叙述。 例如:[何-可+尔]写成[人尔] [徒-走+扁]写成[人人扁] [怡-台+在]写成[心在] [折-斤+只]写成[手只] [路-各+专]写成[足专] [陈-东+登]写成[耳登] [泳-永+替]写成[水替] [萌-明+朋]写成[草朋] [袱-伏+戒]写成[衣戒] [猿-袁+爰]写成[犬爰] [这-言+向]写成[之向] 3.以问号来表示字根打不出来 例如:[□-曼+弟]写成[?弟] [病-丙+乐]写成[?乐] [爵-(舀-臼)+(木*爻*木)]写成[木爻木四?寸] 反正,面对一个电脑打不出来的缺字,将这个缺字的字形结构分解成一 般相当的文字直接打出,有打不出来的部份就以?表示。这样子,尽管 没有交代上下、左右、包含等关系,但至少九成以上还是猜得出来,这 对以後的缺字整理是大有帮助的。 对於郁婷的作业,我希望她考虑一下我这个方法,让底下的工作人员采 用这个方法,凡是遇到电脑缺字,请不要以通用字代,也不要以大正藏 底下的校勘文字代,而是尽量以这套简便的方法保持住文字的原状原貌。 对於佛教藏OCR小组,作业时可以采用通用字。若没有通用字的,如 果你已经上路了,可采用之前所用的精确表示法;如果你还是不习惯, 没关系,但请至少得采用这个「总比没有好」的组字法。因为有了这个 新方法,所以之前所说「若缺字不好组,请打一个●来表示」,现在要 改成「若缺字不好组,请利用简便组字法并配合?来尽量表示」。 以下是一些应用实例: 1.尔时,世尊食时,著衣持[金本],入舍卫大城乞食(金刚经) 2.罗[目侯]罗、□梵波提、宾头卢颇罗堕、迦留陀夷、摩诃劫宾那、 薄拘罗、阿[少兔]楼驮(阿弥陀经) 3.其二沙弥东方作佛。一名阿[门人人人]在欢喜国(法华经) 4.离[心龙]□心。不调故。发大车心(六十华严) 5.□檀为[草积]。供养佛身。而以烧之(法华经) 6.右膝[足胡]跪一心合掌。恭敬供养。作如是言(六十华严) 7.鼻不匾[ㄈ?虎]。亦不曲戾。面色不黑(法华经) 8.亦如众鸟类 出[士?卵□]音不同(六十华严) 最後,特别再声明,这是一个不得已的非常手段,专用在目前的几个非 常状况。我还是期盼一个让大家轻松愉快且成熟有效的缺字处理方式能 够早日诞生。 □□□□□□□□□□□□□□□□□ 摩诃工作室.吴宝原 E-mail:maha@tpts1.seed.net.tw Tel:(02)6741715/Fax:(02)6741716 □□□□□□□□□□□□□□□□□ |
阅读文章: 第 1068/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |