看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1086/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech
标  题: Re: 补字机制
发信站: 狮子吼站 (Fri Dec 26 15:48:34 1997)
转信站: Lion

这是上封提到的讨论, 这些讨论日後会全部公开, 现在是利用这个机会,
将相关讨论提出来, 看能不能趁势将整合的大事一举推到顶点.
===========================
【11/11 huiqun】

基於各位近日多封信件皆讨论25T、CBS、中研院庄居士、普贤WMC兄、缺字等错
综复杂的关系,弟想说明一下我的立场。

各位的发心都是佛典电子化吧。弟一来没有这方面的能力,二来从不担心佛典没
有人去电子化,所以没有这个发心。

只是看到"big5缺字"这个基本而首要的问题如果没有统一处理,以後会构成许多
交流上的麻烦,而这些麻烦将是没有办法解决的,教界在佛典电子化的合作更会
因此而受负面影响。

以big5的普及性,忽略它是不可能的。但大部份的人都视缺字处理为一项佛典电
子化的附带工作,只要把自家所电子化的经文推出,缺一个字造一个就算了。

如果想著推出电子化经文是给别人读的,恐怕要重新思考一下,谁会在萤幕上读
经?弟以为佛典电子化一大优点是便於检索、"处理"、交流。缺字连连,各家各
码,如何检索、处理、交流?

弟却觉得缺字是big5的遗憾,造字并非佛典电子化的附带工作,每个造字都应享
有与任何一个系统内建字同等的地位,"标准造字档"更应是标准配备而非附加配
备。

在目前欠缺"标准造字档"的时候,组字和图形都是很好的过渡方法,当然也可以
把组字和图形作为另一种固定的表达方式。

目前三大造字档是中研院、资功会、佛光山,都是能看不能用。前者应是最具权
威的,但只提供一个造字档和若干学术文献,没有提供个别原始资料转码服务,
爱用者无法从原有的自家造字档转移至中研院造字档,也没有提供常态性的增订
服务,爱用者发现新缺字时只能报告而无法适时取得新造字。後二者更只是为配
合出版品而产生的附属品。

弟的主张是大家一起来,培养因缘以建立一套"佛典Big5缺字系统",包含:

一、标准Big5造字档
二、个别原始资料转码机制与服务
三、常态性造字增订机制与服务
四、组合字、图形、相通字表、异体字表、繁简对照表、其他相关工具...

凡是朝这大方向走的,必定会遇上大量繁琐的人工作业,无论是甚麽单位,小弟
都乐意义务协助处理此等耗时的人工作业。凡是为了一时交差而只肯原地踏步
的,弟则恕难提供协助。凡是指向个别出版品的短视作业,小弟也不会助其制造
更多混乱。

弟相信Maha兄和Heaven兄二位大概都颇清楚弟的想法,弟也很乐於跟二位学习和
配合。Tone兄则因最近才有接触,弟还待加强合作默契。普贤WMC兄方面,只是
这几天来了两封信,弟还搞不懂那边在做的是甚麽,如果与弟的想法相符,我还
是一样随缘协助。中研院庄居士则弟完全生疏,但以其崇高地位,中研院无庸置
疑乃落实整套"佛典Big5缺字系统"之最佳负责单位,不知道庄居士是否有这种打
算,是的话,我想大家都会非常欢喜的投入协助。如果资功会或佛光山有意出面
负责"佛典Big5缺字系统",弟也会不遗馀力帮忙。
====================================================================
【11/26 huiqun】
...........
有中研院为大家做好的现成东西,教界和学界都应安心尽量去应用,
也相信没有人会笨到要闭门造车或舍近图远的。
不过,只是「标准统一造字执行机制」还未完整,其中元件发挥不了。

  标准统一造字档 (大家都公认中研院的)
+ 安全转换服务 ( ? )
+ 适时增订造字服务 ( ? )
+ 标准统一造字档更新 ( ? )
——————————
= 标准统一造字执行机制 ( ? )
====================================================
【11/28 heaven】

至於 huiqun 所提的, 我脑中大概的构想如下:

1. 适用度高的转换(码)程式是要写的, 但这是 case by case 的工作.
对不同的造字档做对照表, 才是最辛苦的一环. 这点日後另外谈好了!

2. 依目前大正藏第九册缺字的格式 (若有不足再讨论) , 将中研院的造字档
也放上 web server 供人查询, 大家才知道哪个字已有造字. 基本资料为何.

3. 做一个留言板, 有人有新字要处理时, 写在留言板上, 大家就知道这个字
将被处理. 并自动 mail 给中研院及 web server 管理者或缺字负责人.

中研院负责编一个 big5 造字内码 (依德明兄以前写的笔划原则) 或不造
的原因 (是不是每个字都一定会造呢?) .

缺字负责人则做"标准"组合字, 笔划, 仓颉码... 等资料 (这部份是否由中研
院统一做? 我是担心中研院负担较重, 这种比较不重要的, 可以随时改的,
就给缺字负责人或 web 负责人来做就好了)

做完後就交给 web 负责人, 负责将留言板资料清除, 放入正式区, 并 mail
原通知者. 若有资料网友想填充的, 留言板亦是个好地方. 而留言板的资
料亦可考虑过滤後送上 buda-tech .

4. 缺字查询的区域分为二个, 站上会随时附上最新的造字档, 故第一个
查询区就是以造字档的字为主.
第二个就是最近新增的字, 尚未加入造字档, 但已有指定内码. 若各单位
想自己加入造字档亦可, 只要内码一致, 自己造也无碍. 另外就是可能有
些字不造 (出现频率太低或其它原因, 因为我不知道是不是每个字都造,
直到爆掉为止?) , 也是写出不造原因, 组合法, 注音....

.... 嗯! 看来似乎不错.... :p
========================================================

  heaven
--
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165]
阅读文章: 第 1086/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org