看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 1086/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech 标 题: Re: 补字机制 发信站: 狮子吼站 (Fri Dec 26 15:48:34 1997) 转信站: Lion 这是上封提到的讨论, 这些讨论日後会全部公开, 现在是利用这个机会, 将相关讨论提出来, 看能不能趁势将整合的大事一举推到顶点. =========================== 【11/11 huiqun】 基於各位近日多封信件皆讨论25T、CBS、中研院庄居士、普贤WMC兄、缺字等错 综复杂的关系,弟想说明一下我的立场。 各位的发心都是佛典电子化吧。弟一来没有这方面的能力,二来从不担心佛典没 有人去电子化,所以没有这个发心。 只是看到"big5缺字"这个基本而首要的问题如果没有统一处理,以後会构成许多 交流上的麻烦,而这些麻烦将是没有办法解决的,教界在佛典电子化的合作更会 因此而受负面影响。 以big5的普及性,忽略它是不可能的。但大部份的人都视缺字处理为一项佛典电 子化的附带工作,只要把自家所电子化的经文推出,缺一个字造一个就算了。 如果想著推出电子化经文是给别人读的,恐怕要重新思考一下,谁会在萤幕上读 经?弟以为佛典电子化一大优点是便於检索、"处理"、交流。缺字连连,各家各 码,如何检索、处理、交流? 弟却觉得缺字是big5的遗憾,造字并非佛典电子化的附带工作,每个造字都应享 有与任何一个系统内建字同等的地位,"标准造字档"更应是标准配备而非附加配 备。 在目前欠缺"标准造字档"的时候,组字和图形都是很好的过渡方法,当然也可以 把组字和图形作为另一种固定的表达方式。 目前三大造字档是中研院、资功会、佛光山,都是能看不能用。前者应是最具权 威的,但只提供一个造字档和若干学术文献,没有提供个别原始资料转码服务, 爱用者无法从原有的自家造字档转移至中研院造字档,也没有提供常态性的增订 服务,爱用者发现新缺字时只能报告而无法适时取得新造字。後二者更只是为配 合出版品而产生的附属品。 弟的主张是大家一起来,培养因缘以建立一套"佛典Big5缺字系统",包含: 一、标准Big5造字档 二、个别原始资料转码机制与服务 三、常态性造字增订机制与服务 四、组合字、图形、相通字表、异体字表、繁简对照表、其他相关工具... 凡是朝这大方向走的,必定会遇上大量繁琐的人工作业,无论是甚麽单位,小弟 都乐意义务协助处理此等耗时的人工作业。凡是为了一时交差而只肯原地踏步 的,弟则恕难提供协助。凡是指向个别出版品的短视作业,小弟也不会助其制造 更多混乱。 弟相信Maha兄和Heaven兄二位大概都颇清楚弟的想法,弟也很乐於跟二位学习和 配合。Tone兄则因最近才有接触,弟还待加强合作默契。普贤WMC兄方面,只是 这几天来了两封信,弟还搞不懂那边在做的是甚麽,如果与弟的想法相符,我还 是一样随缘协助。中研院庄居士则弟完全生疏,但以其崇高地位,中研院无庸置 疑乃落实整套"佛典Big5缺字系统"之最佳负责单位,不知道庄居士是否有这种打 算,是的话,我想大家都会非常欢喜的投入协助。如果资功会或佛光山有意出面 负责"佛典Big5缺字系统",弟也会不遗馀力帮忙。 ==================================================================== 【11/26 huiqun】 ........... 有中研院为大家做好的现成东西,教界和学界都应安心尽量去应用, 也相信没有人会笨到要闭门造车或舍近图远的。 不过,只是「标准统一造字执行机制」还未完整,其中元件发挥不了。 标准统一造字档 (大家都公认中研院的) + 安全转换服务 ( ? ) + 适时增订造字服务 ( ? ) + 标准统一造字档更新 ( ? ) —————————— = 标准统一造字执行机制 ( ? ) ==================================================== 【11/28 heaven】 至於 huiqun 所提的, 我脑中大概的构想如下: 1. 适用度高的转换(码)程式是要写的, 但这是 case by case 的工作. 对不同的造字档做对照表, 才是最辛苦的一环. 这点日後另外谈好了! 2. 依目前大正藏第九册缺字的格式 (若有不足再讨论) , 将中研院的造字档 也放上 web server 供人查询, 大家才知道哪个字已有造字. 基本资料为何. 3. 做一个留言板, 有人有新字要处理时, 写在留言板上, 大家就知道这个字 将被处理. 并自动 mail 给中研院及 web server 管理者或缺字负责人. 中研院负责编一个 big5 造字内码 (依德明兄以前写的笔划原则) 或不造 的原因 (是不是每个字都一定会造呢?) . 缺字负责人则做"标准"组合字, 笔划, 仓颉码... 等资料 (这部份是否由中研 院统一做? 我是担心中研院负担较重, 这种比较不重要的, 可以随时改的, 就给缺字负责人或 web 负责人来做就好了) 做完後就交给 web 负责人, 负责将留言板资料清除, 放入正式区, 并 mail 原通知者. 若有资料网友想填充的, 留言板亦是个好地方. 而留言板的资 料亦可考虑过滤後送上 buda-tech . 4. 缺字查询的区域分为二个, 站上会随时附上最新的造字档, 故第一个 查询区就是以造字档的字为主. 第二个就是最近新增的字, 尚未加入造字档, 但已有指定内码. 若各单位 想自己加入造字档亦可, 只要内码一致, 自己造也无碍. 另外就是可能有 些字不造 (出现频率太低或其它原因, 因为我不知道是不是每个字都造, 直到爆掉为止?) , 也是写出不造原因, 组合法, 注音.... .... 嗯! 看来似乎不错.... :p ======================================================== heaven -- Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165] |
阅读文章: 第 1086/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |