您有新信

 
CBETA 0522电子报--专题报导二
#1
Heaven
发信站: 狮子吼站 (Lion , 信区: BudaTech)
===========《 CBETA E-News 中华电子佛典协会新闻电子报 》============
1999-05-22   创刊号       http://ccbs.ntu.edu.tw/cbeta
====================================================================
□□□□□□□□□□□□□□〉专题报导〈□□□□□□□□□□□□□□
===================================中华电子佛典协会作业流程简介=====

【 本期专题 】中华电子佛典协会作业流程简介................发行组

前言:

    中华电子佛典协会成立至今已逾一年,感谢许多朋友不吝指导协助,而
一年来我们也渐渐的将佛典电子化的流程逐一确立,希望在将来能够更顺利
的产出佛典,提供大家使用。

    然而,中华电子佛典协会并非属於一个人或是少数人便能够支持,在我
们成长的过程中,若没有许多朋友的鼎力协助,相信是无法达到现有的状况,
也企盼将来仍能持续地得到大家的支持与鼓励。

    本会处理经文的方式,主要是采用不同来源两个以上版本的经文电子档,
利用程式进行比对,再利用看图校对的方式产生一较正确的经文电子档,再
交由人工校对。这样的处理方式,在速度及品质上均令人满意,尤其是若干
经文档本身的品质不甚理想,常在直接交付给义工菩萨进行校对时,造成很
大的困扰。为了秉持高品质的原则,因此我们不会将未经过看图校对的经文
流出,藉此对许多来函索取经文的朋友们致歉。

作业流程示意图:

                   资料输入及比对经文搜集
                             ↓
                       缺字及格式整理
                             ↓
                          档案比对
                             ↓
                          看图校对
                             ↓
                          人工校对
                             ↓
                          标记处理
                             ↓
                         电子档上网
                             ↓
                       全文检索等应用
                             ↓
                     使用者之建议与指导
                             ↓
                         修正并更新

资料输入:

    对於大量的佛典经文的输入,我们针对不同的内容,选择采用打字输入
或是扫瞄图档辩识的方法来产生文字档。

    OCR所使用的程式,感谢力新公司的鼎力协助,并针对我们特殊的需求,
开发了丹青 for CBETA版本,特此志谢。由於力新公司的帮忙,使得我们在
面对大正藏经文能够取得一较好的解决方案。

    OCR的流程简述如下:

经文图档扫瞄-->去除杂点-->OCR-->学习词库及後处理-->线上校对-->经文

比对经文搜集:

    除利用原本网路上许多大德所输入的经典(如佛教经典系列)之外,也感
谢许多出版社及相关单位慷慨提供经文电子档,让我们能够顺利的作业。

    另外,我们也寻求各式各样的合作机会,无论是针对国际佛典电子化的
伙伴,或是学术研究机构、出版团体等等,均能在互利的情况下,相互支持。

    针对各界提供我们的经文,如果有需要,我们会在校对完成之後,提供
一份校对报告,让出版团体能够针对我们发现的问题进行检查更正。

缺字及格式处理:

    佛经中大量的缺字,是处理经文所面临的第一个大难题,目前解决的方
案有许多种,本会为了顾及各方面的需求,尝试建立相关的资料库,能够提
供不同方案之间的转换。如代码取代,造字转换等。

    此外,不同版本和来源的经文,在排版、标点、校勘等等可能有很大的
差异。因此,得预先进行初步的格式处理,以利比对作业。

档案比对:

    利用档案比对程式进行经文档案比对,产生差异档,在进行差异分析之
後,针对高频次差异进行取代处理。

看图校对:

    利用先前扫瞄之图档和经文比对差异档,及看图校对程式,进行线上看
图校对。原则上采取两组同时进行,再将结果交叉比对的方式。

    看图校对後,亦进行後处理做进一步的检查,及原版藏经的查证工作。

人工校对:

    将看图校对後决定的经文,列印提供义工进行书面校对。在此感谢所有
参与书面校对的义工菩萨们。如果您对参与书面校对工作有兴趣,欢迎和我
们连络。

    书面校对後进行订正,接著便进行标记的处理。

标记处理:

    标记处理分成两部份,先进行简单标记的处理,再利用程式转换,进行
细部的标记处理。

电子档上网:

    利用标记完成之经文档案,产生普及版之经文档,上网提供大众使用。

全文检索等应用:

    针对不同的使用需求,发展工具提供大家利用,以扩展电子佛典之应用
性与价值。

使用者之建议与指导:

    接受来自世界各地使用者之指导与建议,并不定期针对使用者的意见,
召开组际会议,进行讨论。

修正并更新:

    依使用者的建议和会议的决议,对经文内容或是相关工具,甚至是处理
流程进行修正和更新。

结语:

    经过了一年来的□试与摸索,我们建立了一套顺畅的流程,感谢每一位
同仁在打通每一道关节上付出的心血和努力。当然,我们也将本著精益求精
的精神继续努力。如果您对於我们的作业流程有兴趣,或是有任何的建议,
欢迎和我们连络。

====================================================================
          【 CBETA E-News 中华电子佛典协会新闻电子报】
                      http://ccbs.ntu.edu.tw/cbeta
  台北市朱仑街36号303室   TEL:(02)8773-6469    FAX:(02)8773-6470
  取消 newsletter 请使用浏览器连线到:
                      http://ccbs.ntu.edu.tw/cbeta
  选取电子报,并输入你的电子邮件帐号,选择「删除」并确定按钮即可。
====================================================================
--
◇ 南无护法韦驮尊天菩萨 ◇
   □□□  □□□□□□□□□□□□□□     
 □□□□□□□□    □□□  □  □□□     
 □□□□□□□□□□□□□  □□□□□     
   □□□□□□□    □  □□□□□  □    ★台大佛学研究中心狮子吼佛教专站
 □□□□□□□  □□□      □□□  □□□  欢迎对佛教法义有兴趣的朋友加入★
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw>         ◎ 慈悲没有敌人.智慧不起烦恼 ◎
Fri May 28 01:10:58 1999
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org