看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: Re: 六部藏经的辨识效果初探
发信站: 国立中山大学网路组 Mailing List (Thu Aug 28 08:18:59 1997)
转信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu
来  源: sccid.nsysu.edu.tw

Heaven wrote:
> 
>   顺便问一下, 以往在 ocr 校对好的粗稿加上标点, 会不会很麻烦,
>   这个我没有实务经验. 有时我校对一页佛教大藏经(从 ocr 至校对完)
>   要十多分钟, 不知加上标点要多久?

拿《梵网经》第14页为例,执行去圈点程式处理後,这时候以 OCR进行作业
,计时开始—— 08:11。经过自动版面分割、辨识,然後加以人工线上校对
,完成时的时间是—— 08:23。前後用了『12分钟』。接著我就急忙跑去补
习班教课,回到家时,时间是22:50。

隔天,也就是现在,将昨天校对好的那一页粗稿加上圈点。我没有原书,但
早已把未去圈点前的图档印好了,所以就一边看著纸面,一边盯著萤幕上的
文字档,从 05:40 到 05:47 ,总共用了『 7分钟』。

这一页佛教大藏经的经文,含圈点共有799字。
799字/(12分钟+7分钟)=42字/分钟——这是目前『辨识+校对+圈点』的作业速度。
7分钟/(12分钟+7分钟)=37%——这是加圈点所耗用的时间比例。

以上粗略统计,供 Heaven 及各位朋友参考。近日事忙,若有问题没有积极
回应,还请原谅。

                                                      maha 8/28/97


阅读文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org