看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech 标 题: Re: 六部藏经的辨识效果初探 发信站: 国立中山大学网路组 Mailing List (Thu Aug 28 08:18:59 1997) 转信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu 来 源: sccid.nsysu.edu.tw Heaven wrote: > > 顺便问一下, 以往在 ocr 校对好的粗稿加上标点, 会不会很麻烦, > 这个我没有实务经验. 有时我校对一页佛教大藏经(从 ocr 至校对完) > 要十多分钟, 不知加上标点要多久? 拿《梵网经》第14页为例,执行去圈点程式处理後,这时候以 OCR进行作业 ,计时开始—— 08:11。经过自动版面分割、辨识,然後加以人工线上校对 ,完成时的时间是—— 08:23。前後用了『12分钟』。接著我就急忙跑去补 习班教课,回到家时,时间是22:50。 隔天,也就是现在,将昨天校对好的那一页粗稿加上圈点。我没有原书,但 早已把未去圈点前的图档印好了,所以就一边看著纸面,一边盯著萤幕上的 文字档,从 05:40 到 05:47 ,总共用了『 7分钟』。 这一页佛教大藏经的经文,含圈点共有799字。 799字/(12分钟+7分钟)=42字/分钟——这是目前『辨识+校对+圈点』的作业速度。 7分钟/(12分钟+7分钟)=37%——这是加圈点所耗用的时间比例。 以上粗略统计,供 Heaven 及各位朋友参考。近日事忙,若有问题没有积极 回应,还请原谅。 maha 8/28/97 |
阅读文章: 第 959/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |