看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: 新版去点程式的最佳点数设定值(佛教藏)
发信站: (NEWS/INFO) National Sun Yat-San University (Mon Dec  8 10:29:47 1997)
转信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
来  源: buddha.nsysu.edu.tw

经过 heaven 的加工赶制,这个新版 fgmvdot,如果应用在目前的佛教藏
OCR 作业,到底最佳设定点数是多少?以下做了个小测试。

  ◎测试材料:佛教藏第62册 523页(本页以旧版程式无法去除乾净)
  ◎本页原有圈点:85个

    点数 去除点数 未去除点数
    ————————————
     12    201        3
     13    180        0
     14    155        0
     15    148        0
     16    138        0
     17    127        0
     18     99        0
    *19     90        0
     20     94        0
     21     92        3
    ————————————

点数在12以上、21以下,会有越来越多的未去除点。而点数在 13-20,皆
可把原有的85个圈点去除乾净,但是程式所报告的去除点数皆大於85,这
是因为程式把不该去除的文字边角也干掉了。所以在 13-20之间,乃以点
数19时的状况最好,它只多去除了 5个不该去除的。因此,19点是最佳点
数设定。

我这个测试,只针对这一页材料。徐言辉的扫瞄图档状况未必一致,各位
可以参考我这个方法自行测试,找出最佳点数,以发挥 fgmvdot的最大功
效。

□□□□□□□□□□□□□□□□□
 摩诃工作室.吴宝原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□□


阅读文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org