您有新信

 
Re: [Fwd: 丹青OCR“学习字库功能”使用心得报告]
#1
发信站: (tpts1.seed.net.tw>, 信区: BudaTech)
maha wrote:
> 
> ★★到底可以建立多少学习字?待考。

这下子好像『考』出来了→最好不要超过 330个字。

今天一开机玩丹青 OCR,奇怪!只要有挂上 T6142学习字,系统每次都当得
死死的。本还搞不清楚怎麽回事,直到换另一台电脑再试,我才确定是学习
字档 train.dbs 长度过大所致。

我目前正在处理的《八十华严》有1430页,昨天辨识到 472页时,6142字集
的  train.dbs 长度为 76330 bytes。里头学习了多少字呢?让我们稍微实
验计算一下:

  字数  长度(bytes)
  ------------------
   1     394
   2     618
   3     842
   4    1066
  ------------------

  (76330-394)/224=339

有 339字,我怀疑这样多的学习字数会造成系统严重当机。所以建议有使用
丹青 OCR的各位,请随时留意您的 train.dbs  长度,大概超过 330字,也
就是长度超过  74314 bytes 时,就该适可而止了。若再增加下去,下场可
能很惨,整个学习字库得重零开始建立。还好,我在 22122 bytes(97字)
时做过一次备份,现在正可以利用这个备份档重新建立。

为了进一步确认,我将这个含有 339个学习字的T6142字集 train.dbs 私下
各寄一份给以下四人:

  tsungwu@email.gcn.net.tw
  benchu@mail.wicl.com.tw
  guby@cris.com
  wangtel@tpts5.seed.net.tw

希望他们拨空诊断一下。

PS. 不劳烦 heaven,他正忙著 CCCII→BIG5 转码程式。

                                                     maha 10/15/97
NEWS/INFO National Sun Yat-San University Wed Oct 15 10:05:50 1997
回覆 | 转寄 | 返回

Re: [Fwd: 丹青OCR“学习字库功能”使用心得报告]
#2
发信站: (tpts1.seed.net.tw>, 信区: BudaTech)
Ruby G. wrote:
> 
> 吴居士:
> 
>     试了多次,我是没有办法。
>     在T6142中当机,其他数字中不WORK。
>     能否在DOS中EDIT TRAIN,拿掉一些什麽,减少些字数,
> 救活这个FILE。

我可没这个能耐,我找童□运试试。

这个测试的重点是:

  1.丹青学习字的数量是否真有限制?
  2.若有,那麽临界值在哪里?
  3.若有,如何突破?

                                         maha 10/16/97
NEWS/INFO National Sun Yat-San University Thu Oct 16 07:56:00 1997
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org