看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1014/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: "Heaven" <heaven@novell.zcom.com.tw>, 信区: BudaTech
标  题: Re: 丹青OCR“学习字库功能”使用心得报告]
发信站: (NEWS/INFO) National Sun Yat-San University (Thu Oct 16 12:16:08 1997)
转信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
来  源: buddha.nsysu.edu.tw


> > ★★到底可以建立多少学习字?待考。
> 这下子好像『考』出来了→最好不要超过 330个字。
> 今天一开机玩丹青 OCR,奇怪!只要有挂上 T6142学习字,系统每次都当得
> 死死的。本还搞不清楚怎麽回事,直到换另一台电脑再试,我才确定是学习
> 字档 train.dbs 长度过大所致。
> .......略.....
> 有 339字,我怀疑这样多的学习字数会造成系统严重当机。所以建议有使用
> 丹青 OCR的各位,请随时留意您的 train.dbs  长度,大概超过 330字,也
> 就是长度超过  74314 bytes 时,就该适可而止了。若再增加下去,下场可
> 能很惨,整个学习字库得重零开始建立。还好,我在 22122 bytes(97字)
> 时做过一次备份,现在正可以利用这个备份档重新建立。

这是某光碟的目录说明 : 供参考

UMAXOCR2      <DIR>  UMAX 丹青中文辨识系统 V2.0 专业版。

                     □ 辨识速度486 DX2-66上约 23字/秒
                     □ 多页批次处理处理(最多200页)
                     □ 可辨识字库:繁体13202字、简体6763字
                     □ 可学习1024个新字
   		                  ^^^^
                     □ 以6万词之词库自动校对

  Heaven

阅读文章: 第 1014/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org