看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1000/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: wan@Lion (wan), 信区: BudaTech
标  题: Re: 去杂点程式--大正藏版
发信站: 狮子吼站 (Mon Sep 15 21:06:59 1997)
转信站: Lion

==> 於  (buda-tech7@buddha.nsysu.edu.tw,) 文中述及:
: > 以FGFC比对A、C:只忽略一般的空白,有47个差异处。
: > 以FGFC比对B、C:只忽略一般的空白,有31个差异处。
:   这样看来差异不多嘛! ... :p
:   不过我相信若考虑由修改A->C 及 由B修改成 C 的时间应相差
:   一倍以上.
: > 又,私下怀疑,经过去符号後,多少会把一些原来正常的文字图
: > 档削去一些。例如以下附件当中01B的「五『仃』阿杂汉」、03B
: > .... skip ....
: > 一来反而造成辨识错误。这些相关资料,我会在私下mail一份给
: > heaven参考。
:   这个问题我有发现, 原因是那些符号有些会和字相接著.
:   若完全没和字连在一起才算的话, 那些连在一起的符号就去不掉了.
:   若只连一点点的也考虑去除, 就会不小心去除那些字的角落.
:   目前看来不易取舍, 或许日後实务面才比较好判断何者有利.
:   Heaven

剪一张纸,然後把有字的部份割下来,盖到要scan的部份上去,然後是字就出来
标点就不见了这样不知到可不可以
--
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.163.36]
阅读文章: 第 1000/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org