看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1189/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: 好东西来罗!
发信站: (NEWS/INFO) National Sun Yat-San University (Thu Feb 26 18:29:49 1998)
转信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
来  源: buddha.nsysu.edu.tw

以下六封信,Quiz、Heaven、Maha、Tone——这四人到底是在说些什麽「好
糠的东西」呢?

******************************************************************

Subject: 好东西来罗!
   Date: Mon, 22 Dec 1997 18:37:16 +0800
   From: "Heaven" <heaven@novell.zcom.com.tw>

各位:

承 quiz 兄帮忙, 不但写了个 bmp -> tif 的批次处理程式,
还将去点程式也给漂亮化了. 呵! 呵! 很漂亮喔!

之前有些小问题, 看来都解决了. 这二天我会再大概试看看.
本想试好再公布, 但人多比较容易捉到问题, 故先给各位玩看看.
有问题再通知我, 若没大问题, 我就在 buda-tech 公布并放上
ftp server 了.

他并且还有其它计画喔! 如下, 大家四目以待了. ("四" 忘了怎麽写了 :p)

heaven

======================

我的程式,目前正加上一页〔文字校对〕的功能,已经快好了,
好了後我会先将程式寄给您。试用看看,若有问题,先由我这边
将他改到堪用後,就整个PROJECT移给您。

这个〔文字校对〕的功能包含跨档案的文字寻找,置换,看图,
档案相加,所以您那边假如有需要,可以继续发展成大藏经的
档案管理。乃至简单的读经,检索功能。

呵...别吓到了,移转给您後,我还是STAND BY YOUR SIDE.

大家加油罗。

Have a nice day.

Quiz...

******************************************************************

Subject: Re: 好东西来罗!
   Date: Tue, 23 Dec 1997 02:18:32 +0800
   From: maha <maha@tpts1.seed.net.tw>

Heaven wrote:
> 
> 承 quiz 兄帮忙, 不但写了个 bmp -> tif 的批次处理程式,
> 还将去点程式也给漂亮化了. 呵! 呵! 很漂亮喔!

的确很漂亮喔!不管外观或操作性都不错。

在设计上,如要玩去点游戏,目前只接受G4格式的 tif档,一般格式的
tif 档还无法接受,这个是可以再想想的。因为我们一般利用扫瞄软体
所扫瞄出来的皆只是一般格式的 tif档,没道理还要将它转成 bmp档,
然後再又转成 G4 tif ,绕个大圈才能处理去点。

我的意思是说,在去点方面,看能不能设计成能够接受一般 tif档及G4
格式 tif档;那个需要绕圈的部份,由程式在暗地里解决就好了。

Quiz wrote:
> 
>         我的程式,目前正加上一页〔文字校对〕的功能,已经快好了,
> 好了後我会先将程式寄给您。试用看看,若有问题,先由我这边
> 将他改到堪用後,就整个PROJECT移给您。
> 
> 这个〔文字校对〕的功能包含跨档案的文字寻找,置换,看图,
> 档案相加,所以您那边假如有需要,可以继续发展成大藏经的
> 档案管理。乃至简单的读经,检索功能。

看来,越来越好玩了,这将是我们期待的整合性电子佛典工具程式吧!

******************************************************************

Subject: Re: 好东西来罗!
   Date: Fri, 26 Dec 1997 13:22:50 +0800
   From: "K.Y.T." <tone@tpts1.seed.net.tw>

Heaven wrote:
> 
> 承 quiz 兄帮忙, 不但写了个 bmp -> tif 的批次处理程式,
> 还将去点程式也给漂亮化了. 呵! 呵! 很漂亮喔!
> 
> 之前有些小问题, 看来都解决了. 这二天我会再大概试看看.
> 本想试好再公布, 但人多比较容易捉到问题, 故先给各位玩看看.
> 有问题再通知我, 若没大问题, 我就在 buda-tech 公布并放上
> ftp server 了.

  我在 DOS 下的 Windows 3.1 执行,会看不到选单的 title 文字,
  所以一开始我还以为只有一个 bmp-->tif 功能,因为看不到另外
  一个去点程式的选单(我不知该如何说这个名词,只好以选单称之)。

  虽然看不到,但 mouse 依然可以盲选来运作。可能讲的不是很
  清楚,请 quiz 兄在 DOS6.22 下执行 win31 就知道了。

  加油!

******************************************************************

Subject: Re: 好东西来罗!
   Date: Sat, 27 Dec 1997 18:30:59 +0800
   From: "QUIZ" <ycc18@tcts.seed.net.tw>

> 在设计上,如要玩去点游戏,目前只接受G4格式的 tif档,一般格式的
> tif 档还无法接受,这个是可以再想想的。因为我们一般利用扫瞄软体
> 所扫瞄出来的皆只是一般格式的 tif档,没道理还要将它转成 bmp档,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

这很奇怪。大部分扫描程式应该都有支援 TIF G4 。
我从您那边收到的都是 G4 的格式。

> 然後再又转成 G4 tif ,绕个大圈才能处理去点。

可能以前并没有详细规划,或者经验不够。

> 我的意思是说,在去点方面,看能不能设计成能够接受一般 tif档及G4
> 格式 tif档;那个需要绕圈的部份,由程式在暗地里解决就好了。
> 

请问一下还有多少这类非G4的图档?

文件校对那一页的功能,其实只是跨档案找字串,置换,和档案依照卷期合并。
看图。这些而已。

程式已经好了。我今天先寄给HEAVEN看看。

我的构想是:

扫图->去圈点->OCR->OCR中初校->文件校对中去除常见错误->合并。

这样子从扫图到文字档的产生所需要的程式就可以齐备了。

在
〔OCR中初校->文件校对中去除常见错误->合并成卷〕
这个过程,目前比较有问题。

因为扫图的人员,他们作的非常好。这部分问题不大。就算要转档,那都是
电脑在累,人是很轻松的。

倒是校对和档案合并...蛮头大的。

新增〔文件校对〕的功能是想说这方面看能不能多少帮上一点忙。

Quiz...

******************************************************************

Subject: Re: 好东西来罗!
   Date: Sun, 28 Dec 1997 00:22:40 +0800
   From: maha <maha@tpts1.seed.net.tw>

QUIZ wrote:
> 
> > 在设计上,如要玩去点游戏,目前只接受G4格式的 tif档,一般格式的
> > tif 档还无法接受,这个是可以再想想的。因为我们一般利用扫瞄软体
> > 所扫瞄出来的皆只是一般格式的 tif档,没道理还要将它转成 bmp档,
> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>
> 这很奇怪。大部分扫描程式应该都有支援 TIF G4 。
> 我从您那边收到的都是 G4 的格式。

NO! NO! 大部份扫瞄程式都不支援 TIF G4。
您收到的 TIF档,都是徐言辉在扫瞄成一般 TIF档後再转换成 TIF G4。

> > 然後再又转成 G4 tif ,绕个大圈才能处理去点。
> 
> 可能以前并没有详细规划,或者经验不够。
> 
> > 我的意思是说,在去点方面,看能不能设计成能够接受一般 tif档及G4
> > 格式 tif档;那个需要绕圈的部份,由程式在暗地里解决就好了。
> 
> 请问一下还有多少这类非G4的图档?

像黄郁婷目前针对30册大正藏所扫瞄出来的图档,全都是一般的 TIF图档。
为了节省储存资料空间,所以我们要将一般 TIF档转成 G4 格式。因此,我
们以後很有可能会同时遇上一般 TIF档以及 G4格式 TIF档。

> 文件校对那一页的功能,其实只是跨档案找字串,置换,和档案依照卷期合并。
> 看图。这些而已。
> 
> 程式已经好了。我今天先寄给HEAVEN看看。
> 
> 我的构想是:
> 
> 扫图->去圈点->OCR->OCR中初校->文件校对中去除常见错误->合并。
> 
> 这样子从扫图到文字档的产生所需要的程式就可以齐备了。
> 
> 在
> 〔OCR中初校->文件校对中去除常见错误->合并成卷〕
> 这个过程,目前比较有问题。

「OCR中初校」,若是指 OCR线上校对,那是OCR软体的操作□围,我们能帮
什麽忙?

「文件校对中去除常见错误」,若是指「线上粗略校对」後,针对该文件予
以文书处理,我们倒是可以帮些忙。例如,如果是我,我会利用汉书来编辑
文件,并制作一个替换巨集,把常见错误替换掉。可是很多人并不会这些技
俩,像郁婷,她就只会一个一个来替换。所以,我想可以在这里动点脑筋,
让使用者自由建立「错误→正确」对照表,他只要指定相关文件,程式就会
自动去做替换处理。

另外,提一下。关於丹青黄金版,前几天我去郁婷那边看了一下,这一版有
个特色是可以线上搜寻、替换,不过只能一次一个来替换,无法批次处理。
她目前是逐字校,当开启图档辨识完毕後,就开始一次一个来替换,然後再
开始逐字校。所以,以她这样的流程,上段所说的设想可能对她帮忙不是很
大。

「合并成卷」,应该是有需要,也大概不难设计吧!让使用者依序选择欲合
并档案,并输入合并後的新档名,然後GO,就成了。tone有一个小程式给我
用,你们可以试试(下函另外再附档送出)。这个程式叫做 Mergfile ,可
以在 win95 DOS视窗执行,它会问你两个问题:

  1.欲合并的档案清单之档名?
  2.完成合并後之档名?

对第一个问题所问的档案内容,我通常是以在汉书指令列输入 DIR来取得,
如下:

  F430001 .TXT
  F430011 .TXT
  F430016 .TXT
  F430017 .TXT
  F430018 .TXT
  F430019 .TXT

> 因为扫图的人员,他们作的非常好。这部分问题不大。就算要转档,那都是
> 电脑在累,人是很轻松的。
> 
> 倒是校对和档案合并...蛮头大的。
> 
> 新增〔文件校对〕的功能是想说这方面看能不能多少帮上一点忙。

动动脑筋,先不要想像这是个什麽伟大的程式,我相信它至少一定可以达到
方便实用的目的。

******************************************************************

Subject: Re: 好东西来罗!
   Date: Sun, 28 Dec 1997 17:20:46 +0800
   From: Quiz <ycc18@tcts.seed.net.tw>

您好:
>> 这很奇怪。大部分扫描程式应该都有支援 TIF G4 。
>> 我从您那边收到的都是 G4 的格式。
>
>NO! NO! 大部份扫瞄程式都不支援 TIF G4。
>您收到的 TIF档,都是徐言辉在扫瞄成一般 TIF档後再转换成 TIF G4。

喔,可能是我运气比较好或不好。

>像黄郁婷目前针对30册大正藏所扫瞄出来的图档,全都是一般的 TIF图档。
>为了节省储存资料空间,所以我们要将一般 TIF档转成 G4 格式。因此,我
>们以後很有可能会同时遇上一般 TIF档以及 G4格式 TIF档。

TOO,BAD. 这可能要看其他大德,或者等末学找到这类的函式库才能帮上忙了。

>「OCR中初校」,若是指 OCR线上校对,那是OCR软体的操作□围,我们能帮
>什麽忙?

是的,可能不多,主要或许是在〔文件校对〕的功能中,有分自动置换,
和半自动置换。

一些常见的辨识错误(可能随个人手中经文而不同)有些可以
在程式中自动置换正确的,就没必要每次在丹青中修改。

>「文件校对中去除常见错误」,若是指「线上粗略校对」後,针对该文件予
>以文书处理,我们倒是可以帮些忙。例如,如果是我,我会利用汉书来编辑
>文件,并制作一个替换巨集,把常见错误替换掉。可是很多人并不会这些技
>俩,像郁婷,她就只会一个一个来替换。所以,我想可以在这里动点脑筋,
>让使用者自由建立「错误→正确」对照表,他只要指定相关文件,程式就会
>自动去做替换处理。

是的就是作您上面这段讲的。

>另外,提一下。关於丹青黄金版,前几天我去郁婷那边看了一下,这一版有
>个特色是可以线上搜寻、替换,不过只能一次一个来替换,无法批次处理。
>她目前是逐字校,当开启图档辨识完毕後,就开始一次一个来替换,然後再
>开始逐字校。所以,以她这样的流程,上段所说的设想可能对她帮忙不是很
>大。

我是把他作成可以批次处理的。

>「合并成卷」,应该是有需要,也大概不难设计吧!让使用者依序选择欲合
>并档案,并输入合并後的新档名,然後GO,就成了。tone有一个小程式给我
>用,你们可以试试(下函另外再附档送出)。这个程式叫做 Mergfile ,可
>以在 win95 DOS视窗执行,它会问你两个问题:
>
>  1.欲合并的档案清单之档名?
>  2.完成合并後之档名?
>
>对第一个问题所问的档案内容,我通常是以在汉书指令列输入 DIR来取得,
>如下:
>
>  F430001 .TXT
>  F430011 .TXT
>  F430016 .TXT
>  F430017 .TXT
>  F430018 .TXT
>  F430019 .TXT
>

是的,也差不多就是这些。只是把这类的动作转成图形化操作。
另外就是加上从哪一行开始,到哪一行结束。...(有点夸张...:p)

>> 因为扫图的人员,他们作的非常好。这部分问题不大。就算要转档,那都是
>> 电脑在累,人是很轻松的。
>> 
>> 倒是校对和档案合并...蛮头大的。
>> 
>> 新增〔文件校对〕的功能是想说这方面看能不能多少帮上一点忙。

为扫图的人员至上我最高的敬意。非常感激。

>动动脑筋,先不要想像这是个什麽伟大的程式,我相信它至少一定可以达到
>方便实用的目的。
> 

呵...

末学的EMAIL只能用到年底。等到有新的EMAIL帐号时,才有办法收信。
这段时间只能发不能收。万一有造成不便之处。敬请见谅。

喔,OCR校对,我会按时交作业。可别把我的饭碗分给别人。

HAPPY NEW YEAR.

...^_^...


阅读文章: 第 1189/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org