看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 585/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: maha <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: Re: fgfc 第三次改版, 请帮忙测试并提供意见.
发信站: 国立中山大学网路组 Mailing List (Sat May 17 01:12:43 1997)
转信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu
来  源: sccid.nsysu.edu.tw

wmc wrote:
> 
> Heaven wrote:
> >
> > > > > 阿那律
> > > > > 阿[少/兔]楼驮
> > > > > 阿<<那律||少/兔]楼驮>>
> > > > > 阿[<<少/兔]楼驮||那律>>
> > > 看结果, 应该是对缺字与比对的差别符号间的定义再严谨点就可以.
> >
> 引用的前文太少, 我有点不知在谈啥了; 应该是要说在程式内要把缺字组字
> 当作一个字来处理. 因此比较结果才会是:
>  阿<<那律||[少/兔]楼驮>>
>  阿<<[少/兔]楼驮||那律>>
> 以上如果文不对题, 还请包涵.
> 
> >   我想了一下, 这点程式可能无法判断, 目前想法是靠汉书巨集加上人来判断,
> >   後学再想看看好了.

我想fgfc在执行时,因为内定值省略了全形及半形符号,也就是忽视这些符号
而通通不予比较,所以其执行结果中对於符号的处理有些失当。

假设fgfc在执行时,把重要的全形符号(如:「」『』()【】%∞+-◎)
及半形符号(如:()[]<>/*+-@)也列入比较□围,我想大概就不会这样了。

想归想,我动手试验了一下。这次舍弃内定值,采取自定值,我在 Fgfcsign.
txt 里面放了以下七个全形符号--,。;:?!□--表示只忽略这些符号不比
较,其它的通通要比较。然後下达指令来比较AB两本法华经:
  fgfc /e fg0262a.txt fg0262b.txt a.txt b.txt x.txt 100 4
结果呢,差异太多,程式中断。我试著扩大「最大容许差异的中文字数」,从
120、150、180都不行,直到 200才顺利完成。

从底下这个例子可以看出我上面的猜测大概没错。

  A本原文      阿(ㄋㄡ□)楼驮
  B本原文      阿[少/兔]楼驮

【上次使用内定值的结果】
  A本处理结果  阿(<<ㄋㄡ□||少/兔>>)楼驮
  B本处理结果  阿[<<少/兔||ㄋㄡ□>>]楼驮

【这次采用自定值的结果】
  A本处理结果  阿<<(ㄋㄡ□)||少/兔>>楼驮
  B本处理结果  阿[<<少/兔||(ㄋㄡ□)>>]楼驮

请注意,全形小括号搞对了吧!但是,半形中括号还是老样子;可见,半形符
号仍是这个程式不予比较的东西。记得 heaven 说过,若连半形符号也要比较
,得要大费周章。不过,假如能让使用者自订所要比较的半形符号,那麽今天
讨论的这个问题可能就有解了。

□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□

阅读文章: 第 585/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org