看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: "Heaven" <j120006632@mail.chinatrust.com.tw>, 信区: BudaTech
标  题: [buda-tech] fgfc 第四次改版, 请帮忙测试并提供意见.
发信站: 国立中山大学网路组 Mailing List (Tue Jun  3 11:47:02 1997)
转信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu
来  源: sccid.nsysu.edu.tw

fgfc 第四次改版,
重点有:

1. 将结果之判断符号由 << || >> 改成 {{ || }}  避免和某些经文重覆.
(好像每版都有改 :p)
2. 这回判断连半形也包括进来了, 而内定的忽略符号则减缩为:

    忽略半形符号为 ,.:;?! 及数字 0~9 及字母 A~Z, a~z
    忽略中文符号为(A140~A154) ,、。..;:?!∶…¨,、··;:?!
    而 ASCII 码从 0 ~ 31 为控制码, 不论有无使用外挂档案.本程式完全忽略

    可以看出我只将控制码, 空白及标点符号列为忽略字, 尤其是控制码 (ascii
0~31)
    为绝对忽略, 加 /e 参数亦无用.
    原因有二, 一来考虑日前讨论的组合字符号问题, 二来有特殊符号出现,
校对者应
    当关心一下是什麽符号, 若没什麽特别意义时, 再使用加入外挂档
fgfcsign.txt 中
    执行 /b 参数即可.

3. 修改了 fgfc.pro 比较安全了  :p 但仍很粗糙, 下面会讨论到.

这回档案为 fgfc4.exe , 放在东坡站上及 mail 给文明兄一份, 若能给大家取回时,
还麻烦二位 (东坡站当然是大刚兄罗!) 通知一下, 谢谢!

fgfc4.exe 内含五个档案
========
fgfc.exe     文件比较器 -- 专为格式相异之中文文件比较用 (06/03 '97)
fgfc.pro     汉书5用的巨集, 用来辅助修正用 fgfc 所产生的比较结果
fgfcpro.txt  fgfc.pro 的用法
fgfcsign.all 若想使用 fgfcsing.txt 为外挂的忽略字, 可参考此档
readme.txt   说明档 (就是上面这几行说明)
=========

再者, 由於较好的寻找相同段落的逻辑, 还在和别人讨论中, 我想一时无法有结果,
但目前的逻辑已为堪用, 故这回改版重点就放在半形字判断的重点上.
这部份解决後, 日後有较好的寻找相同段落逻辑出现, 亦不影响这部份, 故先动手了.

当有了比较方式的经文出现後, 再来要如何呢? 後学当初写了个很简单的 fgfc.pro ,

是用在汉书5的巨集, 可以较方便的将比较版经文直接改成校对的版本.
但在实务上呢? 这要请教宝源兄及文明兄了, 因为您们在处理时, 似乎重点并不是在
修改经文, 使其变成一个没有错字的版本 (若有原稿来稿对) ,
而是在列出其二篇文章
的差异性, 如同以前宝源兄所做及日前文明兄所 post 二篇中论的比较. 如

>>     若法是无者  是<<即||则>>无有灭  譬如第二头  无故不可断
>
>「妙云集」: 则
>「大正藏」: 即
>「佛教藏」: 即
>
>★「大正藏」注解:即=则。

那是很辛苦的工作, 那我写的那个巨集就用不上了, 故这里要请较有实务经验的
前贤们, 您们希望电脑能做到什麽地步, 能让您们的工作能更方便! 若後学有能力
自当尽力而为.

很感谢那些经典输入及校对的人, 後学仅希望能尽点棉薄之力, 让他们在工作上
能有更大的方便性.

  Heaven
阅读文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org