看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: "Heaven" <j120006632@mail.chinatrust.com.tw>, 信区: BudaTech 标 题: [buda-tech] fgfc 第四次改版, 请帮忙测试并提供意见. 发信站: 国立中山大学网路组 Mailing List (Tue Jun 3 11:47:02 1997) 转信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu 来 源: sccid.nsysu.edu.tw fgfc 第四次改版, 重点有: 1. 将结果之判断符号由 << || >> 改成 {{ || }} 避免和某些经文重覆. (好像每版都有改 :p) 2. 这回判断连半形也包括进来了, 而内定的忽略符号则减缩为: 忽略半形符号为 ,.:;?! 及数字 0~9 及字母 A~Z, a~z 忽略中文符号为(A140~A154) ,、。..;:?!∶…¨,、··;:?! 而 ASCII 码从 0 ~ 31 为控制码, 不论有无使用外挂档案.本程式完全忽略 可以看出我只将控制码, 空白及标点符号列为忽略字, 尤其是控制码 (ascii 0~31) 为绝对忽略, 加 /e 参数亦无用. 原因有二, 一来考虑日前讨论的组合字符号问题, 二来有特殊符号出现, 校对者应 当关心一下是什麽符号, 若没什麽特别意义时, 再使用加入外挂档 fgfcsign.txt 中 执行 /b 参数即可. 3. 修改了 fgfc.pro 比较安全了 :p 但仍很粗糙, 下面会讨论到. 这回档案为 fgfc4.exe , 放在东坡站上及 mail 给文明兄一份, 若能给大家取回时, 还麻烦二位 (东坡站当然是大刚兄罗!) 通知一下, 谢谢! fgfc4.exe 内含五个档案 ======== fgfc.exe 文件比较器 -- 专为格式相异之中文文件比较用 (06/03 '97) fgfc.pro 汉书5用的巨集, 用来辅助修正用 fgfc 所产生的比较结果 fgfcpro.txt fgfc.pro 的用法 fgfcsign.all 若想使用 fgfcsing.txt 为外挂的忽略字, 可参考此档 readme.txt 说明档 (就是上面这几行说明) ========= 再者, 由於较好的寻找相同段落的逻辑, 还在和别人讨论中, 我想一时无法有结果, 但目前的逻辑已为堪用, 故这回改版重点就放在半形字判断的重点上. 这部份解决後, 日後有较好的寻找相同段落逻辑出现, 亦不影响这部份, 故先动手了. 当有了比较方式的经文出现後, 再来要如何呢? 後学当初写了个很简单的 fgfc.pro , 是用在汉书5的巨集, 可以较方便的将比较版经文直接改成校对的版本. 但在实务上呢? 这要请教宝源兄及文明兄了, 因为您们在处理时, 似乎重点并不是在 修改经文, 使其变成一个没有错字的版本 (若有原稿来稿对) , 而是在列出其二篇文章 的差异性, 如同以前宝源兄所做及日前文明兄所 post 二篇中论的比较. 如 >> 若法是无者 是<<即||则>>无有灭 譬如第二头 无故不可断 > >「妙云集」: 则 >「大正藏」: 即 >「佛教藏」: 即 > >★「大正藏」注解:即=则。 那是很辛苦的工作, 那我写的那个巨集就用不上了, 故这里要请较有实务经验的 前贤们, 您们希望电脑能做到什麽地步, 能让您们的工作能更方便! 若後学有能力 自当尽力而为. 很感谢那些经典输入及校对的人, 後学仅希望能尽点棉薄之力, 让他们在工作上 能有更大的方便性. Heaven |
阅读文章: 第 614/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |