看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 564/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: Maha Wu <maha@tpts1.seed.net.tw>, 信区: BudaTech 标 题: Re: Fw: 比较程式 fgfc.arj 请大家提供意见 发信站: National Sun Yet San University (Sat Apr 19 19:42:35 1997) 转信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu 来 源: sccid.nsysu.edu.tw 各位关心电子佛典的朋友: 以下针对 Heaven 所设计的文件比较程式发言,我只是站在使用者的 立场来设想。当然设计程式者也一定有更善巧的处理方式,或是也有 一些不得已的考量。反正,说出来研究研究吧! Heaven wrote: > > 有关比较程式, 後学有些问题, 希望大家提供意见. > 若有二档案如下, 依上述之功能, 会有下列结果: > > ==== file 1 ===== > 应供正遍知明行足善逝世间解无上士 > 调御丈夫天人师佛世尊。其国名好城。 > ============== > > =====file 2 ===== > 应供正遍智明行足善逝世间解无上士 > 调御丈夫天人帅弗世尊. 其国名好城. > ============== > > ===== 希望结果 =============== > 应供正遍??知??智??明行足善逝世间解无上士 > 调御丈夫天人??师佛??帅弗??世尊。其国名好城。 > ============== 因为 file1、file2 的格式(例如:每行字数、总行数等等)可能不一 样,那麽比较出来的结果是否可设定为两种,第一种是以 file1原档案 格式+差异内容,另一种是 file2原档案格式+差异内容。表示差异内 容时,是以原档案文字放在前面,另一档案文字放在後面。 也就是,例如上面的「希望结果」,即是以 file1原档案格式加上「?? 知??智??」等差异内容,其中的「知」是 file1里面的文字,而「智」 则是 file2的。 > 然後写一 he4 巨集 , function key 举例如下: > 1. F1 : 找到 ?? 处 > 2. F2 : 取第一, 二□?? 之间的字, 第二组自动除去 > 3. F3 : 取第二, 三个 ?? 之间的字, 第一组自动除去 > 4. F4 : 二组皆除去, 留下一小段空白, 自行输入. 如果按我上面的想法,那麽上面所提的「希望结果」(两种版本),已 经是非常好的结果了。用汉书来设定这些 function key,除了F1有些 用处外,其它三个到底有什麽妙用? > 问题 : 若是二档案如下格式, 您希望产生何种结果? 如何处理? > > ==== file 1 ===== > 应供正遍知明行足善逝世间解无上士 > 调御丈夫天人师佛世尊。其国名好城。 > ============== > > ==== file 2 ===== > 应供正遍知明行足善逝世间解吴 > 上土条御丈夫天人师佛世尊。其 > 国名好城。 > ============== > > ==== 这种格式如何? ===== > 应供正遍知明行足善逝世间解 > ??无上士 > 调?? > ??吴 > 上土条?? > 御丈夫天人师佛世尊。其国名好城。 > ============== 若以 file1格式为主,我希望的格式如下: ============================================ 应供正遍知明行足善逝世间解??无上士??吴上土?? ??调??条??御丈夫天人师佛世尊。其国名好城。 ============== 若以 file2格式为主,我希望的格式如下: ============================================ 应供正遍知明行足善逝世间解??吴??无?? 上??土条??士调??御丈夫天人师佛世尊。其 国名好城。 ============== 我的意思是尽量保持住原档案格式,因为原档案格式当中可能包含 有输入出处记录,例如「大正藏第九册电子档」,利用这个出处记 录,我们可以很快的完成下一个对照原输入经本的步骤。 另外,当保留两个原档案的格式,我们只要把比对结果里面的差异 内容确定出对错,然後删掉错的,留住对的,那麽我们也就在订正 讹误的同时也还原了原档案格式。 但是,以目前的表示方式是有问题的。若依我的想法,我们在符号 表示上及差异字数判断上可能要再费心一下: 1.符号:「??....??」没有方向性,可考虑采用<[{(等具有方向 性的符号。并且在左右符号中加入一个分隔符号,例如 file1 ============================================ 应供正遍知明行足善逝世间解((无上士||吴上土)) ((调||条))御丈夫天人师佛世尊。其国名好城。 ============================================ file2 ============================================ 应供正遍知明行足善逝世间解((吴||无)) 上((土条||士调))御丈夫天人师佛世尊。其 国名好城。 ============================================ 这样就可以清楚表示。而以後只要寻找||即可找出档案 里面的差异所在。 2.差异字数:上例当中「无上士调」跟「吴上土条」,只有「上 」字一样。那麽在 file1里面是要表示成-- ((无上士||吴上土)) 或是((无||吴))上((士||土)) > 这种格式由 HE4 来做, 是否能做到自动修正我也没把握, 自动修正?如何可能?总得要人去翻查原书後再加以订正吧! ------------------ 摩诃工作室.吴宝原 E-mail:maha@tpts1.seed.net.tw Tel:(02)6741715/Fax:(02)6741716 |
阅读文章: 第 564/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |