看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 564/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: Maha Wu <maha@tpts1.seed.net.tw>, 信区: BudaTech
标  题: Re: Fw: 比较程式 fgfc.arj 请大家提供意见
发信站: National Sun Yet San University (Sat Apr 19 19:42:35 1997)
转信站: Lion!ccnews.nsysu!buda-tech@sccid.nsysu
来  源: sccid.nsysu.edu.tw

各位关心电子佛典的朋友:

以下针对 Heaven 所设计的文件比较程式发言,我只是站在使用者的
立场来设想。当然设计程式者也一定有更善巧的处理方式,或是也有
一些不得已的考量。反正,说出来研究研究吧!

Heaven wrote:
> 
> 有关比较程式, 後学有些问题, 希望大家提供意见.
> 若有二档案如下, 依上述之功能, 会有下列结果:
> 
> ==== file 1 =====
> 应供正遍知明行足善逝世间解无上士
> 调御丈夫天人师佛世尊。其国名好城。
> ==============
> 
> =====file 2 =====
> 应供正遍智明行足善逝世间解无上士
> 调御丈夫天人帅弗世尊. 其国名好城.
> ==============
> 
> ===== 希望结果 ===============
> 应供正遍??知??智??明行足善逝世间解无上士
> 调御丈夫天人??师佛??帅弗??世尊。其国名好城。
> ==============

因为 file1、file2 的格式(例如:每行字数、总行数等等)可能不一
样,那麽比较出来的结果是否可设定为两种,第一种是以 file1原档案
格式+差异内容,另一种是 file2原档案格式+差异内容。表示差异内
容时,是以原档案文字放在前面,另一档案文字放在後面。

也就是,例如上面的「希望结果」,即是以 file1原档案格式加上「??
知??智??」等差异内容,其中的「知」是 file1里面的文字,而「智」
则是 file2的。

> 然後写一 he4 巨集 , function key 举例如下:
> 1. F1 : 找到 ?? 处
> 2. F2 : 取第一, 二□?? 之间的字, 第二组自动除去
> 3. F3 : 取第二, 三个 ?? 之间的字, 第一组自动除去
> 4. F4 : 二组皆除去, 留下一小段空白, 自行输入.

如果按我上面的想法,那麽上面所提的「希望结果」(两种版本),已
经是非常好的结果了。用汉书来设定这些  function key,除了F1有些
用处外,其它三个到底有什麽妙用?

> 问题 : 若是二档案如下格式, 您希望产生何种结果? 如何处理?
> 
> ==== file 1 =====
> 应供正遍知明行足善逝世间解无上士
> 调御丈夫天人师佛世尊。其国名好城。
> ==============
> 
> ==== file 2 =====
> 应供正遍知明行足善逝世间解吴
> 上土条御丈夫天人师佛世尊。其
> 国名好城。
> ==============
> 
> ==== 这种格式如何? =====
> 应供正遍知明行足善逝世间解
> ??无上士
> 调??
> ??吴
> 上土条??
> 御丈夫天人师佛世尊。其国名好城。
> ==============

若以 file1格式为主,我希望的格式如下:
============================================
应供正遍知明行足善逝世间解??无上士??吴上土??
??调??条??御丈夫天人师佛世尊。其国名好城。
==============

若以 file2格式为主,我希望的格式如下:
============================================
应供正遍知明行足善逝世间解??吴??无??
上??土条??士调??御丈夫天人师佛世尊。其
国名好城。
==============

我的意思是尽量保持住原档案格式,因为原档案格式当中可能包含
有输入出处记录,例如「大正藏第九册电子档」,利用这个出处记
录,我们可以很快的完成下一个对照原输入经本的步骤。

另外,当保留两个原档案的格式,我们只要把比对结果里面的差异
内容确定出对错,然後删掉错的,留住对的,那麽我们也就在订正
讹误的同时也还原了原档案格式。

但是,以目前的表示方式是有问题的。若依我的想法,我们在符号
表示上及差异字数判断上可能要再费心一下:

  1.符号:「??....??」没有方向性,可考虑采用<[{(等具有方向
          性的符号。并且在左右符号中加入一个分隔符号,例如
          file1
          ============================================
          应供正遍知明行足善逝世间解((无上士||吴上土))
          ((调||条))御丈夫天人师佛世尊。其国名好城。
          ============================================
          file2
          ============================================
          应供正遍知明行足善逝世间解((吴||无))
          上((土条||士调))御丈夫天人师佛世尊。其
          国名好城。
          ============================================
          这样就可以清楚表示。而以後只要寻找||即可找出档案
          里面的差异所在。

  2.差异字数:上例当中「无上士调」跟「吴上土条」,只有「上
          」字一样。那麽在 file1里面是要表示成--
              ((无上士||吴上土))
          或是((无||吴))上((士||土))

> 这种格式由 HE4 来做, 是否能做到自动修正我也没把握,

自动修正?如何可能?总得要人去翻查原书後再加以订正吧!

------------------
摩诃工作室.吴宝原
E-mail:maha@tpts1.seed.net.tw
Tel:(02)6741715/Fax:(02)6741716

阅读文章: 第 564/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org