看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 545/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信区: BudaTech 标 题: 文件比较器 发信站: 由 狮子吼站 收信 (Tue Apr 15 12:35:02 1997) 以下是 Heaven 大德的来信, 提供给对佛典电子化有兴趣的朋友们参考: ---------- Forwarded message ---------- Date: Tue, 15 Apr 1997 13:07:43 +0800 From: Heaven <j120006632@mail.chinatrust.com.tw> Subject: □□{式 fgfc.arj 请大家提供意见 for <budmgt@math.ncu.edu.tw>; Tue, 15 Apr 1997 04:38:48 GMT 各位好: 在和 Maha Wu 兄讨论之後, 後学写了一支比较文件用的程式, 执行说明如下: ============ 文件比较器 -- 专为格式相异之中文文件比较用 by Heaven 04/13 '97 用法 : FGFC file1 file2 □例 : FGFC FG0262.07 FG0262G.07 说明 : 本程式专为格式相异之中文文件所设计, 两档案比较时, 忽略一切 英文字, 数字, 符号等 ASCII 码小於 127 的字元. 中文字 (以第 一个 BYTE ASCII 码大於 128 为判断标准) 则忽略一些符号, 目 前忽略的符号为内码 A140 ~ A159 及 A263 ~ A2A7 两段. 日後或 许考虑外挂想要忽略的符号. ============ 其中提及英文都省略不比较, 中文则忽略的符号为内码 A140 ~ A159 及 A263 ~ A2A7 两段, 一组为标点符号, 另一组为画表格用的, 没什麽理由 , 暂定如此而已. 日後有打算考虑外挂档案来指明何种符号可忽略, 若不 指明再以内定为主, 至於内定符号为哪些, 希望听听大家意见. 至於本程式, 我已放上东坡站, ftp://dongpo.math.ncu.edu.tw/buddhism/upload/fgfc.arj 欢迎大家取回测试. ps. 昨日後学又想到一个方法, 就是直接产生一份 (或二份) 内容是原来 的内容加上比较後的结果, 如 : .... N0262P0022a21□应供正遍知明行足善逝世间解无上士调御 N0262P0022a22□丈夫天人师佛世尊。其国名好??成??城??。劫名大 ..... ?? 处表示二个不同版本之间的差异, 到时在汉书等编辑器中, 直接设定 几个巨集, 来寻找 ?? 处, 撰择第组个内容, 撰择第二组内容..等等, 应可更为方便. 不过, 希望大家能更集思广义 (有没有用错成语?) , 想出能最大利用电脑的 方法, 将人工省到最低. 还有, 不知有没有网友熟悉 word basic? 或许其可以更方便的做到这件事, 近日後学会研究看看, 知道的朋友也提供些意见, 谢谢! Heaven |
阅读文章: 第 545/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |