|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#1 |
发信站:
National Sun Yet San University
(m2.dj.net.tw>, 信区: BudaTech)
|
/6F wrote:
>
> Heaven wrote:
> >
> > > 全形符号容易被使用在经文中,所以尽量不考虑。另外,全形占两个bytes,
> > > 所处理後的结果恐怕容易超过萤幕宽度,在操作上、视觉上有些不便。
> >
> > 经文中不易出现的符号是比较要注意的地方,
> > 而全形则不是问题, 因为我们用 <<||>> 各二个半形, 也等於一个全形了 :)
>
> 对啊,您说的是,我有点糊涂了。
>
> > 因为我听说有的组合字是大括号, 中括号, 小括号一起使用, 故找个
> > 显眼又不易出现的全形(或半形)就可以了.
> >
> > Heaven
>
> 就我所接触的在佛典资□丑A以全形符号来说,<>《》()【】都是常见的,
> {}比较少见;以半形符号来说,<><<>>()[]也是常见的,{}也比较少见。所以
> 可以考虑{□}或是{{||}}。
>
如果可以将一般使用者的资料格式与资料处理者的资料格式格式加以区隔, 则问题
就简单多了, 例如 home page 的资料处理者的资料格式格式是 html,
而一般使用者
所见的资料是 hypermedia.
--
------------------------------------------------------------------------
张文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
电子佛教藏经阁: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:52:35 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#2 |
发信站:
National Sun Yet San University
(m2.dj.net.tw>, 信区: BudaTech)
|
/6F wrote:
>
> >
> > 其实用全形应也不成问题, 如【如是我闻※茹我是开】
> > 够显眼吧! (酷吧!)
> >
> > 只要是佛经中不易见到的符号, 都可以考虑的.
> >
> > Heaven
>
> 因为还要考虑到以您所撰写的汉书巨集处理後半段作业,所以要尽量避开经文
> 当中可能出现的符号,免得巨集的搜寻出状况。
>
> 例如【【小品经序】※<小品经序>】
>
> 全形符号容易被使用在经文中,所以尽量不考虑。另外,全形占两个bytes,
> 所处理後的结果恐怕容易超过萤幕宽度,在操作上、视觉上有些不便。
>
是否应尽量以普遍性为原则来进行内部资料结构的设计, 而不受限於特定的软体,
尤其是特定软体的特定(巨集)语法, 特定的部份可作为 options; 另,
presentation 的方式, 基本上是可以与内部资料结构所显现的方式分开, 如之前
所提运用颜色来 present,
但内部储存的资料的方式则可以利用特殊的符号或语法.
Fri May 16 12:49:01 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#3 |
发信站:
National Sun Yet San University
(m2.dj.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> 先说声抱歉, 这版完成的很草率, 後学只试过几次, 将会当机的
> bug 捉出来後, 就很懒了, 於是就丢上来,
> 写程式的人很怕测试.... 就算是我的理由吧! :(
>
写程式本就是压炸脑力的事, 也是很伤神的事; 自己写的程式自己再怎麽
测试也抓不完 bug(我, 法两执), 稳定的程式都是别人一测再测的结果,
所以测试的工作能交给别人就交给别人, 这是很正常的; 你的程式如果
是 windows 版, 倒可以用 ms test 来作自动测试的工作.
>
> > 这问题只是个小瑕疵,要修正它只怕有点麻烦。
>
> > 阿那律
> > 阿[少/兔]楼驮
> > 阿<<那律||少/兔]楼驮>>
> > 阿[<<少/兔]楼驮||那律>>
>
> 哇! 果然是大问题, 但是这个要如何解决????
> 待後学用力想一想了.
>
看结果, 应该是对缺字与比对的差别符号间的定义再严谨点就可以.
一直未有时间玩玩此程式, 所以仅能先作观念性的建议 :(
--
------------------------------------------------------------------------
张文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
电子佛教藏经阁: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:51:29 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#4 |
发信站:
National Sun Yet San University
(m2.dj.net.tw>, 信区: BudaTech)
|
/6F wrote:
>
> > > 第二个是发生在咒语的段落,A本原文第一行是「安尔 曼尔 摩
> > > □」,B本原文第一行是「安尔(一)曼尔(二)摩□(三)」。因为B
> > > 本含有咒语计数,A本则没有,所以也造成一阵混乱。
> >
> > 试试把一二三... 九十列入忽略符号... 当然, 这是不负责的作法 :p
> > 因为或许原文就有数字, 如上想法, 以差异太大为由, 手动解决.
>
> 对的,大正藏原文就有数字。我看A只好手动解决了。
>
考虑考虑 mark-up 的方法, mark-up 就是如 html 的 tag 的语法.
--
------------------------------------------------------------------------
张文明
日月工作室
voice: 886-2-658-0270 (home)
email: dnstudio@m2.dj.net.tw 或 wmc@mozart.seed.net.tw
电子佛教藏经阁: http://w5.dj.net.tw/~DNStudio/canon 或
http://www.tyba.org.tw/canon
Fri May 16 12:54:27 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#5 |
发信站:
National Sun Yet San University
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> 送件者: Wen-Ming Chang <dnstudio@m2.dj.net.tw>
> > 其实用全形应也不成问题, 如【如是我闻※茹我是开】
> 是否也可考虑用颜色来加以区别.
因为後来的动作可能是在汉书或 pe2 处理, 所以颜色可能无法加上去.
(您应该说是加上 ansi 控制码吧?)
> 就我所接触的在佛典资料中,以全形符号来说,<>《》()【】都是常见的,
> {}比较少见;以半形符号来说,<><<>>()[]也是常见的,{}也比较少见。所以
> 可以考虑{□}或是{{||}}。
其实符号有很多种, 这种的如何 □如是我闻□茹我是开□ :p
(看来就是我好像喜欢用一眼看去黑黑的符号)
若真考虑{□}或是{{||}}, 我想{ 比较会不小心用到, {{ 连续二个若真
用到, 也太不小心了...
Heaven
Fri May 16 12:55:35 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#6 |
发信站:
National Sun Yet San University
(tpts1.seed.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> > 送件者: Wen-Ming Chang <dnstudio@m2.dj.net.tw>
> > > 其实用全形应也不成问题, 如【如是我闻※茹我是开】
> > 是否也可考虑用颜色来加以区别.
>
> 因为後来的动作可能是在汉书或 pe2 处理, 所以颜色可能无法加上去.
> (您应该说是加上 ansi 控制码吧?)
另一种使文字加上颜色的方式,就是类似WORD的文件。当初您不是考虑到
wordbasic吗?如果後段作业不是在汉书(for DOS)上,而是在WORD上头
,那麽标上颜色是非常漂亮的。不过,量力而为吧,实用就好啦。大家给
你的建议,希望不会造成压力。
> > 就我所接触的在佛典资料中,以全形符号来说,<>《》()【】都是常见的,
> > {}比较少见;以半形符号来说,<><<>>()[]也是常见的,{}也比较少见。所以
> > 可以考虑{□}或是{{||}}。
>
> 其实符号有很多种, 这种的如何 □如是我闻□茹我是开□ :p
> (看来就是我好像喜欢用一眼看去黑黑的符号)
您这组倒是很帅,不错哦!只是有些人在经文前後,常以这类全形符号来
美化版面。
> 若真考虑{□}或是{{||}}, 我想{ 比较会不小心用到, {{ 连续二个若真
> 用到, 也太不小心了...
□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□
Fri May 16 15:20:17 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#7 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > > 是否也可考虑用颜色来加以区别.
> > 因为後来的动作可能是在汉书或 pe2 处理, 所以颜色可能无法加上去.
> 另一种使文字加上颜色的方式,就是类似WORD的文件。
有关 word 部份, 我想是可以在读入 word 之後, run 支巨集, 将 {{ || }}
用不同颜色隔开, 这点应不成问题, 所以程式不用另外处理.
但.... 读入 word 要作什麽? 因为我还没想到如何在 word 下自动找出
二篇文章之差异并帮助我们修改 :p
上回那个简单的汉书巨集有人试用过吗? 我是指试著去修改一整篇文章,
我想了解在使用上有何不方便之处, 目前我只知道在修正时游标不要乱动,
否则会找不到家 :)
Heaven
Fri May 16 18:48:26 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#8 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > > 阿那律
> > > 阿[少/兔]楼驮
> > > 阿<<那律||少/兔]楼驮>>
> > > 阿[<<少/兔]楼驮||那律>>
> 看结果, 应该是对缺字与比对的差别符号间的定义再严谨点就可以.
我想了一下, 这点程式可能无法判断, 目前想法是靠汉书巨集加上人来判断,
後学再想看看好了.
> 一直未有时间玩玩此程式, 所以仅能先作观念性的建议 :(
其实张兄提了不少建议, 但後学有些看不太懂, 希望张兄有空能
再多指点一下, 谢谢 :)
Heaven
Fri May 16 18:49:43 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#9 |
wmc
发信站:
国立中山大学网路组 Mailing List
(mozart.seed.net.tw , 信区: BudaTech)
|
Heaven wrote:
>
> > > > 阿那律
> > > > 阿[少/兔]楼驮
> > > > 阿<<那律||少/兔]楼驮>>
> > > > 阿[<<少/兔]楼驮||那律>>
> > 看结果, 应该是对缺字与比对的差别符号间的定义再严谨点就可以.
>
引用的前文太少, 我有点不知在谈啥了; 应该是要说在程式内要把缺字组字
当作一个字来处理. 因此比较结果才会是:
阿<<那律||[少/兔]楼驮>>
阿<<[少/兔]楼驮||那律>>
以上如果文不对题, 还请包涵.
> 我想了一下, 这点程式可能无法判断, 目前想法是靠汉书巨集加上人来判断,
> 後学再想看看好了.
>
汉书实在不熟帮不上忙, word 我还可以, 不过不知要判断?
> 其实张兄提了不少建议, 但後学有些看不太懂, 希望张兄有空能
> 再多指点一下, 谢谢 :)
>
其实早就想, 现在插花又好像使不上力, 多包涵罗.
Fri May 16 19:54:38 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#10 |
发信站:
国立中山大学网路组 Mailing List
(tpts1.seed.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> 上回那个简单的汉书巨集有人试用过吗? 我是指试著去修改一整篇文章,
> 我想了解在使用上有何不方便之处, 目前我只知道在修正时游标不要乱动,
> 否则会找不到家 :)
说实在的,使用时真的不能乱动游标,不然不但会找不到家,甚至会无故
去掉一大区块文字。这本来是後面才要跟你讨论的,因为我觉得那个问题
应该不难解决。
还有,很重要的一个题外话,不知道你看到公告没有,我们这 mailing
list 的信件已经自动转上 tw.bbs.soc.religion.buddhism。对於这fgfc
程式的讨论,我想 tw.bbs.soc.religion.buddhism 的参与者一定看得满
头雾水,因为他们看不到我们之前的一堆讨论。所以,您看怎麽办?
□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□
Fri May 16 23:42:55 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#11 |
发信站:
国立中山大学网路组 Mailing List
(tpts1.seed.net.tw>, 信区: BudaTech)
|
wmc wrote:
>
> Heaven wrote:
> >
> > > > > 阿那律
> > > > > 阿[少/兔]楼驮
> > > > > 阿<<那律||少/兔]楼驮>>
> > > > > 阿[<<少/兔]楼驮||那律>>
> > > 看结果, 应该是对缺字与比对的差别符号间的定义再严谨点就可以.
> >
> 引用的前文太少, 我有点不知在谈啥了; 应该是要说在程式内要把缺字组字
> 当作一个字来处理. 因此比较结果才会是:
> 阿<<那律||[少/兔]楼驮>>
> 阿<<[少/兔]楼驮||那律>>
> 以上如果文不对题, 还请包涵.
>
> > 我想了一下, 这点程式可能无法判断, 目前想法是靠汉书巨集加上人来判断,
> > 後学再想看看好了.
我想fgfc在执行时,因为内定值省略了全形及半形符号,也就是忽视这些符号
而通通不予比较,所以其执行结果中对於符号的处理有些失当。
假设fgfc在执行时,把重要的全形符号(如:「」『』()【】%∞+-◎)
及半形符号(如:()[]<>/*+-@)也列入比较□围,我想大概就不会这样了。
想归想,我动手试验了一下。这次舍弃内定值,采取自定值,我在 Fgfcsign.
txt 里面放了以下七个全形符号--,。;:?!□--表示只忽略这些符号不比
较,其它的通通要比较。然後下达指令来比较AB两本法华经:
fgfc /e fg0262a.txt fg0262b.txt a.txt b.txt x.txt 100 4
结果呢,差异太多,程式中断。我试著扩大「最大容许差异的中文字数」,从
120、150、180都不行,直到 200才顺利完成。
从底下这个例子可以看出我上面的猜测大概没错。
A本原文 阿(ㄋㄡ□)楼驮
B本原文 阿[少/兔]楼驮
【上次使用内定值的结果】
A本处理结果 阿(<<ㄋㄡ□||少/兔>>)楼驮
B本处理结果 阿[<<少/兔||ㄋㄡ□>>]楼驮
【这次采用自定值的结果】
A本处理结果 阿<<(ㄋㄡ□)||少/兔>>楼驮
B本处理结果 阿[<<少/兔||(ㄋㄡ□)>>]楼驮
请注意,全形小括号搞对了吧!但是,半形中括号还是老样子;可见,半形符
号仍是这个程式不予比较的东西。记得 heaven 说过,若连半形符号也要比较
,得要大费周章。不过,假如能让使用者自订所要比较的半形符号,那麽今天
讨论的这个问题可能就有解了。
□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□
Sat May 17 01:12:43 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#12 |
发信站:
国立中山大学网路组 Mailing List
(tpts1.seed.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> 有关 word 部份, 我想是可以在读入 word 之後, run 支巨集, 将 {{ || }}
> 用不同颜色隔开, 这点应不成问题, 所以程式不用另外处理.
>
> 但.... 读入 word 要作什麽? 因为我还没想到如何在 word 下自动找出
> 二篇文章之差异并帮助我们修改 :p
>
> 上回那个简单的汉书巨集有人试用过吗? 我是指试著去修改一整篇文章,
> 我想了解在使用上有何不方便之处, 目前我只知道在修正时游标不要乱动,
> 否则会找不到家 :)
针对你所写的汉书巨集,我再做两点补充:
1.操作巨集键时,得先执行ALT+1这个巨集键,然後才可以执行ALT+2或ALT+3,
。如果不这样,当你按错了,第一次就按到ALT+2或ALT+3,那麽後果可能会
很惨的,也就是我前函所指的无故被删掉一大块文字。
2.因为这几个巨集键的作用,ALT+1 是找到文字差异处,接著的ALT+2及ALT+3
皆同时会对所开启的A、B两档进行差异处的修改,也就是当你按 ALT+2或
ALT+3 时,A、B两档一前一後都被修改了。
那麽问题就来了,如果操作上稍一不慎而导致改错资料时,因为汉书在这种
状况只能undo一次,但是刚才的动作是修改了A档及B档,所以只能将一个
档案恢复成修改前状态,另一个档案则无法undo回来。这个很麻烦的,可能
整个修改动作得要从头来过才比较保险。
这种情况若是在WORD上头,我想undo不是问题。所以改成以WORD来完成後段
作业,除了可以文字颜色清楚显示差异处外,至少也有undo这个好处。(听
说WORD可以让你後悔一百次。)
□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail: maha@tpts1.seed.net.tw
Tel: (02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□
Sat May 17 02:19:13 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#13 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
写一下前因後果, 也希望大家能一起帮忙.
若您能花点时间看这一篇, 或许可以省下不少时间参考旧信 :)
> 还有,很重要的一个题外话,不知道你看到公告没有,我们这 mailing
> list 的信件已经自动转上 tw.bbs.soc.religion.buddhism。对於这fgfc
> 程式的讨论,我想 tw.bbs.soc.religion.buddhism 的参与者一定看得满
> 头雾水,因为他们看不到我们之前的一堆讨论。所以,您看怎麽办?
因有不少朋友在做佛典电子化的工作, 因□於有些文章已由不同的朋友重覆输入,
故有人想到一个好点子 (後学觉得想这个点子的人很天才耶) 将不同人输入的文章
拿来做比较, 找出其中的差异, 如此就很快能找出输入的错误或版本不同的地方.
由比较结果再来参照原始输入的版本, 如此就能很快校对出大部份的错误, 除非二
人都在同一个地方输入错误, 但这实在是太巧了吧 ...
後学不才, 略懂程式设计, 故动手写了一支小程式叫 FGFC ,
工作原理大概是将二篇文
章读入, 略去一切半形英文符号及部份全形中文符号 (中文符号以第一个 BYTE > 127
为判断方法) , 比较後产生三个档, 二个为依原输入格式, 一个为差异比较表.
举例如下:
(底下为执行 "FGFC A B AA BB XX 5 2" 的结果)
=======文章A===========
床前明月光, 疑是天上霜.
举头望月亮, 低头思故乡.
=======文章B===========
窗前明月光,
疑是地上霜。
举头望明月,
低头想故乡。
======比较结果 AA======
<<床||窗>>前明月光, 疑是<<天||地>>上霜.
举头望<<月亮||明月>>, 低头<<思||想>>故乡.
======比较结果 BB======
<<窗||床>>前明月光,
疑是<<地||天>>上霜。
举头望<<明月||月亮>>,
低头<<想||思>>故乡。
====== 比较结果差异表 XX======
******* A
1: 床
******* B
1: 窗
*******
******* A
1: 天
******* B
2: 地
*******
******* A
2: 月亮
******* B
3: 明月
*******
******* A
2: 思
******* B
4: 想
*******
====== 档案比对结束 ======
看了累吗? 希望您加油 :)
第一版的 FGFC 只产生了比较档, 後来因为有了比较档後, 修改的人还要看原稿,
看比较档, 再看电子档, 然後查行数, 找相异处, 後学只做了一次,
才知道前人的辛苦.
故在第二版之後又产生了二份结果档 (上例的档 AA 及档 BB) ,
可以看到下面这种符号.
<< (本篇文章所用的字) || (另一篇文章所用的字) >>
後学又写了一个非常简□的汉书巨集指令, 用来寻找 <<||>> 符号处,
并由使用者决定
要使用第一组或第二组. 以减少寻找某行某字的时间.
问题来罗! 因为一些程式上的缺陷, 有些功能尚未解决,
希望各种专长的网友能提供意见.
1.比较逻辑的问题, 题目如下 (假设连续两字相同则判断为相同) :
色空空不异色色即是空空即是色
色不异空空不异色色即是空空即是色
程式会比较成(好的结果)
色 空空不异色色即是空空即是色
色不异空空不异色色即是空空即是色
但反过来有时会比较成(这样就乱了)
色 不异 空空...不异色色即是空空即是色
色空空不异色色即是空空...即是色
就是类似下列二组字串, OO 代表相同的,XX 代表不同的,我们要如何找出来
而不误判.
OOXXXOOOO
OOXXXXXOOOO
2. 半形符号的影响:
罗侯罗
罗[目*侯]罗
上二段比较後产生:
罗<<||目>>侯罗
罗[<<目||>>*侯]罗
如果都要使用第一组 (自己的那组) 则没问题, 但若要用第二组, 就分别变成
Mon May 19 13:06:42 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#14 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
写一下前因後果, 也希望大家能一起帮忙.
若您能花点时间看这一篇, 或许可以省下不少时间参考旧信 :)
> 还有,很重要的一个题外话,不知道你看到公告没有,我们这 mailing
> list 的信件已经自动转上 tw.bbs.soc.religion.buddhism。对於这fgfc
> 程式的讨论,我想 tw.bbs.soc.religion.buddhism 的参与者一定看得满
> 头雾水,因为他们看不到我们之前的一堆讨论。所以,您看怎麽办?
因有不少朋友在做佛典电子化的工作, 因□於有些文章已由不同的朋友重覆输入,
故有人想到一个好点子 (後学觉得想这个点子的人很天才耶) 将不同人输入的文章
拿来做比较, 找出其中的差异, 如此就很快能找出输入的错误或版本不同的地方.
由比较结果再来参照原始输入的版本, 如此就能很快校对出大部份的错误, 除非二
人都在同一个地方输入错误, 但这实在是太巧了吧 ...
後学不才, 略懂程式设计, 故动手写了一支小程式叫 FGFC ,
工作原理大概是将二篇文
章读入, 略去一切半形英文符号及部份全形中文符号 (中文符号以第一个 BYTE > 127
为判断方法) , 比较後产生三个档, 二个为依原输入格式, 一个为差异比较表.
举例如下:
(底下为执行 "FGFC A B AA BB XX 5 2" 的结果)
=======文章A===========
床前明月光, 疑是天上霜.
举头望月亮, 低头思故乡.
=======文章B===========
窗前明月光,
疑是地上霜。
举头望明月,
低头想故乡。
======比较结果 AA======
<<床||窗>>前明月光, 疑是<<天||地>>上霜.
举头望<<月亮||明月>>, 低头<<思||想>>故乡.
======比较结果 BB======
<<窗||床>>前明月光,
疑是<<地||天>>上霜。
举头望<<明月||月亮>>,
低头<<想||思>>故乡。
====== 比较结果差异表 XX======
******* A
1: 床
******* B
1: 窗
*******
******* A
1: 天
******* B
2: 地
*******
******* A
2: 月亮
******* B
3: 明月
*******
******* A
2: 思
******* B
4: 想
*******
====== 档案比对结束 ======
看了累吗? 希望您加油 :)
第一版的 FGFC 只产生了比较档, 後来因为有了比较档後, 修改的人还要看原稿,
看比较档, 再看电子档, 然後查行数, 找相异处, 後学只做了一次,
才知道前人的辛苦.
故在第二版之後又产生了二份结果档 (上例的档 AA 及档 BB) ,
可以看到下面这种符号.
<< (本篇文章所用的字) || (另一篇文章所用的字) >>
後学又写了一个非常简□的汉书巨集指令, 用来寻找 <<||>> 符号处,
并由使用者决定
要使用第一组或第二组. 以减少寻找某行某字的时间.
问题来罗! 因为一些程式上的缺陷, 有些功能尚未解决,
希望各种专长的网友能提供意见.
1.比较逻辑的问题, 题目如下 (假设连续两字相同则判断为相同) :
色空空不异色色即是空空即是色
色不异空空不异色色即是空空即是色
程式会比较成(好的结果)
色 空空不异色色即是空空即是色
色不异空空不异色色即是空空即是色
但反过来有时会比较成(这样就乱了)
色 不异 空空...不异色色即是空空即是色
色空空不异色色即是空空...即是色
就是类似下列二组字串, OO 代表相同的,XX 代表不同的,我们要如何找出来
而不误判.
OOXXXOOOO
OOXXXXXOOOO
2. 半形符号的影响:
罗侯罗
罗[目*侯]罗
上二段比较後产生:
罗<<||目>>侯罗
罗[<<目||>>*侯]罗
如果都要使用第一组 (自己的那组) 则没问题, 但若要用第二组, 就分别变成
罗目侯罗
罗[*侯]罗
造成半形符号有的多, 有的少, 这点是因为程式本来不处理任何半形, 结果不理想.
这点有待後学再想想, 当然也希望有人能完全不依後学原来的想法, 重新想看看, 是
否有较好的方法来比较二篇文章.
3.这点比较不重要, 因为在产生二篇有比较符号 <<||>> 的文章後, 须要用些好方法
来快速找到差异并改成我们要的版本, 之前後学是用汉书的巨集写了一个, 但不够好
, 而且有加上第二个问题半形造成的困扰, 所以目前并没有打算这方面改良, 直到前
面的问题解决, 有了较正确的结果档後, 才能依结果档来做进一步的处理.
当初有想到用 Word Basic 来处理, 想像中的画面是读入二篇文章後,
出现一个对话
框, 并有下列的按钮, 计功能有:
找到下一个 <<||>> 处 (还有不同的颜色来表示) ,
取用第一组,
取用第二组,
皆取用第一组 (表示二者都可以, 尊重原输入者或原版本),
二皆皆有错, 并由使用者输入正确的文字.
并且在取用前还先预视取用後的结果, 嗯... 想起来就不错,
> 送件者: wmc <wmc@mozart.seed.net.tw>
> 汉书实在不熟帮不上忙, word 我还可以, 不过不知要判断?
文明兄, 您大概了解了吗? :p
大概就这三个问题, 不过第三个要等第二个解决後才能进行, 故可稍缓,
目前既然接上 news , 各路好手应有不少, 待收集多点意见, 再来改进,
後学也可稍缓改版 :p
至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
通常後学都放不上去, 可能又要麻烦大刚兄了 :)
其实, 真正辛苦的, 还是那些埋首佛典输入的朋友, 没有他们, 这一切
都没有意义了.
Heaven
Mon May 19 13:38:50 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#15 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> 还有,很重要的一个题外话,不知道你看到公告没有,我们这 mailing
> list 的信件已经自动转上 tw.bbs.soc.religion.buddhism。对於这fgfc
> 程式的讨论,我想 tw.bbs.soc.religion.buddhism 的参与者一定看得满
> 头雾水,因为他们看不到我们之前的一堆讨论。所以,您看怎麽办?
想到一个问题, 若有其它网友在 news 上回信, mail list 会将那些信转回来吗?
若不会, 那不就要上 news 才能看到最完整的? 那 mail list 是否也失去了当时
成立的意义? (是否因目的特殊, 所以当初不在网路上公开讨论?)
Heaven
Mon May 19 15:01:46 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#16 |
发信站:
国立中山大学网路组 Mailing List
(m2.dj.net.tw>, 信区: BudaTech)
|
> 2. 半形符号的影响:
>
> 罗侯罗
> 罗[目*侯]罗
>
> 上二段比较後产生:
>
> 罗<<||目>>侯罗
> 罗[<<目||>>*侯]罗
>
> 如果都要使用第一组 (自己的那组) 则没问题, 但若要用第二组, 就分别变成
>
> 罗目侯罗
> 罗[*侯]罗
>
> 造成半形符号有的多, 有的少, 这点是因为程式本来不处理任何半形, 结果不理想.
> 这点有待後学再想想, 当然也希望有人能完全不依後学原来的想法, 重新想看看, 是
> 否有较好的方法来比较二篇文章.
>
还是上次那句老话, 只要把缺字组字当成一个字来处理, 建议您在 command line
options 内加一个是否要处理缺字组字的选项. 程式内比对处理时,
侯是与[目*侯]
来比, 因此 []及其内的半形符号不要在 read file 後去掉.
>
> 文明兄, 您大概了解了吗? :p
>
了解 :)
>
> 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
>
您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
Tue May 20 14:41:41 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#17 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > 罗侯罗
> > 罗[目*侯]罗
> > 上二段比较後产生:
> > 罗<<||目>>侯罗
> > 罗[<<目||>>*侯]罗
> 还是上次那句老话, 只要把缺字组字当成一个字来处理, 建议您在 command line
> options 内加一个是否要处理缺字组字的选项. 程式内比对处理时,
> 侯是与[目*侯]
> 来比, 因此 []及其内的半形符号不要在 read file 後去掉.
大概是因为程式在一开始就没规划的很好, 比较时, 程式中读入100个中文字後
再用 c 的函数来做字串比较, 所以我也不知如何将其视为一个字...
喔... 我忽然想到一点了, 当初我曾想到做一个不要比较的列表如下:
然==燃
唯==惟
.....
因为版本问题, 有些字是各版的差异, 可以不用比较, 若在比较时就直接忽略,
则可以省下不少修正的时间. 您的意思是否再加上
侯==[目*侯]
侯==(目*侯)
侯==[目∞侯]
侯==(目∞侯)
.....
嗯... 这样或许可行, 但变化大概有七十二种吧! (开玩笑的:)
後学是有想到一个方法, 当读入半形字时 (ascii < 128) , 自动在前面补上 ascii =
01 的字,
如此一来在电脑中就全部都是双位元了 (可以国际化了 :p ) , 这时就不管中文,
英文,
先比较再说, 等到输入时, 再将 01 除去即可.
这个想法尚未成熟, 有空还要再想看看有没有其它问题. 至於 01
只是想找一个佛典不可会
输入的 ascii 即可.
> > 文明兄, 您大概了解了吗? :p
> 了解 :)
多谢张兄, word basic 就麻烦您伤点脑筋了 (好像在陷害您一样 :p )
> > 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> > 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
> 您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
谢谢您了, 刚刚上东坡站, 她不让我用匿名侵入 :(
後学先 mail 一份给您, 待您放上网站後, 再烦麻您通知大家.
又, 这份原 mail list 的朋友已被後学强迫收了一份, 除了 fgfc.pro (汉书巨集)
中的判断符号由 ((||)) 改成 <<||>> , 其馀没变. 主要是想让 news
上有兴趣的朋友
参考一下.
Heaven
Tue May 20 15:43:31 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#18 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > > > 罗侯罗
> > > > 罗[目*侯]罗
> > > > 上二段比较後产生:
> > > > 罗<<||目>>侯罗
> > > > 罗[<<目||>>*侯]罗
> 可有两个方式, 一个是改资料结构, 一个是改比较函数, 要看你对哪一种较熟悉;
> ...
> > 侯==[目*侯]
> > 侯==(目*侯)
> > 侯==[目∞侯]
> > 侯==(目∞侯)
> > ...
> 如果左边是右边的通用字.
因为这种方式, 我担心要特别处理的组字会愈来愈多, 所以暂不考虑,
希望下列的想法
能一劳永逸解决这类问题.
> > 後学是有想到一个方法, 当读入半形字时 (ascii < 128) , 自动在前面补上
ascii =
> > 01 的字,
> > 先比较再说, 等到输入时, 再将 01 除去即可.
> 你的意思应该是输出时, 再将 01 除去?
是的, 例如读到这种句子
佛告[罗[目*侯]罗,
佛 告 [ 罗 [ 目 * 侯 ] 罗 ,
A6F2 A769 5B C3B9 5B A5D8 2A AB4A 5D C3B9 2C -->
原来读到的 ASCII
A6F2 A769 015B C3B9 015B A5D8 012A AB4A 015D C3B9 2C -->
半形加上个01
这样一来就没有中文英文的问题了, 全部都是双位元,
如此只要把想要忽略的中英文字放在另一档来判断即可.
等到要输出时, 再去掉 01 即可.
不知这种逻辑有没有什麽问题? (其实我还没花时间好好想一遍 :p )
> > 多谢张兄, word basic 就麻烦您伤点脑筋了 (好像在陷害您一样 :p )
> Don't depend on me :) 发心容易发力难.
我知道您是大忙人, 还有许多事靠您处理中 :)
word basic 这部份先放著, 等有较好的比较结果後, 再来考虑後续问题好了.
Heaven
Wed May 21 11:07:35 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#19 |
发信站:
国立中山大学网路组 Mailing List
(tpts1.seed.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> > > 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> > > 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
> > 您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
>
> 谢谢您了, 刚刚上东坡站, 她不让我用匿名侵入 :(
我刚刚上东坡站,好像又恢复正常了。
如果东坡状况经常不稳,建议大刚(david)借用台大佛研中心(cbs)
的一小块硬碟空间,专门弄个 upload 区给大家用。或许这样对於将
upload 区资料整理到 cbs 的佛教经典系列WWW 也会比较方便。
□□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail:maha@tpts1.seed.net.tw
Tel:(02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□□
Wed May 21 18:07:46 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#20 |
wmc
发信站:
国立中山大学网路组 Mailing List
(mozart.seed.net.tw , 信区: BudaTech)
|
Heaven wrote:
>
> 不过这个版本 mail-list 的朋友都收到过了, 若 news
> 上的朋友有兴趣欢迎测试并提供意见.
> 但是, 好像没有开启一般使用者读取权限, 可能要请大刚兄帮个忙了.
upload 区顾名思义只能上载而不能下载, 所以已先放在电子佛教藏经阁
http://w5.dj.net.tw/~dnstudio/canon 上, 可供 news 上的朋友下载.
Thu May 22 11:55:06 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#21 |
发信站:
国立中山大学网路组 Mailing List
(m2.dj.net.tw>, 信区: BudaTech)
|
> 2. 半形符号的影响:
>
> 罗侯罗
> 罗[目*侯]罗
>
> 上二段比较後产生:
>
> 罗<<||目>>侯罗
> 罗[<<目||>>*侯]罗
>
> 如果都要使用第一组 (自己的那组) 则没问题, 但若要用第二组, 就分别变成
>
> 罗目侯罗
> 罗[*侯]罗
>
> 造成半形符号有的多, 有的少, 这点是因为程式本来不处理任何半形, 结果不理想.
> 这点有待後学再想想, 当然也希望有人能完全不依後学原来的想法, 重新想看看, 是
> 否有较好的方法来比较二篇文章.
>
还是上次那句老话, 只要把缺字组字当成一个字来处理, 建议您在 command line
options 内加一个是否要处理缺字组字的选项. 程式内比对处理时,
侯是与[目*侯]
来比, 因此 []及其内的半形符号不要在 read file 後去掉.
>
> 文明兄, 您大概了解了吗? :p
>
了解 :)
>
> 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
>
您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
Tue May 20 14:41:41 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#22 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > 罗侯罗
> > 罗[目*侯]罗
> > 上二段比较後产生:
> > 罗<<||目>>侯罗
> > 罗[<<目||>>*侯]罗
> 还是上次那句老话, 只要把缺字组字当成一个字来处理, 建议您在 command line
> options 内加一个是否要处理缺字组字的选项. 程式内比对处理时,
> 侯是与[目*侯]
> 来比, 因此 []及其内的半形符号不要在 read file 後去掉.
大概是因为程式在一开始就没规划的很好, 比较时, 程式中读入100个中文字後
再用 c 的函数来做字串比较, 所以我也不知如何将其视为一个字...
喔... 我忽然想到一点了, 当初我曾想到做一个不要比较的列表如下:
然==燃
唯==惟
.....
因为版本问题, 有些字是各版的差异, 可以不用比较, 若在比较时就直接忽略,
则可以省下不少修正的时间. 您的意思是否再加上
侯==[目*侯]
侯==(目*侯)
侯==[目∞侯]
侯==(目∞侯)
.....
嗯... 这样或许可行, 但变化大概有七十二种吧! (开玩笑的:)
後学是有想到一个方法, 当读入半形字时 (ascii < 128) , 自动在前面补上 ascii =
01 的字,
如此一来在电脑中就全部都是双位元了 (可以国际化了 :p ) , 这时就不管中文,
英文,
先比较再说, 等到输入时, 再将 01 除去即可.
这个想法尚未成熟, 有空还要再想看看有没有其它问题. 至於 01
只是想找一个佛典不可会
输入的 ascii 即可.
> > 文明兄, 您大概了解了吗? :p
> 了解 :)
多谢张兄, word basic 就麻烦您伤点脑筋了 (好像在陷害您一样 :p )
> > 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> > 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
> 您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
谢谢您了, 刚刚上东坡站, 她不让我用匿名侵入 :(
後学先 mail 一份给您, 待您放上网站後, 再烦麻您通知大家.
又, 这份原 mail list 的朋友已被後学强迫收了一份, 除了 fgfc.pro (汉书巨集)
中的判断符号由 ((||)) 改成 <<||>> , 其馀没变. 主要是想让 news
上有兴趣的朋友
参考一下.
Heaven
Tue May 20 15:43:31 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#23 |
发信站:
国立中山大学网路组 Mailing List
(mail.chinatrust.com.tw>, 信区: BudaTech)
|
> > > > 罗侯罗
> > > > 罗[目*侯]罗
> > > > 上二段比较後产生:
> > > > 罗<<||目>>侯罗
> > > > 罗[<<目||>>*侯]罗
> 可有两个方式, 一个是改资料结构, 一个是改比较函数, 要看你对哪一种较熟悉;
> ...
> > 侯==[目*侯]
> > 侯==(目*侯)
> > 侯==[目∞侯]
> > 侯==(目∞侯)
> > ...
> 如果左边是右边的通用字.
因为这种方式, 我担心要特别处理的组字会愈来愈多, 所以暂不考虑,
希望下列的想法
能一劳永逸解决这类问题.
> > 後学是有想到一个方法, 当读入半形字时 (ascii < 128) , 自动在前面补上
ascii =
> > 01 的字,
> > 先比较再说, 等到输入时, 再将 01 除去即可.
> 你的意思应该是输出时, 再将 01 除去?
是的, 例如读到这种句子
佛告[罗[目*侯]罗,
佛 告 [ 罗 [ 目 * 侯 ] 罗 ,
A6F2 A769 5B C3B9 5B A5D8 2A AB4A 5D C3B9 2C -->
原来读到的 ASCII
A6F2 A769 015B C3B9 015B A5D8 012A AB4A 015D C3B9 2C -->
半形加上个01
这样一来就没有中文英文的问题了, 全部都是双位元,
如此只要把想要忽略的中英文字放在另一档来判断即可.
等到要输出时, 再去掉 01 即可.
不知这种逻辑有没有什麽问题? (其实我还没花时间好好想一遍 :p )
> > 多谢张兄, word basic 就麻烦您伤点脑筋了 (好像在陷害您一样 :p )
> Don't depend on me :) 发心容易发力难.
我知道您是大忙人, 还有许多事靠您处理中 :)
word basic 这部份先放著, 等有较好的比较结果後, 再来考虑後续问题好了.
Heaven
Wed May 21 11:07:35 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#24 |
发信站:
国立中山大学网路组 Mailing List
(tpts1.seed.net.tw>, 信区: BudaTech)
|
Heaven wrote:
>
> > > 至於最新版的 fgfc 及汉书巨集, 待後学放上东坡站後再通知大家,
> > > 通常後学都放不上去, 可能又要麻烦大刚兄了 :)
> > 您要不嫌弃的话, 电子佛教藏经阁也可放上一份.
>
> 谢谢您了, 刚刚上东坡站, 她不让我用匿名侵入 :(
我刚刚上东坡站,好像又恢复正常了。
如果东坡状况经常不稳,建议大刚(david)借用台大佛研中心(cbs)
的一小块硬碟空间,专门弄个 upload 区给大家用。或许这样对於将
upload 区资料整理到 cbs 的佛教经典系列WWW 也会比较方便。
□□□□□□□□□□□□□□□□□
摩诃工作室.吴宝原
E-mail:maha@tpts1.seed.net.tw
Tel:(02)6741715/Fax:(02)6741716
□□□□□□□□□□□□□□□□□
Wed May 21 18:07:46 1997
|
|
|
Re: fgfc 第三次改版, 请帮忙测试并提供意见.
|
#25 |
wmc
发信站:
国立中山大学网路组 Mailing List
(mozart.seed.net.tw , 信区: BudaTech)
|
Heaven wrote:
>
> 不过这个版本 mail-list 的朋友都收到过了, 若 news
> 上的朋友有兴趣欢迎测试并提供意见.
> 但是, 好像没有开启一般使用者读取权限, 可能要请大刚兄帮个忙了.
upload 区顾名思义只能上载而不能下载, 所以已先放在电子佛教藏经阁
http://w5.dj.net.tw/~dnstudio/canon 上, 可供 news 上的朋友下载.
Thu May 22 11:55:06 1997
|
|
□ 台大狮子吼佛学专站 http://buddhaspace.org
| |