您有新信

 
Re: 回maha有关大辞典新版之
#1
发信站: 国立中山大学网路组 Mailing List (mail.chinatrust.com.tw>, 信区: BudaTech)
> fkr 格式是我自己定的,乃FKRead (佛光读经器)之前三码。
> FKRead Convertor + user definable rules
> Pure Text --> *.fkr
> 接下来,再由另一支程式解读fkr ,并转成html输出至browser
> *.fkr  ---> HTML
> 我现在正在考虑fkr的格式,要决定其规格真不容易
> 1)大家一齐来决定档案格式,要包括那些内容,预计应有
>     经名(书名),作者,译者,原书页码,版本,输入者,提供者,
>     经文结构等。

  很高兴能看到将这种规格在网路上和大家一起讨论.
  一个人来订规格的确是很不容易的事.

  看来计有
  1. Pure text : 包括各种不同的段落, 缩排... 等差异.
  2.Html 规格.
  3.FKR 规格.

  而目前现有的工作是订定 fkr 规格并考量和其它规格的转换性.
  再进行转换器的制作.

  请问目前是否有 fkr 规格原形及其描述档的样式 (表现出来的样子)
  若能先公布出来一起讨论, 会比较有下手处. 谢谢!

  Heaven
Wed Jun 25 09:11:31 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#2
发信站: 国立中山大学网路组 Mailing List (m2.dj.net.tw>, 信区: BudaTech)
COSINE wrote:
> 
> 新版还是会以光碟发行,只不过改成html相容,至於网路
> 版,目前还有一些技术上及非技术上的问题。我尽力试试。
> 
> 之所以用图形方式显示造字,有三个原因:
> 1)既然是少见到要用「造」的字,检索的机率必定不高,何况也可以用
> ?的方式来代表所有的造字,如罗?罗,一样可查出。
> 2)没有造字空间的问题。
看法相同, 用图形是末学一直在做的, 有人会问那 dos怎麽办? 末学认为
这些 users 从市场的角度言, 是没有必要考虑的.

> 3)现在我们面临的最大问题不是检索,而是造字没有标准,没有标准则
>    无法交换,一切都免谈,所以目前最重要的工作就是建立标准,建立
造字标准?标准造字表? Excuse me. As I know we already have one.
It is the effort by 台大佛研恒清 and 中研院庄德明. Why don't we
keep delevelping based on this one, so the effort won't be waste.

>    一个有弹性的标准。标准一旦形成,我们就可以要求软体系统□/font>
>    字形商,把它  build-in 在系统内,才能把造字问题解决。图形方式
>    大家可把它视作为过渡方案。
> 
这问题的□结应是造字空间有限的问题, 而不是厂商不 build-in 的关系.
谈得更深点还可能是中文文字本身在电脑上应用的根本问题,
例如中文字也在不断演化增加, 只要原来的字增减一画就是一个新字,
目前方言字, 如广东方言字, 闽南方言字, 中国地大人多方言也多,
将来各地方言字都出来, 恐怕在大的造字空间都不够;
不若拉丁字由几个基本字母(character)来组成单字(word), 单字再多
还是由那几个基本字母组成. 这是根本问题, 除非, 电脑字的显示设计
从头来过, 并由中国人主导, 这在可见的未来似乎是不可能的事.

> fkr 格式是我自己定的,乃FKRead (佛光读经器)之前三码。
> 有鉴於佛光大辞典上一版和其他软体整合能力不足及
> 造字的问题,故下一版会考虑直接推出一个读经器,
> 并定出一个新的档案格式,方便大家交换电子佛典。
> 故它不只是电子版的辞典,更像是一个内建线上
> 解释佛学名相的整合的读经介面。
> 
> 我的想法是:
> 
> FKRead Convertor + user definable rules
> Pure Text --> *.fkr
> 
> 大家有自己的输入规格A内缩,造字都不一,不可能
> 强行统一,故应可以经由可程式化的描述档加上
> 转换程式将各家的纯文字档转成统一格式fkr。方便交换。
> 
> 接下来,再由另一支程式解读fkr ,并转成html输出至browser
> 
>  FKRead fkr Parser and Viewer
> 
> *.fkr  ---> HTML
> 

raw text -> html -> fkread (display directly to uer interface)

If there is no format for raw text, then there is not need to
write a parser for it. Since your application runs on Win95,
it's best to follow  the standard interchangable text format in that,
this format nowaday undoubtablly is html. Also, the trend on html is
heading toward dynamic html which you will be able to make multimedia
presentation.


> 此外,版本控制能力,检索能力等也很重要。
MS 的 source safe 是版本控制的软体.

> 我现在正在考虑fkr的格式,要决定其规格真不容易,如果
> 太周详担心implement 很困难,做不出来,太简单又怕没有远见,
> 造成往後compatible的负担,真是一个delimma。
> 佛光大辞典的coding 部份只有我一人在做,辛苦一□S有关系,
> 只是担心会影响进度,让大家久等不好意思,我有以下数点想请
> 大家帮忙,毕竟这是个不小的工程,需要整合很多技术,
> 单靠一人确实有不胜study之慨:
> 
> 1)大家一齐来决定档案格式,要包括那些内容,预计应有
>     经名(书名),作者,译者,原书页码,版本,输入者,提供者,
>     经文结构等。
> 
从全文检索的角度看, 这些应该要建立属性表 (aka database)
来辅助. 记得在妙云集程式的讨论中末学已提过了.

> 2)往後在网路上我们共同来维护一份统一的造字表,用001-->?? , 002--->??表示
>    其中001 002是造字序码,??是造字表达式,(用中研院庄先生的方法)

>    我会把这些造字做成bmp格式小图,在读经器内可以show出来。
>    以後佛光大辞典既然是一个读经器,它就应该有包容各家造字的能力。
> 
末学已经在做了, 末学之前给师父的档案中 budfont.hlp 即是.
16, 24size的 bmp已有近千字, 都是根据庄居士的造字档.

> 3)佛光大辞典v1是用delphi 3.0 compile的,我想没有意外的话,v2
>    也会用delphi 来做,所以请大家推荐对佛典电子化有与趣的delphi高手,
>    我想组成一个 5至10人的cyber-team 来做这做这项工作,就像老外做linux
>    的方式一样。
> 
这是 public domain software 的做法, 师父是说佛光辞典的软体要成为
public domain 的软体?

> 4)我想知道大家对大辞典内图片的看法,真的有必要每张都做进光碟去吗?
>    因为扫描不是问题,问题是已经找不到原始的图片了,如果用和原书不一样的
>    图大家可以接受吗?
> 
是否只要原来的"专家"认可就可以了, 有图毕竟是好的, 在电脑内也最好是
彩色的.

> 有关於佛典保存及流布,昨天我 post 的一篇慧开法师的文章很值得参考,
> 大家有空可以看看。
> 


--
张文明
日月工作室
mailto: dnstudio@m2.dj.net.tw
电子佛教藏经阁: http://w5.dj.net.tw/~DNStudio/canon
Wed Jun 25 10:03:10 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#3
发信站: 国立中山大学网路组 Mailing List (tpts1.seed.net.tw>, 信区: BudaTech)
佛光山资讯中心释慧瑞法师 wrote:
> 
> 2)往後在网路上我们共同来维护一份统一的造字表,用001-->?? , 002--->??表示
>    其中001 002是造字序码,??是造字表达式,(用中研院庄先生的方法)

这一点,希望中研院庄先生给予建议。因为据我所了解,他们的方法也不是一成不
变的。(德明!您如果尚未加入buda-tech Mailing List,请把回函直接 mail 给
我,我再转告大家。)

> 4)我想知道大家对大辞典内图片的看法,真的有必要每张都做进光碟去吗?
>    因为扫描不是问题,问题是已经找不到原始的图片了,如果用和原书不一样的
>    图大家可以接受吗?

V1.0版目前的总体积大约55Mb,还不及一张光碟容量的1/10。我觉得图片能够越多
越好,甚至不只是图片,将来一定会进展到动态影像。

图片和原书不一样,我是能够接受的。当进展到数位化,变成是一个新的东西,勿
需再局限於书版的内容;只要切合这个新媒体的需求,很多新路子都可以尝试。

                                                            maha 6/25/97
Wed Jun 25 12:48:52 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#4
发信站: cms (tpts2.seed.net.tw>, 信区: Buddhism)
发信站: cms (Thu Jun 26 17:37:54 1997)
转信站: Lion!ccnews.nsysu!suncc.ccu!news.csie.nctu!news.nctu!serv.hinet.net!net
来  源: ts1r8.hope.com.tw

> 这问题的□结应是造字空间有限的问题, 而不是厂商不 build-in 的关系.
> 谈得更深点还可能是中文文字本身在电脑上应用的根本问题, 
> 例如中文字也在不断演化增加, 只要原来的字增减一画就是一个新字, 
> 目前方言字, 如广东方言字, 闽南方言字, 中国地大人多方言也多,
> 将来各地方言字都出来, 恐怕在大的造字空间都不够; 
> 不若拉丁字由几个基本字母(character)来组成单字(word), 单字再多
> 还是由那几个基本字母组成. 这是根本问题, 除非, 电脑字的显示设计
> 从头来过, 并由中国人主导, 这在可见的未来似乎是不可能的事.

既然图形都可使用,何不考虑朱邦复先生之聚珍码?

中国字由中国人主导当非难事,为与不为而已。
Thu Jun 26 17:37:54 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#5
发信站: 国立中山大学网路组 Mailing List (tpts1.seed.net.tw>, 信区: BudaTech)
cms wrote:
> 
> 既然图形都可使用,何不考虑朱邦复先生之聚珍码?
> 
> 中国字由中国人主导当非难事,为与不为而已。

包括我自己在内,我想很多朋友对朱邦复先生一向很钦仰,
但对「聚珍」的架构内容都还不甚清楚。可否请 cms为我们
介绍一下,比如说它是如何处理中文造字内码不足的问题?
它的中文组字方法为何?是否可与现行的作业系统及应用软
体交换讯息?

                                        maha 6/27/97
Fri Jun 27 11:40:22 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#6
发信站: glory (bbs.cis.nctu.edu.tw>, 信区: Buddhism)
发信站: glory (Sun Jun 29 08:23:30 1997)
转信站: Lion!ccnews.nsysu!suncc.ccu!news.csie.nctu!aidebbs!news.yzit!news.ncu!N
来  源: ts1r8.hope.com.tw

In article <33B31340.16ED@tpts1.seed.net.tw> on 27 Jun 1997 03:40:22 GMT
maha <maha@tpts1.seed.net.tw> wrote:
> 
> cms wrote:
> > 
> > 既然图形都可使用,何不考虑朱邦复先生之聚珍码?
> > 
> > 中国字由中国人主导当非难事,为与不为而已。
> 
> 包括我自己在内,我想很多朋友对朱邦复先生一向很钦仰,
> 但对「聚珍」的架构内容都还不甚清楚。可否请 cms为我们
> 介绍一下,比如说它是如何处理中文造字内码不足的问题?
> 它的中文组字方法为何?是否可与现行的作业系统及应用软
> 体交换讯息?
> 

朱邦复先生对「聚珍」的核心架构一直秘而不宣,我手上有的只是历年来从网路上
收集来的,如朱先生的电子书,以及其弟子在 bbs 上的 post。

我想:扛著文化的大纛,再来个三顾茅庐,这样一来,师出有名,名正而言顺,顺
天则人应。。。。。。
Sun Jun 29 08:23:30 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#7
wmc
发信站: 国立中山大学网路组 Mailing List (mozart.seed.net.tw , 信区: BudaTech)
cms wrote:
> 
> > 这问题的□结应是造字空间有限的问题, 而不是厂商不 build-in 的关系.
> > 谈得更深点还可能是中文文字本身在电脑上应用的根本问题,
> > 例如中文字也在不断演化增加, 只要原来的字增减一画就是一个新字,
> > 目前方言字, 如广东方言字, 闽南方言字, 中国地大人多方言也多,
> > 将来各地方言字都出来, 恐怕在大的造字空间都不够;
> > 不若拉丁字由几个基本字母(character)来组成单字(word), 单字再多
> > 还是由那几个基本字母组成. 这是根本问题, 除非, 电脑字的显示设计
> > 从头来过, 并由中国人主导, 这在可见的未来似乎是不可能的事.
> 
> 既然图形都可使用,何不考虑朱邦复先生之聚珍码?
> 
以图形来秀字已是落伍的技术了, 目前无论是 dos或 windows系统的
字都是以 vector 相关的技术来秀字; 佛典中还用图形秀字只不过权宜
之计罢了, 主要是为了暂时摆脱目前中文内码空间不足的困扰; 朱先生
的聚珍约七年前末学曾看过评估过, 之後就只有听过, 聚珍码与
图形秀字有何特点不妨说明看看.

> 中国字由中国人主导当非难事,为与不为而已。
有此豪情壮志令人钦佩, 末学愿闻其详, 也希望出现的不是软体界的义和团.
建议您从硬体, 软体, 使用者等的技术, 市场与应用的过去, 现在与未来,
几个方向来加以说明.
Mon Jun 30 10:22:33 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#8
wmc
发信站: 国立中山大学网路组 Mailing List (mozart.seed.net.tw , 信区: BudaTech)
rancher wrote:
> 
> In article <33B31340.16ED@tpts1.seed.net.tw> on 27 Jun 1997 03:40:22 GMT
> maha <maha@tpts1.seed.net.tw> wrote:
> >
> > cms wrote:
> > >
> > > 既然图形都可使用,何不考虑朱邦复先生之聚珍码?
> > >
> > > 中国字由中国人主导当非难事,为与不为而已。
> >
> > 包括我自己在内,我想很多朋友对朱邦复先生一向很钦仰,
> > 但对「聚珍」的架构内容都还不甚清楚。可否请 cms为我们
> > 介绍一下,比如说它是如何处理中文造字内码不足的问题?
> > 它的中文组字方法为何?是否可与现行的作业系统及应用软
> > 体交换讯息?
> >
> 
> 朱邦复先生对「聚珍」的核心架构一直秘而不宣,我手上有的只是历年来从网路上
> 收集来的,如朱先生的电子书,以及其弟子在 bbs 上的 post。
> 
约七年前评估聚珍时, 还须有 keypro 才能使用; 从这点来看朱先生
的市场行销策略实在不令人□同, 如果到现在还是秘而不宣的方式,
大概也不会成为被广泛使用的系统.
Mon Jun 30 10:29:39 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#9
发信站: glory (bbs.cis.nctu.edu.tw>, 信区: Buddhism)
发信站: glory (Tue Jul  1 00:23:42 1997)
转信站: Lion!ccnews.nsysu!suncc.ccu!news.nctu!news.csie.nctu!news.cis.nctu!news
来  源: b048.dialup.dj.net.tw

In article <33B71C5D.D8F2BFF2@mozart.seed.net.tw> on 30 Jun 1997
02:29:39 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> 
> > 
> 约七年前评估聚珍时, 还须有 keypro 才能使用; 从这点来看朱先生

能不能聊聊七年前你看到什麽东西?

> 的市场行销策略实在不令人□同, 如果到现在还是秘而不宣的方式,
    ^^^^^^
朱没搅过这玩意吧?他要赚钱从输入法就可以了。
嗯....免费的 仓颉输入法 实在不令人□同 :-)

> 大概也不会成为被广泛使用的系统.

《系统》..,聚珍是系统吗?朱好像从未将其系统公诸於世。
Tue Jul 1 00:23:42 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#10
发信站: glory (bbs.cis.nctu.edu.tw>, 信区: Buddhism)
发信站: glory (Tue Jul  1 00:23:41 1997)
转信站: Lion!ccnews.nsysu!suncc.ccu!news.nctu!news.csie.nctu!news.cis.nctu!news
来  源: b048.dialup.dj.net.tw

In article <33B71AC1.8609D8A0@mozart.seed.net.tw> on 30 Jun 1997
02:22:33 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> 
> > 
> > 既然图形都可使用,何不考虑朱邦复先生之聚珍码?
> > 
> 以图形来秀字已是落伍的技术了, 目前无论是 dos或 windows系统的
> 字都是以 vector 相关的技术来秀字; 佛典中还用图形秀字只不过权宜
> 之计罢了, 主要是为了暂时摆脱目前中文内码空间不足的困扰; 朱先生
> 的聚珍约七年前末学曾看过评估过, 之後就只有听过, 聚珍码与
> 图形秀字有何特点不妨说明看看.
> 

你看过"智慧之旅"麽?

你可知道朱的电子书程式只有一百馀K! 在这极有限的空间,不仅要有简单的阅
读功能(pgup/pgdn/up/dn/catalog/last read bookmark),组字及显示字形的功能
也得通通做在里面!最奇特的是它并没有附字型档!!正确说法是朱根本不用字型
,他把仓颉字根的精神从 input 贯彻到 output,而这些书都是数十
万乃至上百万言。



你认为这没什麽吗?

当然如果你是说 "聚珍" 那个"AP"的话,我也同意是没什麽。

当你用 "聚珍" 那个"AP"将朱的电子书印到纸上时,看到甚麽?....货真价实的
向量明体ㄡ!

"聚珍" 那个"AP"几百 KB 而已,没什麽。

退回去看看 APPLE ][ 的年代吧,当时所谓汉卡只有 64KB ROM 又要存字型又要
coding 画出一万三千多个 15x14 的中文字,难不成是五鬼搬运法?想知道如何办
到?去问朱某人吧。

其实我心中所想的是如何用聚珍那个一百多K"AP"把全藏 output 出来:在
printer,在 monitor, 在 dos,在 win95,在 unix,当然——造字难免,但是
健全的码平面与庞大的空间可免捉襟见肘之苦。

没错——撇开自身内建的检索与处理——如果不能有 DDE/OLE/OCX...这也只是
"画"藏经,...嗯...谁能画出来再说。


我不是义和团,我只是献曝的野人。
Tue Jul 1 00:23:41 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#11
罗云.法空
发信站: 狮子吼站 (Lion , 信区: BudaTech)
==> 於  (rancher) 文中述及:
: 你可知道朱的电子书程式只有一百馀K! 在这极有限的空间,不仅要有简单的阅
: 读功能(pgup/pgdn/up/dn/catalog/last read bookmark),组字及显示字形的功能
: 也得通通做在里面!最奇特的是它并没有附字型档!!正确说法是朱根本不用字型
: ,他把仓颉字根的精神从 input 贯彻到 output,而这些书都是数十
: 万乃至上百万言。

        当然这样的能力是经由 dos-asm 作出来的, 若用到 C 以上的话就
        不止如此的 size. 换句话说, 跨平台能力不足以应付网路需要.
--
悲■□■□■□■悲■□■□■□■□■□■□■□■□■□■□■悲■□■□■□■悲
欣  法本法无法 欣  君子之交 其淡如水 执象而求 咫尺千里  欣  今付无法时  欣
交 无法法亦法 交  问余何适 廓尔忘言 华枝春满 天心月圆  交  法法何曾法  交
集□■□■□■□集□■□■□■□■□■□■□■□■□■□■□集□■□■□■□集
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.117.12.3]
Tue Jul 1 11:48:29 1997
回覆 | 转寄 | 返回

Re: 回maha有关大辞典新版之
#12
发信站: 国立中山大学网路组 Mailing List (m2.dj.net.tw>, 信区: BudaTech)
rancher wrote:
> 
> In article <33B71C5D.D8F2BFF2@mozart.seed.net.tw> on 30 Jun 1997
> 02:29:39 GMT wmc@mozart.seed.net.tw (wmc) wrote:
> >
> > >
> > 约七年前评估聚珍时, 还须有 keypro 才能使用; 从这点来看朱先生
> 
> 能不能聊聊七年前你看到什麽东西?
> 
一个在 dos run 的系统, 跑出一堆黑白的 windows, 也有中文显示,
印象深刻的是如您强调的"速度"很快, 当然也是因为是用 assembly
coding 的缘故.

> > 的市场行销策略实在不令人□同, 如果到现在还是秘而不宣的方式,
>     ^^^^^^
> 朱没搅过这玩意吧?他要赚钱从输入法就可以了。
所谓市场行销简单说就是把 product 交到 user 的手上使用,
是不是要赚钱? 这是私人问题, 但总不会是做来自己玩玩,
或证明自己能力吧? 这总问题最好是朱先生自己回答,
当然如果您是朱先生发言人, 您也可以代答; 况且末学并未
说朱先生要不要赚钱. 至於他是否能从输入法"再"赚钱也不
是第三者关心的事.

> 嗯....免费的 仓颉输入法 实在不令人□同 :-)
> 
marketing 方式有多种不必定是要免费, 也不必定是付费,
从佛法来讲 :-) 依因缘而定; 如ms 的东东动则要数万NT$,
但 IE, IIS, FrontPage 等却是免费, 因缘不同罢了,
strategy 自然也不同; 仓颉输入法是否该免费?
末学没说过, 但同理也是依因缘而定.
^^^^^^^^^^

记得讨论的 focus 应是聚珍与中文big5缺字; 建议一下还是尽量
不要太发散.

> > 大概也不会成为被广泛使用的系统.
> 
> 《系统》..,聚珍是系统陧H朱好像从未将其系统公诸於世。
这是末学的印象, 毕竟事隔多年了, 如果是记错了请您不吝指正
; 那麽到底聚珍是甚麽?


--
张文明
日月工作室
mailto: dnstudio@m2.dj.net.tw
电子佛教藏经阁: http://w5.dj.net.tw/~DNStudio/canon
Wed Jul 2 11:16:22 1997
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org