看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: wiskey@ms10.hinet.net (Post Gateway), 信区: BudaTech
标  题: [无主题]
发信站: 由 狮子吼站 收信 (Sun Oct 13 15:36:04 1996)



>想必您正创作此一软体中....阿弥陀佛!
>建议功能:
>表列佛经选单 ( 并可自由新增佛经 )
>由作者(译者)、经书名称、分类(比方说:一般课诵、往生课诵、密宗心法、....)
>都能查询经书名称及内容
>全文检索 (那一部或那几部经书提过 "某字串" 可由"某字串"查出 并立即原文显示
>最好有注音(方法请您规划)因为佛经很多读音较常用法不同
>如能结合语音或多媒体系统自动发音或课诵就更完美了!
>阿弥陀佛! 谨代表我佛弟子先感谢您了!
>
>                                 释智信 (ASSEM)


信和尚道次:

    向所建言已知悉! 兹回答如下,并於此同时周知有意众生:

一、书 目 处 理 :该软体收经时,是以”藏”为单位,所以该xx藏(例大正藏)
                  内之所有经典名称将一体通收入选单目录内,不论所收之经典
    (表列佛经    是否已入藏(但会另行标示该经典是否已入藏)所以经名是可
      选单)      以检索而得。
         又,同时也有新增、删除、修改等之基本功能。

二、绘 图 处 理 :在出文字时同时出注音之技术,可以实作出来。但,麻烦的是
  (注 音)    目前之注音都是各别分开的,如ㄈㄣ ㄎㄞ ㄉ,要打出合在一
                  起之上下形,须先作TTF 规格之规划,才能再将字形特徵load
                  上去(这涉及到字形之放大缩小功能),由於这部分是琐碎长
                  时的工夫,所以二版以後才打算实作。不过,单一字注音之功
                  能会较快出来。实作中凡有字之音念不出时,原则以康熙字典
                  之切韵为准。 

三、语音与多媒体:语音的功能可以实作出来,其中关键处计分--
                  1)纯语音档放出功能--这部分可以实作,可用在诵唱佛经之上
                                     ,但须事前即已录好语音档才可。

                  2)出字发音(Text To Speech)--这部份定义在「出字发音」上
                                              ,其中有两种作法--
                    1>方法同上,整部佛经事前即须以语音档方式存档,要听时
                      再放出,这方法优点是语音连贯自然,缺点是非常占记忆
                      体,以每秒4k的取样率,就可算出所耗的记忆体了。在实
                      作上,可以MIDI的规格做出,配合语音,文字可依序出现
                      在萤幕上,就如KTV 、卡拉OK之功能一般。

                    2>先录基本单字语音档;在发音时随文字播放,但这不是轻
                      易就能做的!其中涉及发音人之咬字问题,须有人发心出
                      资请专业的广播人来发音录档才可。技术上则同上,可以
                      实作出来。

                  3)多媒体方面--则就须视是否尚有馀力而定!由於多媒体所涉
                         及之技术较复杂,尤其是动画与音效的配合方
                                面。如果只是单纯放影片而已,这功能也可以
                                实作。

四、索 引 部 分 :计规划有目录检索、内文检索及全文检索三种

  1)目录检索--即上述第一项功能;而作者...等之功能亦有,只是所提出事项
         仍不够详细,未来将随作随改。

    2)内文检索--搜寻一档内所给定之字串或所指定数档中之内文。

    3)全文检索--做这个功能是一个大学问!实在很难用三言两语说得清楚!但
                  目前所规划之规格,已能做出所建议的功能!
           不过,单只其中的一个「全文检索表」即已占1.2GM 左右,此
                  中尚且未包括「目录检索表」等其他各种对照表格!这实在太
                  伤记忆体! 
         之所以大吃记忆体之原因是:本软体预计要读的内码太多(内
                  码预计可读Big5,JIS,KSC,CNS 11643,UNICode,ISO 10646,
                  UNICode,差不多市面上所有的码都收了进来),以及欲迅速的
                  检索字串,因此所导致的检索表内容过於庞大之故(主要原因
                  )!所以,也曾想过以市面套装之Database Server 来取代,
         但考虑使用者所能负担之费用故,也放弃了这个想法!最後,
         仍然还是决定老牛伏骥--还是自己来写。

五、软 体 规 划

    因於检索而衍生的一些其他影响之故,目前为便利软体能真正地实际被使用,
    於是再次修正并规划该软体之新方向,谨此顺缘大略介绍一下:

1)拟将软体分为单机版与Client/Server版。

2)单机版之概况为--

  1>操 作 系 统 :初步建立在MS Windows95 之上,未来再视状况支援其他OS。

  2>内 码 系 统 --
  □初 版 :收Big5内码与市面资料档案相容,收EUNI(expanded UNICode)交换码
           (由笔者自行制定之四码规格,字集量目前规划可收约CCCII+ 128^3)
            , 以便与未来之各类内码交换。
  □再 版 :视使用者之反应再作调整。但原则以收CCCII Code以与国家图书馆现
            用之内码相容;收UNICode 以与使用32位元系统之档案相容。

  3>网 路 系 统 :可作E-Mail 、语音之收发,视状况再决定是否做BBS之「终端
         模拟」功能。

  4>资料库系统  --

    1.全文检索功能:可找出所有大藏经内的所有字辞(辞句有长度限制!若不限
          制,以采内文检索方式,那可要找个一天一夜了!),设检
           索表之检索技术若无法有效突破,则预计要作压缩处理,以
          减少所占记忆体。

    2.机读编目功能:采用国家图书馆之规格,以用於图书管理,及与国家图书馆
                    档案管理系统一致,以便未来与之网路沟通或读档相容用。

    3.档案格式与存取语法 --
      a)存档格式:档案格式除档头有特殊标示外,馀皆以一般text档存档,使用
         者若为节省硬碟空间可利用系统所提供之工具先行作硬碟压缩
         工作。

      b)存取方式:a.当档案自外读入记忆体时,一律以EUNI 码读入。
                  b.当档案传出电脑,或存入软碟时,档头若无标示时,内定以
                    big5传出。
                  c.当档案存入硬碟时,档头若无标示,内定以EUNI码存档。

      c)网路支援:为支援网路之功能,档案经转档後可以HTML格式存档。


          所以,只有传出时是Big5,其他一律以EUNI码运作。虽然内部处理时较
      复杂,但为了与市面上所有码相容(如ASCII、Big5、CCCII、CNS 11643 、
      UNICode及ISO 10646 码),亦不得不如此。
      另,为增快索引之速度,将不拟作任何语法制定索求,直接程式内部控制。


    4.资料库规模:初版建立在单机多工作业系统之下,不作Client/Server 功能
         。但,若Client/Server 版不作时,则会在再版时加入区域网
         路,广域网路之SQL 语法功能,以供一般图书馆管理用。

    5.特 殊 功 能 --
      a)拟提供HTML之档案编辑功能。

      b)转码功能:由於相容性之考虑之故,可能须常作读写之转码工作,此故,
                  提供转码功能。

      c)外挂元件功能:拟提供类似windows之档案管理员功能表可外挂元件的方式
                     。使用者未来可依该软体说明书指示设计所需功能元件,外
                      挂入该软体。

      d)其他功能细节:由於笔者无法预测检索时的微细需求,所以,其他的一些
           使用上之细节功能则须由使用者提示才知道。


    6.其 他 功 能 :初版时以检索与编辑功能为优先,其他一些基本功能也将具有
          ,不过是何类及何时出来则将视其需求性而定,这些功能计有
          语音、影片、传输、列印、绘图、扫瞄(OCR)等。


    7.版 权 问 题 :相信此问题迟早将有人相问,在此一并告知!
             若是软体果然完成,则须视此软体是否需要永续维修而定收费
          标准,笔者大事未了,大概是无法一直维护之!若有人维修,
          则原则以收若干工本费+维修人员生活费=大约NT.400元左右
          吧!
          若是无意永续之,则大约只收工本费 NT.100~200元左右 (
          含大藏经及一些光碟片),未来则不放在心上,本无来去,就
          随缘吧!


3)Client/Server版 --

 Client/Server 版与单机版最大的差别是有较完整的资料库系统,所以所用之系统,
  将不限制一定是笔者自己所设计之规格,也许用MS SQL Server 或 Informix等软体
  亦不一定,目前尚未定案。


  以上所述即是近年所规划从事的概况! 专此

 敬祝  法喜充满!


                                         杨 毅(wiskey) 合十 10/08/'96



PS: 1)wiskey: wiskey isn't whiskey ! it means:
              almost half of buddha's wisdom but had got the key can in.
              and
              the way could make everyone drunk like a liquor whiskey !

    2)如果,有其他使用者想告知所欲之新功能,可将讯息寄来
      wiskey@ms10.hinet.net( 较佳 )
      或在「台大椰林之"生活佛教板"」上发表 (telnet ->open bbs.ntu.edu.tw)








阅读文章: 第 228/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org