看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech
标  题: Re: 有关经典电子化
发信站: 狮子吼站 (Sun Nov  1 23:39:15 1998)
转信站: Lion

==> 於  (cricket@ksts.seed.net.tw,) 文中述及:
>前一阵子诸位大德讨论有关经典电子化,
>因在下不懂,所以也没有在意,
>现想了解电子化中比较技术上的问题,
>如 ... <略>
>如果诸位大德有保留那时讨论的 mail 可否forward
>一份给我,或告诉我去那找.

在狮子吼站的 buda-tech 讨论区, 有完整的保留,
telnet://cbs.ntu.edu.tw  [buda-tech 版]

>1. 扫描解析度

据说一般 300 dpi 就很不错了, 但若是古文或较不清楚
的资料, 则要较高的解析度, 例如我们处理大正藏,
就发觉 400 以上有更好的效果.

>2. 辨认软体名称及正确率

之前後学测试时, 觉得丹青效果不错.
我是用大正藏为样本, 试用丹青,
电信研究所那一套及大陆清华那一套. (名字都忘了)
好像还有个叫新文通或什麽的, 但以丹青最为理想.
(ps. 我只是粗略测试, 各软体或许有最佳化的调整, 我都没处理)

>3.记得有去点程式的种种

有人写过一支去点程式, 大概能粗略去除
大正藏, 佛教藏及续藏的杂点, 在东坡站上应该找得到.

>4. 标点符号问题

什麽问题? OCR 辨识问题吗?

>5.文字直式转横式的问题.

纯文字直式文字变横式吗?
之前後学有想过用汉书写些巨集来处理,
但需求度不高就一直没动手.
若有需要则欢迎来讨论.
但因为许多经文都有横式的了, 所以我都不管直式的那些.

>6.其他

其他就欢迎来讨论了.

其实这些问题在不同情况有不同的方法来处理,
很欢迎您以您目前要处理的现况与大家一起讨论.
或许您要的东西都有现成的成品了, 就不用那麽麻烦了.

  heaven
--
【北狮南鹿】
您在学佛路上有疑问吗?-----BudaHelp 版,帮助您!
您对佛教神□事件好奇吗?---BudaXfile版,满足您!
一片清凉的佛法讨论园地,需要您的爱护与灌溉,欢迎您的光临:
台大佛研中心狮子吼站:telnet://cbs.ntu.edu.tw       (IP:140.112.143.30)
[鹿苑]佛教暨慈青专站:telnet://buddha.nsysu.edu.tw  (IP:140.117.11.90)
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.189.90]
阅读文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org