看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech 标 题: Re: 有关经典电子化 发信站: 狮子吼站 (Sun Nov 1 23:39:15 1998) 转信站: Lion ==> 於 (cricket@ksts.seed.net.tw,) 文中述及: >前一阵子诸位大德讨论有关经典电子化, >因在下不懂,所以也没有在意, >现想了解电子化中比较技术上的问题, >如 ... <略> >如果诸位大德有保留那时讨论的 mail 可否forward >一份给我,或告诉我去那找. 在狮子吼站的 buda-tech 讨论区, 有完整的保留, telnet://cbs.ntu.edu.tw [buda-tech 版] >1. 扫描解析度 据说一般 300 dpi 就很不错了, 但若是古文或较不清楚 的资料, 则要较高的解析度, 例如我们处理大正藏, 就发觉 400 以上有更好的效果. >2. 辨认软体名称及正确率 之前後学测试时, 觉得丹青效果不错. 我是用大正藏为样本, 试用丹青, 电信研究所那一套及大陆清华那一套. (名字都忘了) 好像还有个叫新文通或什麽的, 但以丹青最为理想. (ps. 我只是粗略测试, 各软体或许有最佳化的调整, 我都没处理) >3.记得有去点程式的种种 有人写过一支去点程式, 大概能粗略去除 大正藏, 佛教藏及续藏的杂点, 在东坡站上应该找得到. >4. 标点符号问题 什麽问题? OCR 辨识问题吗? >5.文字直式转横式的问题. 纯文字直式文字变横式吗? 之前後学有想过用汉书写些巨集来处理, 但需求度不高就一直没动手. 若有需要则欢迎来讨论. 但因为许多经文都有横式的了, 所以我都不管直式的那些. >6.其他 其他就欢迎来讨论了. 其实这些问题在不同情况有不同的方法来处理, 很欢迎您以您目前要处理的现况与大家一起讨论. 或许您要的东西都有现成的成品了, 就不用那麽麻烦了. heaven -- □□【北狮南鹿】□□ 您在学佛路上有疑问吗?-----BudaHelp 版,帮助您! 您对佛教神□事件好奇吗?---BudaXfile版,满足您! 一片清凉的佛法讨论园地,需要您的爱护与灌溉,欢迎您的光临: 台大佛研中心狮子吼站:telnet://cbs.ntu.edu.tw (IP:140.112.143.30) [鹿苑]佛教暨慈青专站:telnet://buddha.nsysu.edu.tw (IP:140.117.11.90) Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.189.90] |
阅读文章: 第 1361/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |