看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1080/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech
标  题: Re: 丹青 ocr 技巧
发信站: 狮子吼站 (Sun Dec 21 12:21:51 1997)
转信站: Lion

==> 於 网路义工 (peterwei@Lion) 文中述及:
: : ********
: : 另外,对於一些打不出来的字,各位就您熟悉的输入法输入
: : 时,若真打不出来(特别是注音),那就以精确或简易组合
: : 字表示即可。
: :                                        maha 12/14/97
: 请问什麽是组合字?看起来很相同吗?谢谢!

  之前 maha 有 mail 一份资料给 佛教藏 ocr 小组, 您可能漏接了.
  这里给您参考, 不一定要用这麽完整的规则, 以您方便, 好辨认即可.
  完稿maha 会再处理过, 至於详细例子, 我 mail 一份组合字给您参考.

<<< 组字法 >>>(11/19/96 更新)

本组字法含*/@-+?六个全形基本符号,及()[]两组半形分隔符号。
今举例说明如下:

* 表横向连接     如:明=日*月
/ 表纵向连接     如:音=立/日
@ 表包含         如:因=口@大  或  □=门@月
- 表去掉某部份   如:青=请-言
-+若前後配合,表示去掉某部份而改以另一部份代替  如:□=间-日+月
?表字根特别,尚未找到足以表示者  如:背=(?*匕)/月
()为运算分隔符号 如:绕=组-且+((土/(土*土))/兀)
[]为文字分隔符号 如:罗[目*侯]罗母耶输陀罗比丘尼

为求方便,不排除采用全形注音符号、标点符号及英文符号做为组字用字根。

  heaven
--
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.114.61.170]
阅读文章: 第 1080/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org