看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech
标  题: Re: 检索测试
发信站: 狮子吼站 (Mon Jan  5 09:21:11 1998)
转信站: Lion

==> 於 邱大刚 (DavidChiou@Lion) 文中述及:
:     然後再用一个严谨的函式,以 ascii 128 等原理,将这
: 50 笔中真正完全符合的给挑出来(或许有 48 笔。)
:     这样子比起从头到尾改成中文搜寻来得简单许多。

和大刚讨论後, 大概了解其所谓中文 filter , 的确是不错的方法.
因为之前的作法, 必需要从头判断是否为中文, 也就是每一个字都要
if asc(xx) > 128 then .....
这种判断的确花时间.

若是改成先找到可能是我们要的, 再向前反寻找.
若是在奇数个找到 asc(xx) < 128 的字元, 则刚才找到的为中文字无误.
若是在偶数个找到, 则此为其它中文的後半字元.

我觉得这方法不错, 让大家参考. 至於判别中文字, 有比 > 128 更精确
的方法, 不过我都是这样用而已. :)

  heaven
--
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165]
阅读文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org