看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: Heavenchow@Lion (Heaven), 信区: BudaTech 标 题: Re: 检索测试 发信站: 狮子吼站 (Mon Jan 5 09:21:11 1998) 转信站: Lion ==> 於 邱大刚 (DavidChiou@Lion) 文中述及: : 然後再用一个严谨的函式,以 ascii 128 等原理,将这 : 50 笔中真正完全符合的给挑出来(或许有 48 笔。) : 这样子比起从头到尾改成中文搜寻来得简单许多。 和大刚讨论後, 大概了解其所谓中文 filter , 的确是不错的方法. 因为之前的作法, 必需要从头判断是否为中文, 也就是每一个字都要 if asc(xx) > 128 then ..... 这种判断的确花时间. 若是改成先找到可能是我们要的, 再向前反寻找. 若是在奇数个找到 asc(xx) < 128 的字元, 则刚才找到的为中文字无误. 若是在偶数个找到, 则此为其它中文的後半字元. 我觉得这方法不错, 让大家参考. 至於判别中文字, 有比 > 128 更精确 的方法, 不过我都是这样用而已. :) heaven -- Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 140.113.87.165] |
阅读文章: 第 1126/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |