看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 1108/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: DavidChiou@Lion (邱大刚), 信区: BudaTech
标  题: Re: 检索测试
发信站: 狮子吼站 (Tue Dec 30 13:14:37 1997)
转信站: Lion

==> 於 光音天 (open98@Lion) 文中述及:
: 我们知道这个问题,因为底层的检索函式是以byte 为单位,
: 考虑到以一个中文字查询的情况并不多
: 可以改,但会损失一些速度,我们再想想看有
: 没有办法好了。

    如前所述, 有个办法是再加上中文 filter,
先以 byte 为单位找出所有 "可能" 的 candidates,
然後再用中文 filter function 将误判的部分去除
即可。

Ps. 根据我的经验, 如果一开始就用中文专用的搜寻
    函式的话, 在以 byte 为单位的程式语言中可能速
    度会受很大的影响, 因此用 filter 的方式蛮不错的,
    可能只要多花几十分之一秒,即可将误判的去除。

祝 福慧双修!
--
□□□□ □□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□
             幻                  阳焰          化城    水月
           浮泡                   眼花               旋火轮
□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□ □□□□□
 
Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.104.43]
阅读文章: 第 1108/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org