看板: BudaTech ◎ 佛典电子化讨论    板主: HeavenChow
阅读文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回
发信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信区: BudaTech
标  题: Re: cgrep 2 (fwd)
发信站: 由 狮子吼站 收信 (Mon Aug 12 14:51:48 1996)


以下是单教授的回信:

---------- Forwarded message ----------
Date: Mon, 12 Aug 1996 21:08:20 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: cgrep 2

> 您说的中正大学弄的是什麽软体? 如果是指全文检索的话,
> 那基本上和 cgrep或类似的 grep 应该是不太一样的。

我猜大刚说的是中正资工的中文全文检索软体.  中研院也曾有过这样的研究,
但我不知道中研院的成果是否可以自由取得.  中正的成果在 WWW 上有公开,
但是似乎还没结案, 所以也没有最後定稿的版本.  其实中央资管在两年前也作
了这样的研究, 他们是把 public domain 的 wais 程式给中文化了, 称作 cwais.
但是在其主事的研究生毕业後, 我就不知道下文了.

我们的 cgrep (或 tgrep) 不是全文检索.  我们不是事先把将要被查询的文章
做一套检索表, 然後依照此表格来加快搜寻的时间.  *grep 程式是打硬功, 靠蛮力
的.  它是把要搜寻的档案打开, 一个字一个字地读, 然後比对字串.

我认为, 设计一个为中文文字档案量身订作的 grep 程式, 是设计一个中文全文检索
系统的必备经验.  所以我们做了.  我们未必做得比较好, 但纯粹出於兴趣, 我们
喜欢写程式.

-Shann

阅读文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org