Re: cgrep 2 (fwd)

---------- Forwarded message ----------
Date: Mon, 12 Aug 1996 21:08:20 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: cgrep 2

> 您说的中正大学弄的是什麽软体? 如果是指全文检索的话,
> 那基本上和 cgrep或类似的 grep 应该是不太一样的。

我猜大刚说的是中正资工的中文全文检索软体.  中研院也曾有过这样的研究,
但我不知道中研院的成果是否可以自由取得.  中正的成果在 WWW 上有公开,
但是似乎还没结案, 所以也没有最後定稿的版本.  其实中央资管在两年前也作
了这样的研究, 他们是把 public domain 的 wais 程式给中文化了, 称作 cwais.
但是在其主事的研究生毕业後, 我就不知道下文了.

我们的 cgrep (或 tgrep) 不是全文检索.  我们不是事先把将要被查询的文章
做一套检索表, 然後依照此表格来加快搜寻的时间.  *grep 程式是打硬功, 靠蛮力
的.  它是把要搜寻的档案打开, 一个字一个字地读, 然後比对字串.

我认为, 设计一个为中文文字档案量身订作的 grep 程式, 是设计一个中文全文检索
系统的必备经验.  所以我们做了.  我们未必做得比较好, 但纯粹出於兴趣, 我们
喜欢写程式.

-Shann