看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: b83050@ccstudent.ee.ntu.edu.tw (Post Gateway), 信区: BudaTech 标 题: Re: cgrep 2 (fwd) 发信站: 由 狮子吼站 收信 (Mon Aug 12 14:51:48 1996) 以下是单教授的回信: ---------- Forwarded message ---------- Date: Mon, 12 Aug 1996 21:08:20 +0800 From: Shann Wei-Chang <shann@math.ncu.edu.tw> Subject: Re: cgrep 2 > 您说的中正大学弄的是什麽软体? 如果是指全文检索的话, > 那基本上和 cgrep或类似的 grep 应该是不太一样的。 我猜大刚说的是中正资工的中文全文检索软体. 中研院也曾有过这样的研究, 但我不知道中研院的成果是否可以自由取得. 中正的成果在 WWW 上有公开, 但是似乎还没结案, 所以也没有最後定稿的版本. 其实中央资管在两年前也作 了这样的研究, 他们是把 public domain 的 wais 程式给中文化了, 称作 cwais. 但是在其主事的研究生毕业後, 我就不知道下文了. 我们的 cgrep (或 tgrep) 不是全文检索. 我们不是事先把将要被查询的文章 做一套检索表, 然後依照此表格来加快搜寻的时间. *grep 程式是打硬功, 靠蛮力 的. 它是把要搜寻的档案打开, 一个字一个字地读, 然後比对字串. 我认为, 设计一个为中文文字档案量身订作的 grep 程式, 是设计一个中文全文检索 系统的必备经验. 所以我们做了. 我们未必做得比较好, 但纯粹出於兴趣, 我们 喜欢写程式. -Shann |
阅读文章: 第 185/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |