您有新信

 
Re: 中文检索程式适用性 (fwd)
#1
Post Gateway
发信站: 由 狮子吼站 收信 (ccstudent.ee.ntu.edu.tw , 信区: BudaTech)
以下是单教授的来信:
-----------------------------------------------------
Date: Sat, 9 Nov 1996 11:53:05 +0800
From: Shann Wei-Chang <shann@math.ncu.edu.tw>
Subject: Re: 中文检索程式适用性导论

> 这个 GAIS 如何呢? 

GAIS == Global Area Information Servers, 目的上与 WWW 上的搜寻工具,
例如 Lycos, Yahoo, Alta Vista 等等相同, 就是要帮助我们很方便地在
网路上找到资料.  其展示品及说明文字都可以在
http://sparc2.cs.ccu.edu.tw/cgais.html
找到.  各位可以去试试看.  我个人的使用经验是, 用我的中文名字 "单维彰"
做搜寻时, 出来不少东西, 但是好像没有直接跟我相关的.  而用英文 "Wei-Chang"
或是 "Shann" 来搜寻时, 都找不到我, 但可以找到我的几个朋友 (一位在台大
资讯系, 一位在交大资工).  不晓得是不是他们的 server 还没有把中央大学
数学系的 WWW pages 放在资料库里?

但是当我用 DEC 的 Alta Vista 搜寻我的名字时, 都可以找到我所有的 HTML
documents.  有趣的是, 如果我用大五码输入, 则 Alta Vista 除了找到我的
中文名字之外, 还找到很多恰好字码相同的日文, 韩文, 阿拉伯文之类的
文件.  可惜我读不懂, 否则, 知道 "单维彰" 三个字的码在别的语文中的
对应文字, 应该是很有趣的.

> 要钱吗?

要不要钱, 卖不卖, 应该要向中正大学打听.  但因为这 GAIS 是向国科会领补助
的研究计划, 至少有一部分应该是公共财产才对吧.

我个人觉得他们最有趣的新想法是, 中国字的同音搜寻.  这对打字常发生同音
别字的人是个福音.

在佛教团体目前的应用□围内, 我们应该只需要 GAIS 的核心部分, 也就是
制造 index 的部分和 indexed text searching 的部分.  它们做的网路部分,
目前好像还不需要.  其实, 像是 DEC 的 Alta Vista 这种东西, 必定可以
搜寻到我们的 WWW 站.  比如说大刚的烘培鸡里面的佛教文献, 就应该可以从
Alta Vista 里面搜寻得到.  问题只是, Alta Vista 是全球性的, 所以必然比较
慢, 而且会出现字码恰好相合的其他国文字, 造成干扰.  再者, 那个 search
engine 必不会特别照顾中国字的某些特性.  这些都是我们期望像 GAIS 这种
计划能够改良的地方.  如果不能在这两个方向上改良, 那麽就直接用国外的
search engine 就好了.  我想中正的 search engine 应该会特别照顾中国字
的特性吧, 他们连同音字搜寻都想得到, 其他的应该也想到了.

只是, 效果如何, 其他人如何使用, 现在还难说.

Alta Vista 在 http://www.altavista.digital.com/

-Shann
Fri Nov 15 11:49:03 1996
回覆 | 转寄 | 返回

Re: 中文检索程式适用性 (fwd)
#2
Post Gateway
发信站: 由 狮子吼站 收信 (ccstudent.ee.ntu.edu.tw , 信区: BudaTech)
---------- Forwarded message ----------
Date: Fri, 08 Nov 1996 15:52:49 +0800
From: Shwu-meei Chiou <smchiou@ccms.ntu.edu.tw>
To: alice@cctwin.ee.ntu.edu.tw, b83050@cctwin.ee.ntu.edu.tw,
    b3502118@cctwin.ee.ntu.edu.tw, b4502011@cctwin.ee.ntu.edu.tw,
    b83107@cctwin.ee.ntu.edu.tw, b84018@cctwin.ee.ntu.edu.tw,
    b84021@cctwin.ee.ntu.edu.tw
Subject: Re: 中文检索程式适用性

David Chiou wrote:

> 3. 利用编码过的全文检索:

	以下是 中正大学 吴升教授 所发展的检索系统之摘要,谨供参考。

Title: TANet 资源发掘系统-BBS精华与 FAQ文件□集整理与检索

随著台湾学术网路的日易普及,目前在TANet上,可共享之资讯资源相当钜量,
有数以千百计的资讯供应站,诸如 anonymous ftp sites,gopher servers,
WWW servers等等,而且正以飞快的速度继续增加中。
面对如此浩瀚如海的资讯空间,如何容易地、有效率地找到所需或有兴趣的资讯
乃是基本之重要课题。它关键到是否整个 TANet 社会能够有效率的利用到这些
宝贵的资讯资源。
在本计画□,我们针对台湾学术网路上各站之中文BBS精华区与FAQ文件等资料
予以□集、整理并利用GAIS检索系统来建立此类资讯检索系统。此系统将提供
以下特色:
a)  功能强大的查询,诸如:容错搜寻、中文同音搜寻、随意之Boolean搜寻、
    结构查询或全文搜寻等,与使用者自定比对□围等。
b)  超媒体、易使用的使用者介面, 与使用者可控制之显示格式。



regards,
Shwu-meei Chiou (邱淑美)

mailto:smchiou@ccms.ntu.edu.tw
Fri Nov 15 11:49:16 1996
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org