奔向NB的生活-Weblucene实现本地数据搜索

来源:百度文库 编辑:神马文学网 时间:2024/10/02 20:26:40
http://www.goood.org/category/%e6%8a%80%e6%9c%af/page/2/
Weblucene实现本地数据搜索
今天终于把Weblucene安装成功,尝试用来实现自己的数据进行测试。
首先写了个PHP程序从数据库中导出100条记录用来进行测试,导出的xml文件格式如下:



urldata
Titledata
Contentdata
Authordata

Title,Content




要注意所有字段的值均为GB2312编码。其中Index标签中为设定为索引的字段。
将文件保存到dump目录下,假设命名为test.xml。
按照默认的blog目录的格式建立一个新的测试dir,过程如下:在WEB-INF/var/目录下建立目录test,把blog目录下的xsl文件拷贝到test目录下。在WEB-INF/conf/目录下新建test.conf文件,仿照blog.conf编写test.conf文件的内容为:
# attributes defined here will overwrite the definition in weblucene.conf
# $Id: blog.conf,v 1.6 2004/10/30 10:04:24 lhelper Exp $
ValidEncodings = gb2312, gbk, utf-8, unicode, iso-8859-1
DefaultEncoding = utf-8
ValidOrderStyles = docid, score
DefaultOrderStyle = docid
ValidOutputFormats = html, xml, rss
DefaultOutputFormat = html
# note: ValidIndexes and DefaultIndex fields are case sensitive
# they must be consistent with your own index library
ValidIndexes = FullIndex, AuthorIndex
DefaultIndex = FullIndex
# note: HighlightFields fields are case sensitive
# they must be consistent with your own index
HighlightFields = Title,Author
HtmlTemplate = WEB-INF/var/test/html.xsl
RssTemplate = WEB-INF/var/test/rss.xsl
DirRealPath = WEB-INF/var/test/index
编辑dump目录中的index.sh,将最后执行IndexRunner的一句修改为:
java $ARGS IndexRunner -i test.xml -o $WEBLUCENE/test
意思是从test.xml中读取文件,然后建立索引到WEB-INF/var下的test目录下。在dump目录下执行./index.sh,如果顺利的话应该已经在WEB-INF/var/test目录下建立index目录。
保存退出后到Tomcat的bin目录下执行./shutdown.sh和./startup.sh来重新启动Tomcat,把原地址栏的dir参数由blog改为test,输入关键字,就可以在自己刚刚导出的数据中进行搜索了。
好爽。
anAKin |技术一般般 | 09月 14th, 2005 星期三9:57:pm |评论(0)
本地Linux安装Weblucene
昨天搞定Tomcat之后,Build一下报错,研究了一下,需要修改build.properties中的jsdk_jar路径,默认的是针对resin的设置,需要改成对Tomcat的,修改之后jsdk_jar部分内容如下:
jsdk_jar=/usr/local/jakarta-tomcat-4.1.31/common/lib/servlet.jar
再ant build,成功。
把成功后目录下的webapp和dump目录拷贝到Tomcat的webapps目录下。webapp和dump并列在webapps目录下面。
接下来的工作就是建立索引了。在dump目录下有个写好的建立索引的脚本index.sh,但是里面的内容需要稍做修改,把LIB路径改为当前的Tomcat路径,像这样:
export LIB=/usr/local/jakarta-tomcat-4.1.31/webapps/webapp/WEB-INF/lib
保存退出,执行./index.sh,出现信息:INFO IndexRunner - Great! Indexing OK
,就证明建立索引成功了。
在地址栏里输入http://localhost:8080/webapp/search.html,输入blog,回车,如果没问题的话你会看到列出的搜索结果了。
_xyz