博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
lucene的安装与小测试
阅读量:2224 次
发布时间:2019-05-08

本文共 1304 字,大约阅读时间需要 4 分钟。

【1.】下载

下载地址:

我下载的是lucene 3.5.0版本,具体文件是:lucene-3.5.0.zip

 

【2.】安装

安装之前,确保你的机器里安装了java VM,我安装的是jdk1.7最新版本,jdk的安装包的具体地址和虚拟机环境变量的设置这里不再赘述,有需要可以百度一下。

1. 首先,将压缩包解压缩在本地磁盘 E:;

2. 然后将lucene-3.5.0\lucene-core-3.5.0.jar和lucene-3.5.0\contrib\demo\lucene-demo-3.5.0.jar两个包拷贝放在java虚拟机的lib目录下,

如C:\Program Files\Java\jdk1.7.0_01\lib\(其中java目录是虚拟机的根目录)。

3. 因为测试环境为DOS环境,故我们需要设置环境变量CLASSPATH,在“我的电脑->属性->高级系统设置”中,CLASSPATH字段添加

%JAVA_HOME%\lib\lucene-demo-3.5.0.jar;%JAVA_HOME%\lib\lucene-core-3.5.0.jar;(不要忘记两个变量之间的分号)。

 

【3.】测试

我们要利用lucene实现检索的功能,首先要为某个测试文件集建立索引文件,而后再利用索引文件去检索测试文件集。

1. 创建测试目录,选择测试文件

我用的是D:/tmp下的文件为例:

1.txt  i am a boy, you are a boy, too.

2.txt she is a girl, you are a boy.

 

2. 建立索引

在DOS环境下,切换到工作目录,如E:/lucene-3.5.0下,命令格式如下:

java org.apache.lucene.demo.IndexFiles [-index INDEX_PATH] [-docs DOCS_PATH] [-update]

其中参数-index是生成索引文件存储的路径,-docs参数是测试文件集

命令示例:

java org.apache.lucene.demo.IndexFiles -index E:/lucene-3.5.0/index -docs D:/tmp

生成索引以后,如果测试文件集中的文件有变动,那么就要更新索引了,命令:

java org.apache.lucene.demo.IndexFiles -index E:/lucene-3.5.0/index -docs D:/tmp -update

3. 搜索测试

在工作目录下运行命令:

java org.apache.lucene.demo.SearchFiles

回车以后会显示

Entry query:

键入搜索关键字进行搜索

比如键入:

girl

回车,Lucene则会返回测试集的结果:

Searching for: girl

1 total matching documents
1. D:\tmp\2.txt
Press (q)uit or enter number to jump to a page.

 

注意:不支持中文的

转载地址:http://owafb.baihongyu.com/

你可能感兴趣的文章
Linux下perf性能测试火焰图只显示函数地址不显示函数名的问题
查看>>
c结构体、c++结构体和c++类的区别以及错误纠正
查看>>
Linux下查看根目录各文件内存占用情况
查看>>
A星算法详解(个人认为最详细,最通俗易懂的一个版本)
查看>>
利用栈实现DFS
查看>>
(PAT 1019) General Palindromic Number (进制转换)
查看>>
(PAT 1073) Scientific Notation (字符串模拟题)
查看>>
(PAT 1080) Graduate Admission (排序)
查看>>
Play on Words UVA - 10129 (欧拉路径)
查看>>
mininet+floodlight搭建sdn环境并创建简答topo
查看>>
【linux】nohup和&的作用
查看>>
Set、WeakSet、Map以及WeakMap结构基本知识点
查看>>
【NLP学习笔记】(一)Gensim基本使用方法
查看>>
【NLP学习笔记】(二)gensim使用之Topics and Transformations
查看>>
【深度学习】LSTM的架构及公式
查看>>
【python】re模块常用方法
查看>>
剑指offer 19.二叉树的镜像
查看>>
剑指offer 20.顺时针打印矩阵
查看>>
剑指offer 21.包含min函数的栈
查看>>
剑指offer 23.从上往下打印二叉树
查看>>