luceneНачало работы с люценом


замечания

Apache Lucene - это библиотека полнотекстового поиска на основе Java.

Версии

Версия Дата выхода
2.9.4 2010-12-03
3.0.3 2010-12-03
3.6.2 2013-01-16
4.10.4 2015-10-14
5.5.2 2016-06-24
6.3.0 2016-11-08

Привет, мир

Этот базовый пример Lucene создает простой индекс и ищет его.

Примечание. RAMDirectory создает индекс резидентности памяти и удобен для экспериментов и тестирования, но на практике большинству людей необходимо будет иметь индекс, хранящийся в файловой системе (см. FSDirectory.open ).

import java.io.IOException;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.queryparser.classic.*;
import org.apache.lucene.search.*;
import org.apache.lucene.store.*;

public class HelloLucene {
    public static void main(String[] args) throws IOException, ParseException
    {
        //Create a new index and open a writer
        Directory dir = new RAMDirectory();
        Analyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        IndexWriter writer = new IndexWriter(dir, config);
    
        //Create a document to index
        Document doc = new Document();
        doc.add(new TextField("text", "Hello World!", Field.Store.YES));
    
        //Index the document and close the writer
        System.out.println("Indexing document: " + doc);
        writer.addDocument(doc);
        writer.close();
    
        //Open an IndexSearcher
        IndexReader reader = DirectoryReader.open(dir);
        IndexSearcher searcher = new IndexSearcher(reader);
    
        //Create a query
        QueryParser parser = new QueryParser("text", analyzer);
        Query query = parser.parse("world");
    
        //Search for results of the query in the index
        System.out.println("Searching for: \"" + query + "\"");
        TopDocs results = searcher.search(query, 10);
        for (ScoreDoc result : results.scoreDocs) {
            Document resultDoc = searcher.doc(result.doc);
            System.out.println("score: " + result.score + 
                    " -- text: " + resultDoc.get("text"));
        }
        reader.close();
    }
}
 

Настроить

Lucene - это библиотека Java. Если у вас еще нет среды разработки Java, см. Документацию по Java .

Загрузите последнюю версию Lucene с сайта Apache и разархивируйте ее.

Добавьте необходимые банки в ваш путь к классам. Для многих проектов потребуются следующие банки, включая пример Hello World:

  • core/lucene-core-6.1.0.jar : функциональность Core Lucene.
  • core/analysis/common/lucene-analyzers-common-6.1.0.jar : Обеспечивает множество анализаторов, включая вездесущий StandardAnalyzer.
  • queryparser/lucene-queryparser-6.1.0.jar : Предоставляет парсер запросов.

Поместите код в HelloLucene.java . Скомпилируйте его с помощью этой команды:

javac -classpath "core/*:queryparser/*" HelloLucene.java
 

И запустите его с помощью этой команды:

java -classpath ".:core/*:queryparser/*" HelloLucene