Литература Введение Lucene Обзор


Lucene - процесс индексации


Download 219.91 Kb.
bet9/13
Sana19.04.2023
Hajmi219.91 Kb.
#1363803
TuriЛитература
1   ...   5   6   7   8   9   10   11   12   13
Bog'liq
1 sam top

Lucene - процесс индексации


Процесс индексирования является одной из основных функций, предоставляемых Lucene. Следующая диаграмма иллюстрирует процесс индексации и использование классов. IndexWriter является наиболее важным и основным компонентом процесса индексации.

Мы добавляем документы, содержащие поля, в IndexWriter, который анализирует документы с помощью анализатора, а затем создает / открывает / редактирует индексы по мере необходимости и сохраняет / обновляет их в каталогеIndexWriter используется для обновления или создания индексов. Он не используется для чтения индексов.
Теперь мы покажем вам пошаговый процесс, чтобы начать понимать процесс индексации, используя базовый пример.

Создайте документ


  • Создайте метод для получения документа lucene из текстового файла.

  • Создайте различные типы полей, которые представляют собой пары ключ-значение, содержащие ключи в качестве имен и значения в качестве содержимого для индексации.


  • Установите поле для анализа или нет. В нашем случае анализируется только содержимое, поскольку оно может содержать такие данные, как a, am, are, an и т. Д. которые не требуются при операциях поиска.


  • Добавьте вновь созданные поля в объект document и верните его вызывающему методу.

private Document getDocument(File file) throws IOException{


Document document = new Document();
//index file contents
Field contentField = new Field(LuceneConstants.CONTENTS,
new FileReader(file));
//index file name
Field fileNameField = new Field(LuceneConstants.FILE_NAME,
file.getName(),
Field.Store.YES,Field.Index.NOT_ANALYZED);
//index file path
Field filePathField = new Field(LuceneConstants.FILE_PATH,
file.getCanonicalPath(),
Field.Store.YES,Field.Index.NOT_ANALYZED);

document.add(contentField);


document.add(fileNameField);
document.add(filePathField);

return document;


}

Download 219.91 Kb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling