Литература Введение Lucene Обзор
Lucene - процесс индексации
Download 219.91 Kb.
|
1 sam top
- Bu sahifa navigatsiya:
- Создайте документ
Lucene - процесс индексацииПроцесс индексирования является одной из основных функций, предоставляемых Lucene. Следующая диаграмма иллюстрирует процесс индексации и использование классов. IndexWriter является наиболее важным и основным компонентом процесса индексации. Мы добавляем документы, содержащие поля, в IndexWriter, который анализирует документы с помощью анализатора, а затем создает / открывает / редактирует индексы по мере необходимости и сохраняет / обновляет их в каталоге. IndexWriter используется для обновления или создания индексов. Он не используется для чтения индексов. Теперь мы покажем вам пошаговый процесс, чтобы начать понимать процесс индексации, используя базовый пример. Создайте документСоздайте метод для получения документа lucene из текстового файла. Создайте различные типы полей, которые представляют собой пары ключ-значение, содержащие ключи в качестве имен и значения в качестве содержимого для индексации. Установите поле для анализа или нет. В нашем случае анализируется только содержимое, поскольку оно может содержать такие данные, как a, am, are, an и т. Д. которые не требуются при операциях поиска. Добавьте вновь созданные поля в объект document и верните его вызывающему методу. private Document getDocument(File file) throws IOException{ Document document = new Document(); //index file contents Field contentField = new Field(LuceneConstants.CONTENTS, new FileReader(file)); //index file name Field fileNameField = new Field(LuceneConstants.FILE_NAME, file.getName(), Field.Store.YES,Field.Index.NOT_ANALYZED); //index file path Field filePathField = new Field(LuceneConstants.FILE_PATH, file.getCanonicalPath(), Field.Store.YES,Field.Index.NOT_ANALYZED); document.add(contentField); document.add(fileNameField); document.add(filePathField); return document; } Download 219.91 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling