索引过程是由Lucene所提供的核心功能之一。下图说明了索引过程和使用的类。IndexWriter 是索引过程中最重要的和核心组件。
我们添加包含字段的 IndexWriter 分析使用 Analyzer 文件,然后创建/根据需要打开/编辑索引和存储/在目录更新。IndexWriter用于更新或创建索引。它不是用来读取索引。
Indexing类 :
以下是常用索引进程类的列表。
Sr. No. | 类及描述 |
---|---|
1 |
IndexWriter 此类充当创造/在索引过程中更新指标的核心组成部分 |
2 |
Directory 此类表示索引的存储位置 |
3 |
Analyzer Analyzer类负责分析一个文件,并从将被索引的文本获取令牌/字。不加分析完成后,IndexWriter不能创建索引。 |
4 |
Document Document代表一个虚拟文档与字段,其中字段是可包含在物理文档的内容,元数据等对象。Analyzer只能理解文档。 |
5 |
Field Field是最低单元或索引过程的起点。它代表其中一个键被用于识别要被索引的值的键值对关系。用于表示一个文件内容的字段将具有键为“内容”,值可以包含文本或文档的数字内容的部分或全部。 Lucene能索引仅文本或仅数字内容。 |