Lucene - Analizador

La clase Analyzer es responsable de analizar un documento y obtener los tokens / palabras del texto que se va a indexar. Sin análisis =, IndexWriter no puede crear un índice.

Declaración de clase

A continuación se muestra la declaración de org.apache.lucene.analysis.Analyzer clase -

public abstract class Analyzer
   extends Object
      implements Closeable

Constructores de clases

La siguiente tabla muestra un constructor de clases:

S.No. Constructor y descripción
1

protected Analyzer()

Métodos de clase

La siguiente tabla muestra los diferentes métodos de clase:

S.No. Método y descripción
1

void close()

Libera los recursos persistentes utilizados por el analizador.

2

int getOffsetGap(Fieldable field)

Esto es similar a getPositionIncrementGap (java.lang.String), excepto por las compensaciones de Token.

3

int getPositionIncrementGap(String fieldName)

Esto se invoca antes de indexar un Fieldable instancia si ya se han agregado términos a ese campo.

4

protected Object getPreviousTokenStream()

Usado por analizadores que implementan TokenStream reutilizable para recuperar TokenStreams previamente guardados para su reutilización por el mismo hilo.

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

Crea un TokenStream que se puede reutilizar desde la vez anterior que el mismo hilo llamó a este método.

6

protected void setPreviousTokenStream(Object obj)

Utilizado por analizadores que implementan reusableTokenStream para guardar un TokenStream para su posterior reutilización por el mismo hilo.

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

Crea un TokenStream que tokeniza todo el texto en el Reader proporcionado.

Métodos heredados

Esta clase hereda métodos de las siguientes clases:

  • java.lang.Object

Este analizador divide el texto en un documento basado en el espacio en blanco.