Saltar al contenido

Cómo indexar un archivo .PDF en ElasticSearch

Solución:

Parece que el complemento elasticsearch-mapper-attachments ha quedado obsoleto en 5.0.0 (lanzado el 26 de octubre de 2016). La documentación recomienda usar el complemento de procesador de archivos adjuntos de ingesta como reemplazo.

Instalar:

sudo bin/elasticsearch-plugin install ingest-attachment

Consulte ¿Cómo indexar un archivo pdf en Elasticsearch 5.0.0 con el complemento de ingesta adjunto? para obtener información sobre cómo utilizar el complemento Ingest Attachment.

Debe consultar el complemento elasticsearch-mapper-attachments, ya que es muy probable que lo ayude a lograr lo que necesita.

Instale el complemento Elasticsearch Mapper-Attachment y use un código similar a:

public String indexDocument(String filePath, DataDTO dto) {
        IndexResponse response = null;
        try {
            response = this.prepareIndexRequest("collectionName").setId(dto.getId())
                    .setSource(jsonBuilder().startObject()
                    .field("file", Base64.encodeFromFile(filePath))
                    .endObject()).setRefresh(true).execute().actionGet();
        } catch (ElasticsearchException e) {
            //
        } catch (IOException e) {
            //
        }
    return response.getId();
}
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *