Saltar al contenido

indexación de datos de Twitter en elasticsearch: límite de campos totales [1000] en el índice se ha superado

Solución:

Este límite se ha introducido en el siguiente problema de GitHub.

El comando cuenta grep type | wc -l cuenta el número de líneas con texto “escribe”. Por lo tanto, supongo que existe la posibilidad de que el recuento sea inexacto. Hice un texto pequeño y obtuve un valor más alto que el número real de campos. Por lo tanto, también podría obtener menos de la cantidad real de campos, pero todavía no puedo pensar en un escenario.

Aquí está la prueba que hice.

curl -s -XGET http://localhost:9200/stackoverflow/_mapping?pretty

{
  "stackoverflow" : {
    "mappings" : {
      "os" : {
        "properties" : {
          "NAME" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          },
          "TITLE" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            },
            "fielddata" : true
          },
          "title" : {
            "type" : "text",
            "fielddata" : true
          }
        }
      }
    }
  }
}

Desde el “escribe” ¿Hay 5 líneas? Obtengo el resultado como 5 aunque solo tengo 3 campos.

Puedes intenta aumentar el límite y ver si funciona?

PUT my_index/_settings
{
  "index.mapping.total_fields.limit": 2000
}

También puede aumentar este límite durante la creación del índice.

PUT my_index
{
  "settings": {
    "index.mapping.total_fields.limit": 2000,
    "number_of_shards": 1,
    "number_of_replicas": 0
  },
  "mappings": {
    ...
  }
}

Créditos: https://discuss.elastic.co/t/total-fields-limit-setting/53004/2

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *