Saltar al contenido

Agrupación frente a agrupación a lo largo del tiempo

Te traemos el resultado a este enigma, o por lo menos eso creemos. Si continuas con interrogantes dínoslo, que sin dudarlo te ayudaremos

Solución:

La agrupación max-over-time generalmente se aplica en NLP (a diferencia del max-pool ordinario, que es común en las CNN para tareas de visión por computadora), por lo que la configuración es un poco diferente.

La entrada para la agrupación máxima a lo largo del tiempo es un mapa de características c = [c(1), ..., c(n-h+1)]que se calcula sobre una oración de longitud n con un filtro de tamaño h. La operación de convolución es muy similar a una con imágenes, pero en este caso se aplica a un vector de palabras unidimensional. Esta es la fórmula (3) en el documento.

La operación de agrupación max-over-time es muy simple: max_c = max(c), es decir, es un solo número que obtiene un máximo en todo el mapa de características. La razón para hacer esto, en lugar de “reducir la muestra” de la oración como en una CNN, es que en la PNL, las oraciones naturalmente tienen una longitud diferente en un corpus. Esto hace que los mapas de funciones sean diferentes para diferentes oraciones, pero nos gustaría reducir el tensor a un tamaño fijo para aplicar softmax o cabeza de regresión al final. Como se indica en el documento, permite capturar la característica más importante, una con el valor más alto para cada mapa de características.

Tenga en cuenta que en la visión artificial, las imágenes suelen ser1 del mismo tamaño, como 28x28 o 32x32es por eso que no es necesario reducir la muestra de los mapas de funciones para 1x1 inmediatamente.

Sum-pooling-over-time es lo mismo.


1 La CNN moderna se puede entrenar con imágenes de diferentes tamaños, pero esto requiere que la red sea totalmente convolucional, por lo que no tiene capas de agrupación. Vea esta pregunta para más detalles.

La agrupación máxima generalmente se aplica a regiones en un plano de características 2d, mientras que la agrupación máxima a lo largo del tiempo ocurre a lo largo de un vector de características 1d.

Aquí hay una demostración de la agrupación máxima del CS231n de Stanford:

agrupación máxima

La agrupación máxima a lo largo del tiempo toma un vector de características 1d y calcula el valor máximo. El “a lo largo del tiempo” solo significa que esto está sucediendo a lo largo de la dimensión del tiempo para alguna entrada secuencial, como una oración, o una concatenación de todas las frases de una oración como en el documento que vinculó.

Por ejemplo:

[2, 7, 4, 1, 5] -> [7]

Fuente: CS224d Clase 13 diapositivas

Valoraciones y reseñas

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *