Solución:
softmax()
ayuda cuando desea una distribución de probabilidad, que suma 1. sigmoid
se utiliza cuando desea que la salida varíe de 0 a 1, pero no es necesario que sume a 1.
En su caso, desea clasificar y elegir entre dos alternativas. Recomendaría usar softmax()
ya que obtendrá una distribución de probabilidad a la que puede aplicar la función de pérdida de entropía cruzada.
La función sigmoidea y softmax tienen diferentes propósitos. Para obtener una explicación detallada de cuándo usar sigmoide frente a softmax en el diseño de redes neuronales, puede consultar este artículo: “Clasificación: Sigmoide frente a Softmax”.
Breve resumen:
Si tiene un problema de clasificación de etiquetas múltiples donde hay más de una “respuesta correcta” (las salidas NO son mutuamente excluyentes), entonces puede usar una función sigmoidea en cada salida sin procesar de forma independiente. El sigmoide le permitirá tener una alta probabilidad para todas sus clases, algunas de ellas o ninguna.
Si, en cambio, tiene un problema de clasificación de clases múltiples donde solo hay una “respuesta correcta” (las salidas son mutuamente excluyentes), entonces use una función softmax. El softmax hará que la suma de las probabilidades de sus clases de salida sea igual a uno, por lo que para aumentar la probabilidad de una clase en particular, su modelo debe disminuir correspondientemente la probabilidad de al menos una de las otras clases.
La detección de objetos es la clasificación de objetos que se utiliza en una ventana deslizante de la imagen. En la clasificación, es importante encontrar la salida correcta en algún espacio de clase. Por ejemplo, detecta 10 objetos diferentes y desea saber qué objeto es el más probable que esté allí. Entonces softmax es bueno debido a su propiedad de que toda la capa sume 1.
La segmentación semántica, por otro lado, segmenta la imagen de alguna manera. He realizado una segmentación médica semántica y la salida es una imagen binaria. Esto significa que puede tener sigmoide como salida para predecir si este píxel pertenece a esta clase específica, porque los valores sigmoides están entre 0 y 1 para cada clase de salida.