class sklearn.naive_bayes.CategoricalNB(*, alpha=1.0, fit_prior=True, class_prior=None, min_categories=None)[source]

Clasificador Naive Bayes para características categóricas

El clasificador categórico Naive Bayes es adecuado para la clasificación con características discretas que se distribuyen categóricamente. Las categorías de cada característica se extraen de una distribución categórica.

Leer más en el Guía del usuario.

Parámetros
alphafloat, default=1.0

Parámetro de suavizado aditivo (Laplace / Lidstone) (0 para sin suavizado).

fit_priorbool, default=True

Ya sea para aprender las probabilidades previas de la clase o no. Si false, se utilizará un uniforme previo.

class_priorarray-like of shape (n_classes,), default=None

Probabilidades previas de las clases. Si se especifica, los a priori no se ajustan de acuerdo con los datos.

min_categoriesint or array-like of shape (n_features,), default=None

Número mínimo de categorías por función.

  • entero: establece el número mínimo de categorías por función en n_categories para cada característica.
  • array-como: forma (n_features,) donde n_categories[i] contiene el número mínimo de categorías para la i-ésima columna de la entrada.
  • Ninguno (predeterminado): determina el número de categorías automáticamente a partir de los datos de entrenamiento.

Nuevo en la versión 0.24.

Atributos
category_count_list of arrays of shape (n_features,)

Contiene matrices de formas (n_clases, n_categorías de la característica respectiva) para cada característica. Cada array proporciona el número de muestras encontradas para cada clase y categoría de la característica específica.

class_count_ndarray of shape (n_classes,)

Número de muestras encontradas para cada clase durante el ajuste. Este valor se pondera con el peso de la muestra cuando se proporciona.

class_log_prior_ndarray of shape (n_classes,)

Probabilidad logarítmica empírica suavizada para cada clase.

classes_ndarray of shape (n_classes,)

Etiquetas de clase conocidas por el clasificador

feature_log_prob_list of arrays of shape (n_features,)

Contiene matrices de forma (n_clases, n_categorías de la característica respectiva) para cada característica. Cada array proporciona la probabilidad logarítmica empírica de categorías dadas la característica y la clase respectivas, P(x_i|y).

n_features_int

Número de características de cada muestra.

n_categories_ndarray of shape (n_features,), dtype=np.int64

Número de categorías para cada función. Este valor se infiere de los datos o se establece mediante el número mínimo de categorías.

Nuevo en la versión 0.24.

Ejemplos de

>>>import numpy as np
>>> rng = np.random.RandomState(1)>>> X = rng.randint(5, size=(6,100))>>> y = np.array([1,2,3,4,5,6])>>>from sklearn.naive_bayes import CategoricalNB
>>> clf = CategoricalNB()>>> clf.fit(X, y)
CategoricalNB()>>>print(clf.predict(X[2:3]))[3]

Métodos

fit(X, y[, sample_weight])

Ajuste el clasificador Naive Bayes según X, y

get_params([deep])

Obtenga parámetros para este estimador.

partial_fit(X, y[, classes, sample_weight])

Ajuste incremental en un lote de muestras.

predict(X)

Realizar clasificación en un array de los vectores de prueba X.

predict_log_proba(X)

Devuelve estimaciones logarítmicas de probabilidad para el vector de prueba X.

predict_proba(X)

Devolver estimaciones de probabilidad para el vector de prueba X.

score(X, y[, sample_weight])

Devuelve la precisión media en las etiquetas y los datos de prueba dados.

set_params(** parámetros)

Establezca los parámetros de este estimador.

fit(X, y, sample_weight=None)[source]

Ajuste el clasificador Naive Bayes según X, y

Parámetros
Xarray-like, sparse matrix of shape (n_samples, n_features)

Vectores de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características. Aquí, se supone que cada característica de X proviene de una distribución categórica diferente. Se asume además que todas las categorías de cada característica están representadas por los números 0,…, n – 1, donde n se refiere al número total de categorías para la característica dada. Esto se puede lograr, por ejemplo, con la ayuda de OrdinalEncoder.

yarray-like of shape (n_samples,)

Valores objetivo.

sample_weightarray-like of shape (n_samples), default=None

Pesos aplicados a muestras individuales (1. para no ponderados).

Devoluciones
selfobject
get_params(deep=True)[source]

Obtenga parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

partial_fit(X, y, classes=None, sample_weight=None)[source]

Ajuste incremental en un lote de muestras.

Se espera que este método se llame varias veces consecutivas en diferentes partes de un conjunto de datos para implementar el aprendizaje fuera del núcleo o en línea.

Esto es especialmente útil cuando todo el conjunto de datos es demasiado grande para caber en la memoria a la vez.

Este método tiene cierta sobrecarga de rendimiento, por lo que es mejor llamar a la función de ajuste parcial en fragmentos de datos que sean lo más grandes posible (siempre que se ajusten al presupuesto de memoria) para ocultar la sobrecarga.

Parámetros
Xarray-like, sparse matrix of shape (n_samples, n_features)

Vectores de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características. Aquí, se supone que cada característica de X proviene de una distribución categórica diferente. Se asume además que todas las categorías de cada característica están representadas por los números 0,…, n – 1, donde n se refiere al número total de categorías para la característica dada. Esto se puede lograr, por ejemplo, con la ayuda de OrdinalEncoder.

yarray-like of shape (n_samples)

Valores objetivo.

classesarray-like of shape (n_classes), default=None

Lista de todas las clases que pueden aparecer posiblemente en el vector y.

Debe proporcionarse en la primera llamada a partial_fit, se puede omitir en llamadas posteriores.

sample_weightarray-like of shape (n_samples), default=None

Pesos aplicados a muestras individuales (1. para no ponderados).

Devoluciones
selfobject
predict(X)[source]

Realizar clasificación en un array de los vectores de prueba X.

Parámetros
Xarray-like of shape (n_samples, n_features)
Devoluciones
Cndarray of shape (n_samples,)

Valores objetivo previstos para X

predict_log_proba(X)[source]

Devuelve estimaciones logarítmicas de probabilidad para el vector de prueba X.

Parámetros
Xarray-like of shape (n_samples, n_features)
Devoluciones
Carray-like of shape (n_samples, n_classes)

Devuelve la probabilidad logarítmica de las muestras para cada clase del modelo. Las columnas corresponden a las clases en orden ordenado, tal como aparecen en el attribute clases_.

predict_proba(X)[source]

Devolver estimaciones de probabilidad para el vector de prueba X.

Parámetros
Xarray-like of shape (n_samples, n_features)
Devoluciones
Carray-like of shape (n_samples, n_classes)

Devuelve la probabilidad de las muestras para cada clase del modelo. Las columnas corresponden a las clases en orden ordenado, tal como aparecen en la attribute clases_.

score(X, y, sample_weight=None)[source]

Devuelve la precisión media en las etiquetas y los datos de prueba dados.

En la clasificación de etiquetas múltiples, esta es la precisión del subconjunto, que es una métrica rigurosa, ya que para cada muestra se requiere que cada conjunto de etiquetas se prediga correctamente.

Parámetros
Xarray-like of shape (n_samples, n_features)

Muestras de prueba.

yarray-like of shape (n_samples,) or (n_samples, n_outputs)

Verdaderas etiquetas para X.

sample_weightarray-like of shape (n_samples,), default=None

Pesos de muestra.

Devoluciones
scorefloat

Precisión media de self.predict(X) wrt. y.

set_params(**params)[source]

Establezca los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma __ para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfestimator instance

Instancia de estimador.