Traemos la mejor solución que hallamos online. Deseamos que te resulte de mucha ayuda y si puedes aportar cualquier detalle que nos pueda ayudar a perfeccionar nuestra información hazlo con libertad.
class sklearn.naive_bayes.CategoricalNB(*, alpha=1.0, fit_prior=True, class_prior=None, min_categories=None)
[source]-
Clasificador Naive Bayes para características categóricas
El clasificador categórico Naive Bayes es adecuado para la clasificación con características discretas que se distribuyen categóricamente. Las categorías de cada característica se extraen de una distribución categórica.
Leer más en el Guía del usuario.
- Parámetros
-
alphafloat, default=1.0
-
Parámetro de suavizado aditivo (Laplace / Lidstone) (0 para sin suavizado).
fit_priorbool, default=True
-
Ya sea para aprender las probabilidades previas de la clase o no. Si false, se utilizará un uniforme previo.
class_priorarray-like of shape (n_classes,), default=None
-
Probabilidades previas de las clases. Si se especifica, los a priori no se ajustan de acuerdo con los datos.
min_categoriesint or array-like of shape (n_features,), default=None
-
Número mínimo de categorías por función.
- entero: establece el número mínimo de categorías por función en
n_categories
para cada característica. - array-como: forma (n_features,) donde
n_categories[i]
contiene el número mínimo de categorías para la i-ésima columna de la entrada. - Ninguno (predeterminado): determina el número de categorías automáticamente a partir de los datos de entrenamiento.
Nuevo en la versión 0.24.
- entero: establece el número mínimo de categorías por función en
- Atributos
-
category_count_list of arrays of shape (n_features,)
-
Contiene matrices de formas (n_clases, n_categorías de la característica respectiva) para cada característica. Cada array proporciona el número de muestras encontradas para cada clase y categoría de la característica específica.
class_count_ndarray of shape (n_classes,)
-
Número de muestras encontradas para cada clase durante el ajuste. Este valor se pondera con el peso de la muestra cuando se proporciona.
class_log_prior_ndarray of shape (n_classes,)
-
Probabilidad logarítmica empírica suavizada para cada clase.
classes_ndarray of shape (n_classes,)
-
Etiquetas de clase conocidas por el clasificador
feature_log_prob_list of arrays of shape (n_features,)
-
Contiene matrices de forma (n_clases, n_categorías de la característica respectiva) para cada característica. Cada array proporciona la probabilidad logarítmica empírica de categorías dadas la característica y la clase respectivas,
P(x_i|y)
. n_features_int
-
Número de características de cada muestra.
n_categories_ndarray of shape (n_features,), dtype=np.int64
-
Número de categorías para cada función. Este valor se infiere de los datos o se establece mediante el número mínimo de categorías.
Nuevo en la versión 0.24.
Ejemplos de
>>>import numpy as np >>> rng = np.random.RandomState(1)>>> X = rng.randint(5, size=(6,100))>>> y = np.array([1,2,3,4,5,6])>>>from sklearn.naive_bayes import CategoricalNB >>> clf = CategoricalNB()>>> clf.fit(X, y) CategoricalNB()>>>print(clf.predict(X[2:3]))[3]
Métodos
fit
(X, y[, sample_weight])Ajuste el clasificador Naive Bayes según X, y
get_params
([deep])Obtenga parámetros para este estimador.
partial_fit
(X, y[, classes, sample_weight])Ajuste incremental en un lote de muestras.
predict
(X)Realizar clasificación en un array de los vectores de prueba X.
predict_log_proba
(X)Devuelve estimaciones logarítmicas de probabilidad para el vector de prueba X.
predict_proba
(X)Devolver estimaciones de probabilidad para el vector de prueba X.
score
(X, y[, sample_weight])Devuelve la precisión media en las etiquetas y los datos de prueba dados.
set_params
(** parámetros)Establezca los parámetros de este estimador.
fit(X, y, sample_weight=None)
[source]-
Ajuste el clasificador Naive Bayes según X, y
- Parámetros
-
Xarray-like, sparse matrix of shape (n_samples, n_features)
-
Vectores de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características. Aquí, se supone que cada característica de X proviene de una distribución categórica diferente. Se asume además que todas las categorías de cada característica están representadas por los números 0,…, n – 1, donde n se refiere al número total de categorías para la característica dada. Esto se puede lograr, por ejemplo, con la ayuda de OrdinalEncoder.
yarray-like of shape (n_samples,)
-
Valores objetivo.
sample_weightarray-like of shape (n_samples), default=None
-
Pesos aplicados a muestras individuales (1. para no ponderados).
- Devoluciones
-
selfobject
get_params(deep=True)
[source]-
Obtenga parámetros para este estimador.
- Parámetros
-
deepbool, default=True
-
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devoluciones
-
paramsdict
-
Nombres de parámetros asignados a sus valores.
partial_fit(X, y, classes=None, sample_weight=None)
[source]-
Ajuste incremental en un lote de muestras.
Se espera que este método se llame varias veces consecutivas en diferentes partes de un conjunto de datos para implementar el aprendizaje fuera del núcleo o en línea.
Esto es especialmente útil cuando todo el conjunto de datos es demasiado grande para caber en la memoria a la vez.
Este método tiene cierta sobrecarga de rendimiento, por lo que es mejor llamar a la función de ajuste parcial en fragmentos de datos que sean lo más grandes posible (siempre que se ajusten al presupuesto de memoria) para ocultar la sobrecarga.
- Parámetros
-
Xarray-like, sparse matrix of shape (n_samples, n_features)
-
Vectores de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características. Aquí, se supone que cada característica de X proviene de una distribución categórica diferente. Se asume además que todas las categorías de cada característica están representadas por los números 0,…, n – 1, donde n se refiere al número total de categorías para la característica dada. Esto se puede lograr, por ejemplo, con la ayuda de OrdinalEncoder.
yarray-like of shape (n_samples)
-
Valores objetivo.
classesarray-like of shape (n_classes), default=None
-
Lista de todas las clases que pueden aparecer posiblemente en el vector y.
Debe proporcionarse en la primera llamada a partial_fit, se puede omitir en llamadas posteriores.
sample_weightarray-like of shape (n_samples), default=None
-
Pesos aplicados a muestras individuales (1. para no ponderados).
- Devoluciones
-
selfobject
predict(X)
[source]-
Realizar clasificación en un array de los vectores de prueba X.
- Parámetros
-
Xarray-like of shape (n_samples, n_features)
- Devoluciones
-
Cndarray of shape (n_samples,)
-
Valores objetivo previstos para X
predict_log_proba(X)
[source]-
Devuelve estimaciones logarítmicas de probabilidad para el vector de prueba X.
- Parámetros
-
Xarray-like of shape (n_samples, n_features)
- Devoluciones
-
Carray-like of shape (n_samples, n_classes)
-
Devuelve la probabilidad logarítmica de las muestras para cada clase del modelo. Las columnas corresponden a las clases en orden ordenado, tal como aparecen en el attribute clases_.
predict_proba(X)
[source]-
Devolver estimaciones de probabilidad para el vector de prueba X.
- Parámetros
-
Xarray-like of shape (n_samples, n_features)
- Devoluciones
-
Carray-like of shape (n_samples, n_classes)
-
Devuelve la probabilidad de las muestras para cada clase del modelo. Las columnas corresponden a las clases en orden ordenado, tal como aparecen en la attribute clases_.
score(X, y, sample_weight=None)
[source]-
Devuelve la precisión media en las etiquetas y los datos de prueba dados.
En la clasificación de etiquetas múltiples, esta es la precisión del subconjunto, que es una métrica rigurosa, ya que para cada muestra se requiere que cada conjunto de etiquetas se prediga correctamente.
- Parámetros
-
Xarray-like of shape (n_samples, n_features)
-
Muestras de prueba.
yarray-like of shape (n_samples,) or (n_samples, n_outputs)
-
Verdaderas etiquetas para
X
. sample_weightarray-like of shape (n_samples,), default=None
-
Pesos de muestra.
- Devoluciones
-
scorefloat
-
Precisión media de
self.predict(X)
wrt.y
.
set_params(**params)
[source]-
Establezca los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma
para que sea posible actualizar cada componente de un objeto anidado.__ - Parámetros
-
**paramsdict
-
Parámetros del estimador.
- Devoluciones
-
selfestimator instance
-
Instancia de estimador.
Te mostramos las reseñas y valoraciones de los lectores
Finalizando este artículo puedes encontrar los informes de otros gestores de proyectos, tú además tienes la habilidad dejar el tuyo si dominas el tema.