class sklearn.dummy.DummyClassifier(*, strategy='prior', random_state=None, constant=None)[source]

DummyClassifier es un clasificador que hace predicciones usando reglas simples.

Este clasificador es útil como una línea de base simple para comparar con otros clasificadores (reales). No lo use para problemas reales.

Leer más en el Guía del usuario.

Nuevo en la versión 0.13.

Parámetros
strategy“stratified”, “most_frequent”, “prior”, “uniform”, “constant”, default=”prior”

Estrategia a utilizar para generar predicciones.

  • “Estratificado”: ​​genera predicciones respetando la distribución de clases del conjunto de entrenamiento.
  • “Most_frequent”: siempre predice la etiqueta más frecuente en el conjunto de entrenamiento.
  • “Prior”: siempre predice la clase que maximiza la clase anterior (como “most_frequent”) y predict_proba devuelve la clase anterior.
  • “Uniforme”: genera predicciones uniformemente al azar.
  • “Constante”: predice siempre una etiqueta constante proporcionada por el usuario. Esto es útil para métricas que evalúan una clase no mayoritaria.

    Modificado en la versión 0.24: El valor predeterminado de strategy ha cambiado a “anterior” en la versión 0.24.

random_stateint, RandomState instance or None, default=None

Controla la aleatoriedad para generar las predicciones cuando strategy='stratified' o strategy='uniform'. Pase un int para una salida reproducible a través de múltiples llamadas a funciones. Ver Glosario.

constantint or str or array-like of shape (n_outputs,)

La constante explícita según lo predicho por la estrategia “constante”. Este parámetro es útil solo para la estrategia “constante”.

Atributos
classes_ndarray of shape (n_classes,) or list of such arrays

Etiquetas de clase para cada salida.

n_classes_int or list of int

Número de etiqueta para cada salida.

class_prior_ndarray of shape (n_classes,) or list of such arrays

Probabilidad de cada clase para cada salida.

n_outputs_int

Número de salidas.

sparse_output_bool

Cierto si el array devuelto de predict debe estar en formato CSC disperso. Se establece automáticamente en True si la entrada y se pasa en formato disperso.

Ejemplos de

>>>import numpy as np
>>>from sklearn.dummy import DummyClassifier
>>> X = np.array([-1,1,1,1])>>> y = np.array([0,1,1,1])>>> dummy_clf = DummyClassifier(strategy="most_frequent")>>> dummy_clf.fit(X, y)
DummyClassifier(strategy='most_frequent')>>> dummy_clf.predict(X)
array([1,1,1,1])>>> dummy_clf.score(X, y)0.75

Métodos

fit(X, y[, sample_weight])

Ajuste el clasificador aleatorio.

get_params([deep])

Obtenga parámetros para este estimador.

predict(X)

Realizar la clasificación de los vectores de prueba X.

predict_log_proba(X)

Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.

predict_proba(X)

Devuelve estimaciones de probabilidad para los vectores de prueba X.

score(X, y[, sample_weight])

Devuelve la precisión media de los datos de prueba y las etiquetas dados.

set_params(** parámetros)

Establezca los parámetros de este estimador.

fit(X, y, sample_weight=None)[source]

Ajuste el clasificador aleatorio.

Parámetros
Xarray-like of shape (n_samples, n_features)

Datos de entrenamiento.

yarray-like of shape (n_samples,) or (n_samples, n_outputs)

Valores objetivo.

sample_weightarray-like of shape (n_samples,), default=None

Pesos de muestra.

Devoluciones
selfobject
get_params(deep=True)[source]

Obtenga parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

predict(X)[source]

Realice la clasificación de los vectores de prueba X.

Parámetros
Xarray-like of shape (n_samples, n_features)

Datos de prueba.

Devoluciones
yarray-like of shape (n_samples,) or (n_samples, n_outputs)

Valores objetivo previstos para X.

predict_log_proba(X)[source]

Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.

Parámetros
Xarray-like, object with finite length or shape

Datos de entrenamiento, requiere longitud = n_muestras

Devoluciones
Pndarray of shape (n_samples, n_classes) or list of such arrays

Devuelve la probabilidad logarítmica de la muestra para cada clase del modelo, donde las clases se ordenan aritméticamente para cada salida.

predict_proba(X)[source]

Devuelve estimaciones de probabilidad para los vectores de prueba X.

Parámetros
Xarray-like of shape (n_samples, n_features)

Datos de prueba.

Devoluciones
Pndarray of shape (n_samples, n_classes) or list of such arrays

Devuelve la probabilidad de la muestra para cada clase del modelo, donde las clases se ordenan aritméticamente, para cada salida.

score(X, y, sample_weight=None)[source]

Devuelve la precisión media de los datos de prueba y las etiquetas dados.

En la clasificación de etiquetas múltiples, esta es la precisión del subconjunto, que es una métrica rigurosa, ya que para cada muestra se requiere que cada conjunto de etiquetas se prediga correctamente.

Parámetros
XNone or array-like of shape (n_samples, n_features)

Muestras de prueba. Pasar None como muestras de prueba da el mismo resultado que aprobar muestras de prueba reales, ya que DummyClassifier opera independientemente de las observaciones muestreadas.

yarray-like of shape (n_samples,) or (n_samples, n_outputs)

Etiquetas verdaderas para X.

sample_weightarray-like of shape (n_samples,), default=None

Pesos de muestra.

Devoluciones
scorefloat

Precisión media de auto.predecir (X) wrt. y.

set_params(**params)[source]

Establezca los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma __ para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfestimator instance

Instancia de estimador.