Saltar al contenido

Uso de conjuntos de datos de Kaggle en Google Colab

Si te encuentras con algún detalle que te causa duda puedes dejarnos un comentario y te ayudaremos tan rápido como podamos.

Solución:

Paso a paso —

  1. Crear una API key en Kaggle.

    Para hacer esto, vaya a kaggle.com/ y abra su página de configuración de usuario.
    configuración de navegación

  2. A continuación, desplácese hacia abajo hasta la sección de acceso a la API y haga clic en generar para descargar una API key.
    token de API
    Esto descargará un archivo llamado kaggle.json a tu computador. Usarás este archivo en Colab para acceder a conjuntos de datos y competencias de Kaggle.

  3. Navegue a https://colab.research.google.com/.

  4. Sube tu kaggle.json archivo usando el siguiente fragmento en una celda de código:

    from google.colab import files
    files.upload()

  5. Instale la API de kaggle usando !pip install -q kaggle

  6. Mueve el kaggle.json archivo en ~/.kaggleque es donde el cliente API espera que se encuentre su token:

    !mkdir -p ~/.kaggle
    !cp kaggle.json ~/.kaggle/

  7. Ahora puede acceder a conjuntos de datos utilizando el cliente, por ejemplo, !kaggle datasets list.

Aquí hay un cuaderno de ejemplo completo de la parte de Colab de este proceso:
https://colab.research.google.com/drive/1DofKEdQYaXmDWBzuResXWWvxhLgDeVyl

Este ejemplo muestra cómo cargar el kaggle.json archivo, el cliente de la API de Kaggle y el uso del cliente de Kaggle para descargar un conjunto de datos.

Debería poder acceder a cualquier conjunto de datos en Kaggle a través de la API. En este ejemplo, solo se enumeran los conjuntos de datos de las competiciones. Puede ver los conjuntos de datos a los que puede acceder con este comando:

kaggle datasets list

También puede buscar conjuntos de datos agregando la etiqueta -s y luego el término de búsqueda que le interesa. Así que esto le daría una lista de conjuntos de datos sobre perros:

kaggle datasets list -s dogs

Puede encontrar más información sobre la API y cómo usarla en la documentación aquí.

¡Espero que ayude! 🙂

Echa un vistazo a esto.

Utiliza la API oficial de Kaggle detrás de escena, pero automatiza el proceso para que no tenga que volver a descargar manualmente cada vez que se quite su VM. Además, otro problema al que me enfrenté al usar la API de Kaggle directamente en Colab fue la molestia de transferir el token de la API de Kaggle a través de Google Drive. El método anterior también automatiza eso.

Descargo de responsabilidad: soy uno de los creadores de Clouderizer.

Valoraciones y comentarios

Si te animas, tienes la opción de dejar un artículo acerca de qué te ha impresionado de este enunciado.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *