Saltar al contenido

cómo ejecutar un cuaderno python jupyter diariamente automáticamente

Solución:

Actualizar

Recientemente me encontré con la papelera que sirve para ejecutar y parametrizar cuadernos.

https://github.com/nteract/papermill

papermill local/input.ipynb s3://bkt/output.ipynb -p alpha 0.6 -p l1_ratio 0.1

Esto parece mejor que nbconvert, porque puede usar parámetros. Aún tiene que activar este comando con un planificador. A continuación se muestra un ejemplo con cron en Ubuntu.


Respuesta antigua

nbconvert --execute

Puede ejecutar un cuaderno jupyter, este incrustado en un cronjob hará lo que quiera.

Configuración de ejemplo en Ubuntu:

Crear yourscript.sh con el siguiente contenido:

/opt/anaconda/envs/yourenv/bin/jupyter nbconvert 
                      --execute 
                      --to notebook /path/to/yournotebook.ipynb 
                      --output /path/to/yournotebook-output.ipynb

Tiene más opciones excepto –a notebook. Me gusta esta opción ya que tienes un “log” -File completamente ejecutable después.

Recomiendo usar un entorno virtual para ejecutar su computadora portátil, para evitar que futuras actualizaciones interfieran con su secuencia de comandos. No olvide instalar nbconvert en el entorno.

Ahora cree un cronjob, que se ejecute todos los días, por ejemplo, a las 5:10 a. M., Escribiendo crontab -e en su terminal y agregue esta línea:

10 5 * * * /path/to/yourscript.sh

Pruebe la extensión de Chrome SeekWell. Le permite programar cuadernos para que se ejecuten semanalmente, diariamente, cada hora o cada 5 minutos, directamente desde Jupyter Notebooks. También puede enviar DataFrames directamente a Sheets o Slack si lo desea.

Aquí hay un video de demostración, y también hay más información en el enlace de Chrome Web Store anterior.

** Divulgación: soy cofundador de SeekWell

Es mejor combinar con flujo de aire si desea tener una mayor calidad. Los empaqueté en una imagen de la ventana acoplable, https://github.com/michaelchanwahyan/datalab.

Se hace modificando un paquete de código abierto nbparameterize e integrando los argumentos de paso como execution_date. El gráfico se puede generar sobre la marcha La salida se puede actualizar y guardar dentro del cuaderno.

Cuando se ejecuta

  • el cuaderno se leerá e inyectará los parámetros
  • el cuaderno se ejecuta y la salida sobrescribirá la ruta original

Además, también instaló y configuró herramientas comunes como Spark, Keras, Tensorflow, etc.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *