Saltar al contenido

Escribiendo el marco de datos de pandas en S3

Solución:

Puede usar el paquete boto3 también para almacenar datos a S3:

from io import StringIO  # python3 (or BytesIO for python2)
import boto3

bucket="info"  # already created on S3
csv_buffer = StringIO()
df.to_csv(csv_buffer)

s3_resource = boto3.resource('s3')
s3_resource.Object(bucket, 'df.csv').put(Body=csv_buffer.getvalue())

Esta

“s3.console.aws.amazon.com/s3/buckets/info/test.csv”

no es un URI de S3, debe pasar un URI de S3 para guardar en s3. Además, no necesita importar s3fs (solo lo necesita instalado),

Sólo inténtalo:

import pandas as pd

df = pd.DataFrame()
# df.to_csv("s3://<bucket_name>/<obj_key>")

# In your case
df.to_csv("s3://info/test.csv")

NOTA: Primero debe crear un depósito en aws s3.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *