-
io : str, bytes, ExcelFile, xlrd.Book, objeto de ruta o objeto similar a un archivo
-
Cualquier ruta de cadena válida es aceptable. La cadena podría ser una URL. Los esquemas de URL válidos incluyen http, ftp, s3 y file. Para las URL de archivos, se espera un host. Un archivo local podría ser: file://localhost/path/to/table.xlsx
.
Si desea pasar un objeto de ruta, pandas acepta cualquier os.PathLike
.
Por objeto similar a un archivo, nos referimos a objetos con un read()
método, como un identificador de archivo (por ejemplo, a través de incorporado open
función) o StringIO
.
-
sheet_name : str, int, list o None, predeterminado 0
-
Las cadenas se utilizan para los nombres de las hojas. Los números enteros se utilizan en posiciones de hoja indexadas a cero. Las listas de cadenas / números enteros se utilizan para solicitar varias hojas. Especifique Ninguno para obtener todas las hojas.
Casos disponibles:
-
Predeterminado a 0
: 1a hoja como Marco de datos
-
1
: 2da hoja como Marco de datos
-
"Sheet1"
: Cargue la hoja con el nombre “Hoja1”
-
[0, 1, "Sheet5"]
: Cargue la primera, la segunda y la hoja denominada “Hoja5” como un dict de Marco de datos
-
Ninguno: todas las hojas.
-
encabezamiento : int, lista de int, predeterminado 0
-
Fila (indexada con 0) que se utilizará para las etiquetas de columna del DataFrame analizado. Si se pasa una lista de enteros, esas posiciones de fila se combinarán en una MultiIndex
. Use Ninguno si no hay encabezado.
-
nombres : tipo matriz, predeterminado Ninguno
-
Lista de nombres de columna para usar. Si el archivo no contiene una fila de encabezado, debe pasar explícitamente header = None.
-
index_col : int, lista de int, predeterminado Ninguno
-
Columna (indexada en 0) para usar como etiquetas de fila del DataFrame. Pase Ninguno si no existe tal columna. Si se pasa una lista, esas columnas se combinarán en una MultiIndex
. Si se selecciona un subconjunto de datos con usecols
, index_col se basa en el subconjunto.
-
usecols : int, str, list-like o invocable predeterminado Ninguno
-
-
Si es Ninguno, analice todas las columnas.
-
Si es str, indica una lista separada por comas de letras y rangos de columnas de Excel (por ejemplo, “A: E” o “A, C, E: F”). Los rangos incluyen ambos lados.
-
Si es una lista de int, indica la lista de números de columna que se analizarán.
-
Si es una lista de cadenas, indica la lista de nombres de columnas que se analizarán.
Nuevo en la versión 0.24.0.
-
Si es invocable, evalúe el nombre de cada columna y analice la columna si el invocable devuelve True
.
Devuelve un subconjunto de las columnas según el comportamiento anterior.
Nuevo en la versión 0.24.0.
-
estrujar : bool, predeterminado Falso
-
Si los datos analizados solo contienen una columna, devuelve una serie.
-
dtype : Escriba el nombre o el diccionario de la columna -> escriba, predeterminado Ninguno
-
Tipo de datos para datos o columnas. Por ejemplo, {‘a’: np.float64, ‘b’: np.int32} Use objeto para conservar los datos almacenados en Excel y no interpretar dtype. Si se especifican convertidores, se aplicarán EN LUGAR de la conversión dtype.
-
motor : str, predeterminado Ninguno
-
Si io no es un búfer o una ruta, debe configurarse para identificar io. Motores compatibles: “xlrd”, “openpyxl”, “odf”, “pyxlsb”. Compatibilidad del motor:
-
“Xlrd” admite archivos de Excel de estilo antiguo (.xls).
-
“Openpyxl” admite formatos de archivo de Excel más nuevos.
-
“Odf” admite formatos de archivo OpenDocument (.odf, .ods, .odt).
-
“Pyxlsb” admite archivos binarios de Excel.
Modificado en la versión 1.2.0: El motor xlrd ahora solo es compatible con el estilo antiguo .xls
archivos. Cuando engine=None
, se utilizará la siguiente lógica para determinar el motor:
-
Si path_or_buffer
es un formato de OpenDocument (.odf, .ods, .odt), entonces odf se utilizará.
-
De lo contrario si path_or_buffer
es un formato xls, xlrd
se utilizará.
-
De lo contrario si openpyxl está instalado, entonces openpyxl
se utilizará.
-
De lo contrario si xlrd >= 2.0
está instalado, un ValueError
se levantará.
-
De lo contrario xlrd
será utilizado y un FutureWarning
se levantará. Este caso planteará una ValueError
en una versión futura de pandas.
-
convertidores : dict, predeterminado Ninguno
-
Dictado de funciones para convertir valores en determinadas columnas. Las claves pueden ser números enteros o etiquetas de columna, los valores son funciones que toman un argumento de entrada, el contenido de la celda de Excel, y devuelven el contenido transformado.
-
true_values : lista, predeterminado Ninguno
-
Valores a considerar como verdaderos.
-
false_values : lista, predeterminado Ninguno
-
Valores a considerar como falsos.
-
saltos : tipo lista, int o invocable, opcional
-
Números de línea para omitir (indexados en 0) o número de líneas para omitir (int) al comienzo del archivo. Si es invocable, la función invocable se evaluará contra los índices de fila, devolviendo True si la fila debe omitirse y False en caso contrario. Un ejemplo de un argumento invocable válido sería lambda
x: x in [0, 2]
.
-
nrows : int, predeterminado Ninguno
-
Número de filas para analizar.
-
na_values : escalar, str, list-like o dict, predeterminado Ninguno
-
Cadenas adicionales para reconocer como NA / NaN. Si se aprueba dict, valores NA específicos por columna. Por defecto, los siguientes valores se interpretan como NaN: ”, ‘# N / A’, ‘# N / AN / A’, ‘#NA’, ‘-1. # IND’, ‘-1. # QNAN’, ‘-NaN’, ‘-nan’, ‘1. # IND’, ‘1. # QNAN’, ‘ ‘,’ N / A ‘,’ NA ‘,’ NULL ‘,’ NaN ‘,’ n / a ‘,’ nan ‘,’ null ‘.
-
keep_default_na : bool, por defecto True
-
Si se deben incluir o no los valores NaN predeterminados al analizar los datos. Dependiendo de si na_values se pasa, el comportamiento es el siguiente:
-
Si keep_default_na es cierto, y na_values están especificados, na_values se agrega a los valores predeterminados de NaN utilizados para el análisis.
-
Si keep_default_na es cierto, y na_values no se especifican, solo se utilizan los valores NaN predeterminados para el análisis.
-
Si keep_default_na es falso, y na_values se especifican, solo se especifican los valores de NaN na_values se utilizan para analizar.
-
Si keep_default_na es falso, y na_values no se especifican, no se analizarán cadenas como NaN.
Tenga en cuenta que si na_filter se pasa como Falso, el keep_default_na y na_values se ignorarán los parámetros.
-
na_filter : bool, por defecto True
-
Detecta marcadores de valor perdidos (cadenas vacías y el valor de na_values). En datos sin NA, pasar na_filter = False puede mejorar el rendimiento de la lectura de un archivo grande.
-
verboso : bool, predeterminado Falso
-
Indique el número de valores NA colocados en columnas no numéricas.
-
parse_dates : bool, tipo lista o dict, predeterminado Falso
-
El comportamiento es el siguiente:
-
bool. Si es verdadero -> intente analizar el índice.
-
lista de int o nombres. por ejemplo, si [1, 2, 3] -> intente analizar las columnas 1, 2, 3 cada una como una columna de fecha separada.
-
lista de listas. por ejemplo, si [[1, 3]]-> combinar las columnas 1 y 3 y analizarlas como una sola columna de fecha.
-
dict, por ejemplo, {‘foo’: [1, 3]} -> analizar las columnas 1, 3 como fecha y llamar al resultado ‘foo’
Si una columna o índice contiene una fecha que no se puede analizar, la columna o índice completo se devolverá inalterado como un tipo de datos de objeto. Si no desea analizar algunas celdas como fecha, simplemente cambie su tipo en Excel a “Texto”. Para el análisis de fecha y hora no estándar, utilice pd.to_datetime
después pd.read_excel
.
Nota: Existe una ruta rápida para fechas con formato iso8601.
-
analizador_fecha : función, opcional
-
Función que se utilizará para convertir una secuencia de columnas de cadena en una matriz de instancias de fecha y hora. Los usos predeterminados dateutil.parser.parser
para hacer la conversión. Los pandas intentarán llamar analizador_fecha de tres formas diferentes, avanzando a la siguiente si se produce una excepción: 1) Pasar una o más matrices (según lo definido por parse_dates) como argumentos; 2) concatenar (en filas) los valores de cadena de las columnas definidas por parse_dates en una sola matriz y pasar eso; y 3) llamar analizador_fecha una vez para cada fila usando una o más cadenas (correspondientes a las columnas definidas por parse_dates) como argumentos.
-
miles : str, predeterminado Ninguno
-
Separador de miles para analizar columnas de cadenas a números. Tenga en cuenta que este parámetro solo es necesario para las columnas almacenadas como TEXTO en Excel, cualquier columna numérica se analizará automáticamente, independientemente del formato de visualización.
-
comentario : str, predeterminado Ninguno
-
Comentarios del resto de la línea. Pasar un personaje o personajes a este argumento para indicar comentarios en el archivo de entrada. Se ignora cualquier dato entre la cadena de comentarios y el final de la línea actual.
-
skipfooter : int, predeterminado 0
-
Filas al final para omitir (indexadas en 0).
-
convert_float : bool, por defecto True
-
Convierta flotantes integrales en int (es decir, 1.0 -> 1). Si es False, todos los datos numéricos se leerán como flotantes: Excel almacena todos los números como flotantes internamente.
-
mangle_dupe_cols : bool, por defecto True
-
Las columnas duplicadas se especificarán como ‘X’, ‘X.1’, … ‘X.N’, en lugar de ‘X’ … ‘X’. Pasar False hará que los datos se sobrescriban si hay nombres duplicados en las columnas.
-
opciones_almacenamiento : dict, opcional
-
Opciones adicionales que tienen sentido para una conexión de almacenamiento en particular, por ejemplo, host, puerto, nombre de usuario, contraseña, etc., si usa una URL que será analizada por fsspec
, por ejemplo, comenzando con “s3: //”, “gcs: //”. Se generará un error si se proporciona este argumento con una ruta local o un búfer similar a un archivo. Consulte los documentos de implementación de almacenamiento de backend y fsspec para conocer el conjunto de claves y valores permitidos.
Nuevo en la versión 1.2.0.