Extraer grupos de captura en la expresión regular palmadita como columnas en un DataFrame.
para cada tema string en la Serie, extraiga grupos de la primera coincidencia de la expresión regular palmadita.
- Parámetros
-
- palmadita : calle
-
Patrón de expresión regular con grupos de captura.
- banderas : int, predeterminado 0 (sin banderas)
-
banderas de la re
módulo, por ejemplo re.IGNORECASE
que modifican la coincidencia de expresiones regulares para cosas como mayúsculas y minúsculas, espacios, etc. Para obtener más detalles, consulte re
.
- expandir : boolpredeterminado Verdadero
-
Si es True, devuelve DataFrame con una columna por grupo de captura. Si es False, devuelva una Serie/Índice si hay un grupo de captura o DataFrame si hay varios grupos de captura.
- Devoluciones
-
- DataFrame o Serie o Índice
-
Un DataFrame con una fila para cada sujeto stringy una columna para cada grupo. Cualquier nombre de grupo de captura en la expresión regular pat se usará para los nombres de columna; de lo contrario, se utilizarán los números de grupo de captura. El dtype de cada columna de resultados siempre es un objeto, incluso cuando no se encuentra ninguna coincidencia. Si expand=False
y pat tiene solo un grupo de captura, luego devuelve una Serie (si el tema es una Serie) o Índice (si el tema es un Índice).
Ver también
extractall
-
Devuelve todas las coincidencias (no solo la primera coincidencia).
Ejemplos
Un patrón con dos grupos devolverá un DataFrame con dos columnas. Los no partidos serán NaN.
>>> s = pd.Series(['a1','b2','c3'])>>> s.str.extract(r'([ab])(d)')010 a 11 b 22 NaN NaN
Un patrón puede contener grupos opcionales.
>>> s.str.extract(r'([ab])?(d)')010 a 11 b 22 NaN 3
Los grupos con nombre se convertirán en nombres de columna en el resultado.
>>> s.str.extract(r'(?P[ab])(?Pd)')
letter digit
0 a 11 b 22 NaN NaN
Un patrón con un grupo devolverá un DataFrame con una columna si expand=True.
>>> s.str.extract(r'[ab](d)', expand=True)001122 NaN
Un patrón con un grupo devolverá una Serie si expand=False.
>>> s.str.extract(r'[ab](d)', expand=False)01122 NaN
dtype:object