▷Eliminar el atributo de clase de HTML usando Python y lxml ✔️ Foro Ayuda 【 2024 】

Solución:

No puedo probar esto en este momento, pero esta parece ser la idea general.

for tag in node.xpath('//*[@class]'):
    tag.attrib.pop('class')

lxml.html.clean.Cleaner funciona, pero necesita una configuración adecuada.

import lxml.html
from lxml.html import clean

html_string = '<p id="test" class="DumbClass">Lorem ipsum dolor sit amet, consectetur adipisicing elit</p>'
tree = html.fromstring(html_string)

cleaner = html.clean.Cleaner()
cleaner.safe_attrs_only = True
cleaner.safe_attrs=frozenset(['id'])
cleaned = cleaner.clean_html(tree)
print(html.tostring(cleaned))

Resulta en :

b'<p id="test">Lorem ipsum dolor sit amet, consectetur adipisicing elit</p>'

¡Haz clic para puntuar esta entrada!

(Votos: 0 Promedio: 0)

Utiliza Nuestro Buscador

Preguntas Relacionadas:

¿Cómo eliminar el atributo "deshabilitado" usando jQuery?
Cómo extraer el atributo xml usando Python ElementTree
Eliminar una clase CSS del elemento HTML en el código detrás…
Ejemplo de enlaces de estilo, clase y atributo angular
instalar el ejemplo de código de python lxml
¿Agregar y eliminar una clase al hacer clic usando jQuery?
cómo eliminar un objeto de clase en el ejemplo de código de…
cómo eliminar un objeto de clase en el ejemplo de código…
ejemplo de código html de atributo de visualización
¿Cómo eliminar el atributo xmlns de un nodo que no sea root…
¿Es malo agregar JSON en el atributo de datos HTML?
Agregar/eliminar HTML dentro de div usando JavaScript