Saltar al contenido

Cómo convertir un xml string a un diccionario?

Queremos brindarte la mejor solución que encontramos on line. Deseamos que te sirva de ayuda y si puedes compartir alguna mejora hazlo con libertad.


xmltodict (divulgación completa: lo escribí) hace exactamente eso:


# u'person': u'age': u'20', u'name': u'john'

Este es un gran módulo que alguien creó. Lo he usado varias veces.

Aquí está el código del sitio web en caso de que el enlace se estropee.

from xml.etree import cElementTree as ElementTree

class XmlListConfig(list):
    def __init__(self, aList):
        for element in aList:
            if element:
                # treat like dict
                if len(element) == 1 or element[0].tag != element[1].tag:
                # treat like list
                elif element[0].tag == element[1].tag:
            elif element.text:
                text = element.text.strip()
                if text:

class XmlDictConfig(dict):
    Example usage:

    >>> tree = ElementTree.parse('your_file.xml')
    >>> root = tree.getroot()
    >>> xmldict = XmlDictConfig(root)

    Or, if you want to use an XML string:

    >>> root = ElementTree.XML(xml_string)
    >>> xmldict = XmlDictConfig(root)

    And then use xmldict for what it is... a dict.
    def __init__(self, parent_element):
        if parent_element.items():
        for element in parent_element:
            if element:
                # treat like dict - we assume that if the first two tags
                # in a series are different, then they are all different.
                if len(element) == 1 or element[0].tag != element[1].tag:
                    aDict = XmlDictConfig(element)
                # treat like list - we assume that if the first two tags
                # in a series are the same, then the rest are the same.
                    # here, we put the list in dictionary; the key is the
                    # tag name the list elements all share in common, and
                    # the value is the list itself 
                    aDict = element[0].tag: XmlListConfig(element)
                # if the tag has attributes, add those to the dict
                if element.items():
                self.update(element.tag: aDict)
            # this assumes that if you've got an attribute in a tag,
            # you won't be having any text. This may or may not be a 
            # good idea -- time will tell. It works for the way we are
            # currently doing XML configuration files...
            elif element.items():
                self.update(element.tag: dict(element.items()))
            # finally, if there are no child tags and no attributes, extract
            # the text
                self.update(element.tag: element.text)

Uso de ejemplo:

tree = ElementTree.parse('your_file.xml')
root = tree.getroot()
xmldict = XmlDictConfig(root)

// O, si desea utilizar un XML string:

root = ElementTree.XML(xml_string)
xmldict = XmlDictConfig(root)

El siguiente fragmento de código XML a Python analiza las entidades y attributes siguiendo esta “especificación” de XML a JSON. Es la solución más general que maneja todos los casos de XML.

from collections import defaultdict

def etree_to_dict(t):
    d = t.tag:  if t.attrib else None
    children = list(t)
    if children:
        dd = defaultdict(list)
        for dc in map(etree_to_dict, children):
            for k, v in dc.items():
        d = t.tag: k:v[0] if len(v) == 1 else v for k, v in dd.items()
    if t.attrib:
        d[t.tag].update(('@' + k, v) for k, v in t.attrib.items())
    if t.text:
        text = t.text.strip()
        if children or t.attrib:
            if text:
              d[t.tag]['#text'] = text
            d[t.tag] = text
    return d

Esta usado:

from xml.etree import cElementTree as ET
e = ET.XML('''

   text text 
   text text 
   text text 


from pprint import pprint

El resultado de este ejemplo (según la “especificación” vinculada anteriormente) debe ser:

'root': 'e': [None,
                '@name': 'value',
                '#text': 'text', '@name': 'value',
                'a': 'text', 'b': 'text',
                'a': ['text', 'text'],
                '#text': 'text', 'a': 'text']

No es necesariamente bonito, pero no es ambiguo, y las entradas XML más simples dan como resultado JSON más simple. 🙂


Si quieres hacer el marcha atrás, emitir un XML string desde un JSON / dict, puedes usar:

except NameError:  # python3
  basestring = str

def dict_to_etree(d):
    def _to_etree(d, root):
        if not d:
        elif isinstance(d, basestring):
            root.text = d
        elif isinstance(d, dict):
            for k,v in d.items():
                assert isinstance(k, basestring)
                if k.startswith('#'):
                    assert k == '#text' and isinstance(v, basestring)
                    root.text = v
                elif k.startswith('@'):
                    assert isinstance(v, basestring)
                    root.set(k[1:], v)
                elif isinstance(v, list):
                    for e in v:
                        _to_etree(e, ET.SubElement(root, k))
                    _to_etree(v, ET.SubElement(root, k))
            raise TypeError('invalid type: ' + str(type(d)))
    assert isinstance(d, dict) and len(d) == 1
    tag, body = next(iter(d.items()))
    node = ET.Element(tag)
    _to_etree(body, node)
    return ET.tostring(node)


Acuérdate de que tienes la capacidad de esclarecer si diste con el arreglo.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *