Lire les fichiers XML avec Pandas

Bonjour,
J’essaye d’ouvrir les jeux de données du site suivant :
data eol
Le format de la plupart des datasets est composé d’un fichier meta.xml qui représente l’organisation des données et de plusieurs fichiers texte ou sont réellement les données.
Je n’ai pas réussi à ouvrir facilement les données avec pandas.
J’ai utilisé la version de pandas 1.3 ou il y a la fonction read_xml mais c’est pas terrible.
Il y a aussi des tutoriels avec etree mais c’est compliqué.
Est ce qu’il existe une manière simple d’ouvrir les jeux de données avec pandas ou une autre librairie ?
Pourquoi les données sont présentées dans ce format (j’imagine que c’est un format pratique pour certains logiciels) ?
Merci

En cherchant un peu, Je crois que j’ai une piste du coté d’une librairie python :
CKAN

Bonjour Yann

En effet, même si avec pandas, nous pouvons importer plusieurs types de données, le fichier XML n’en fait pas partie, il faut passer par cette fonction.

En effet, il s’agit d’une manière simple de stocker des données qui sont dites semi-structuré. À l’ère du Big Data, où un volume important de données de types différents se crée rapidement, ce type de structure se relève pratique contrairement aux fichiers csv.

Merci Frederic,
Finalement j’ai trouvé quelques datasets en .csv
La fonction etree, j’ai commencé à regarder mais c’est quand même un peu compliqué.
Le logiciel CKAN, j’arrive pas à importer de données pour l’instant.
Et la fonction read_xml de la nouvelle version de pandas, elle est pas beaucoup documenté pour l’instant.
Bilan : problème remis à plus tard
Merci encore

Effectivement les fichiers XML sont plus compliqués à manipuler mais avec la pratique vous y arriverez, je ne connaissais pas la fonction read_xml, celle de base est etree . Ravi de savoir que vous avez trouvé des fichiers csv, ils sont plus simples à manipuler.