IMPORTXML : Extraire des données web avec Excel
Maîtrisez IMPORTXML d'Excel : importez des données XML, HTML, CSV et RSS depuis le web. Guide complet, exemples et solutions aux erreurs courantes.
Syntaxe
La fonction IMPORTXML prend deux arguments :
- url : L'URL de la page web ou du fichier XML à partir duquel vous souhaitez importer des données. Doit être entre guillemets.
- requête_xpath : Une chaîne de caractères représentant une requête XPath qui définit les données spécifiques que vous souhaitez extraire de la page web ou du fichier XML. Doit être entre guillemets.
Utilisation dans Google Sheets
La fonction IMPORTXML est également disponible dans Google Sheets et fonctionne de manière très similaire à Excel. La principale différence réside dans la gestion des erreurs et des limitations. Google Sheets peut avoir des limites plus strictes sur le nombre de requêtes IMPORTXML que vous pouvez effectuer, et les erreurs peuvent être gérées différemment. Cependant, les principes de base de l'utilisation de XPath restent les mêmes. En général, les requêtes XPath qui fonctionnent dans Excel fonctionneront également dans Google Sheets, et vice versa. Assurez-vous de consulter la documentation Google Sheets pour les dernières informations sur les limitations et les meilleures pratiques.
Cas d'utilisation
Suivi des prix des concurrents
Collecte de données boursières
Surveillance des actualités
Exemples pratiques
Données : https://www.example.com
Cette formule extrait le titre de la page web example.com en utilisant la requête XPath "//title".
Données : https://fr.wikipedia.org/wiki/Wikip%C3%A9dia
Cette formule extrait tous les liens (attributs href des balises ) de la page Wikipédia en français.
Données : https://www.example-ecommerce.com/produit/123 (supposant que le prix soit dans une balise span avec la classe 'prix')
Cette formule extrait le prix d'un produit d'un site de commerce électronique, en supposant que le prix soit contenu dans une balise <span> avec la classe prix.
Conseils et astuces
Utilisez l'inspecteur d'éléments de votre navigateur pour identifier la structure HTML ou XML de la page web et créer des requêtes XPath précises.
Testez vos requêtes XPath dans un outil de test XPath avant de les utiliser dans IMPORTXML pour vous assurer qu'elles renvoient les résultats attendus.
Utilisez la fonction IFERROR pour gérer les erreurs potentielles renvoyées par IMPORTXML.
Soyez conscient des limites de IMPORTXML en termes de nombre de requêtes et de temps d'exécution. Utilisez des outils de scraping plus robustes pour des projets de grande envergure.
Erreurs courantes
L'URL est invalide ou inaccessible, ou la requête XPath est incorrecte et ne trouve aucun résultat.
Vérifiez l'URL et assurez-vous qu'elle est accessible. Vérifiez également votre requête XPath et assurez-vous qu'elle correspond à la structure du document HTML ou XML.
La cellule contient trop de données à afficher, ou il y a un problème de dépendance circulaire.
Essayez d'étendre la plage de cellules pour afficher toutes les données. Si le problème persiste, vérifiez s'il y a des références circulaires dans votre feuille de calcul.