IMPORTHTML Excel : Extraire des données web facilement
Maîtrisez IMPORTHTML dans Excel et Google Sheets. Importez tableaux et listes depuis des pages web. Exemples concrets, syntaxe, erreurs courantes.
Syntaxe
url: L'URL de la page web à partir de laquelle extraire les données. Doit être une chaîne de texte. query_type: Soit "table" pour importer un tableau, soit "list" pour importer une liste. Doit être une chaîne de texte. index: L'index du tableau ou de la liste à importer (commence à 1). Doit être un nombre entier.
Explication détaillée
IMPORTHTML dans Excel : Le Guide Ultime
Introduction
La fonction IMPORTHTML est un outil puissant pour extraire des données directement depuis des pages web dans Excel. Elle permet d'importer des tableaux et des listes entières, automatisant ainsi la collecte d'informations cruciales pour l'analyse et le reporting. Cependant, il est important de noter que IMPORTHTML n'est pas nativement disponible dans Excel et nécessite l'utilisation de Power Query (Get & Transform Data) pour obtenir une fonctionnalité similaire.
Syntaxe
Bien que IMPORTHTML ne soit pas une fonction Excel directe, nous allons simuler son comportement avec Power Query. Le principe reste le même : spécifier l'URL, le type de données (tableau ou liste) et l'index.
Fonctionnement (avec Power Query)
- Ouvrir Power Query : Dans Excel, allez dans l'onglet
Données>Obtenir et transformer des données>À partir du web. - Entrer l'URL : Saisissez l'URL de la page web contenant les données.
- Sélectionner les données : Power Query affichera un aperçu des tableaux et des listes disponibles. Choisissez celui que vous souhaitez importer.
- Transformer les données (optionnel) : Vous pouvez nettoyer et transformer les données avant de les charger dans votre feuille de calcul.
- Charger les données : Cliquez sur
Chargerpour importer les données dans Excel.
Cas d'utilisation
- Suivi des cours boursiers : Importer les données boursières depuis un site financier.
- Veille concurrentielle : Extraire les prix des produits de vos concurrents depuis leurs sites web.
- Analyse de données RH : Importer les données de salaires moyens par profession depuis un site spécialisé.
Bonnes pratiques
- Vérifier la structure de la page web : Assurez-vous que la structure HTML de la page web est stable, sinon l'importation risque de ne plus fonctionner en cas de modification du site.
- Gérer les erreurs : Prévoyez des mécanismes de gestion des erreurs pour traiter les cas où l'importation échoue.
- Actualiser les données : Configurez l'actualisation automatique des données pour maintenir votre feuille de calcul à jour.
Combinaisons
Vous pouvez combiner Power Query avec d'autres fonctions Excel pour automatiser davantage vos analyses.
INDEXetMATCH: Pour extraire des valeurs spécifiques à partir des données importées.VLOOKUP: Pour rechercher des informations dans les données importées à partir d'une autre feuille de calcul.IFERROR: Pour gérer les erreurs potentielles lors de l'extraction des données.
Cas d'utilisation
Suivi des prix de la concurrence
Collecte de données financières
Veille informationnelle
Exemples pratiques
Données : Page Wikipedia avec une liste de pays et leur PIB
Cette formule importe le premier tableau trouvé sur la page Wikipedia spécifiée, qui contient la liste des pays par PIB nominal.
Données : Page Boursorama avec des informations sur le CAC 40
Cette formule importe la seconde liste trouvée sur la page Boursorama spécifiée, qui pourrait contenir des informations sur la composition du CAC 40 ou d'autres données liées.
Données : Page Yahoo Finance avec des statistiques clés pour Apple (AAPL)
Cette formule importe le 4ème tableau de la page Yahoo Finance d'Apple, potentiellement contenant des ratios financiers importants.
Conseils et astuces
Utilisez la fonction IMPORTHTML avec prudence, car elle peut être affectée par les changements de structure des sites web.
Pour les sites web avec des données complexes, envisagez d'utiliser des outils d'extraction de données plus robustes comme des API ou des services de scraping.
Actualisez régulièrement les données importées pour vous assurer qu'elles sont à jour.
Utilisez la fonction IFERROR pour gérer les erreurs potentielles lors de l'importation des données.
Erreurs courantes
La page web n'existe pas ou est inaccessible.
Vérifiez l'URL et assurez-vous que le site web est accessible.
L'index spécifié est incorrect. Il n'y a pas de tableau ou de liste à cet index sur la page web.
Vérifiez le nombre de tableaux et de listes sur la page web et ajustez l'index en conséquence.