AgentQL présente une approche novatrice de la collecte de données Web, permettant aux utilisateurs d’extraire des données de sites Web avec des formats non structurés en définissant précisément la structure des informations souhaitées. Cela se traduit par une récupération de données cohérente et structurée, même à partir de sites Web présentant un contenu dynamique ou des mises en page fréquemment modifiées.
Dans ce guide complet, nous allons vous guider tout au long du processus d’implémentation d’un serveur AgentQL MCP dans Claude Desktop. Nous exploiterons les outils de visualisation intégrés de Claude pour explorer les données extraites. Notre exemple spécifique consistera à extraire une page de résultats de recherche Amazon pour des livres sur l’IA, en extrayant des détails clés tels que le prix, la note et le nombre d’avis.
Étape 1 : Configuration des dépendances
Avant de plonger dans l’implémentation, nous devons nous assurer que toutes les dépendances nécessaires sont installées et configurées. Cela implique la configuration de Node.js, de Claude Desktop et l’obtention d’une clé API AgentQL.
Node.js
Node.js est un environnement d’exécution JavaScript qui nous permet d’exécuter du code JavaScript en dehors d’un navigateur Web. Il est nécessaire pour exécuter le serveur AgentQL à l’aide de npx
, un exécuteur de paquets fourni avec Node.js.
Pour installer Node.js, suivez ces étapes :
- Visitez le site Web officiel de Node.js : nodejs.org.
- Téléchargez la dernière version LTS (Long Term Support) de Node.js.
- Exécutez le programme d’installation.
- Acceptez le contrat de licence et suivez l’assistant d’installation.
- Laissez tous les paramètres par défaut et terminez l’installation.
Après l’installation, vérifiez que Node.js et npm
(Node Package Manager) sont correctement installés en ouvrant votre terminal ou votre invite de commandes et en exécutant les commandes suivantes :