AgentQL 提出了一種新穎的網頁抓取方法,使用戶能夠透過精確定義所需資訊的結構,從具有非結構化格式的網站中提取數據。 即使來自具有動態內容或經常變更版面配置的網站,這也能實現一致且結構化的資料檢索。
在本綜合指南中,我們將逐步完成在 Claude Desktop 內實作 AgentQL MCP 伺服器的過程。 我們將利用 Claude 的整合可視化工具來探索提取的資料。 我們的具體範例將涉及抓取 Amazon 搜尋結果頁面,以搜尋 AI 書籍,並提取價格、評級和評論數量等關鍵詳細資訊。
步驟 1:設定相依性
在深入研究實作之前,我們需要確保已安裝和配置所有必要的相依性。 這包括設定 Node.js、Claude Desktop,以及取得 AgentQL API 金鑰。
Node.js
Node.js 是一個 JavaScript 執行時環境,允許我們在網頁瀏覽器之外執行 JavaScript 程式碼。 這是使用 npx
執行 AgentQL 伺服器所必需的,npx
是一個與 Node.js 捆綁在一起的套件執行器。
若要安裝 Node.js,請按照下列步驟操作:
- 造訪官方 Node.js 網站:nodejs.org。
- 下載最新 LTS(長期支援)版本的 Node.js。
- 執行安裝程式。
- 接受授權協議,並按照安裝精靈進行操作。
- 將所有設定保留為預設值,然後完成安裝。
安裝後,透過開啟終端機或命令提示字元並執行以下命令,驗證 Node.js 和 npm
(Node Package Manager)是否已正確安裝: