AgentQL представя нов подход към уеб скрейпинга, позволявайки на потребителите да извличат данни от уебсайтове с неструктурирани формати, като прецизно дефинират структурата на желаната информация. Това води до последователно и структурирано извличане на данни, дори от уебсайтове, съдържащи динамично съдържание или често променящи се оформления.
В това изчерпателно ръководство ще ви преведем през процеса на внедряване на AgentQL MCP сървър в Claude Desktop. Ще използваме интегрираните инструменти за визуализация на Claude, за да изследваме извлечените данни. Нашият конкретен пример ще включва скрейпване на страница с резултати от търсене в Amazon за AI books, извличане на ключови детайли като цена, рейтинг и броя на отзивите.
Стъпка 1: Настройка на зависимости
Преди да се потопим във внедряването, трябва да се уверим, че всички необходими зависимости са инсталирани и конфигурирани. Това включва настройка на Node.js, Claude Desktop и получаване на AgentQL API ключ.
Node.js
Node.js е JavaScript среда за изпълнение, която ни позволява да изпълняваме JavaScript код извън уеб браузър. Тя е необходима за стартиране на AgentQL сървъра, използвайки npx
, пакетен изпълнител, който е включен в Node.js.
За да инсталирате Node.js, следвайте тези стъпки:
- Посетете официалния уебсайт на Node.js: nodejs.org.
- Изтеглете най-новата LTS (Long Term Support) версия на Node.js.
- Стартирайте инсталатора.
- Приемете лицензионното споразумение и преминете през съветника за инсталиране.
- Оставете всички настройки по подразбиране и завършете инсталацията.
След инсталацията, проверете дали Node.js и npm
(Node Package Manager) са инсталирани правилно, като отворите вашия терминал или команден ред и изпълните следните команди: