AgentQL นำเสนอแนวทางใหม่ในการขูดข้อมูลเว็บ (web scraping) ช่วยให้ผู้ใช้สามารถดึงข้อมูลจากเว็บไซต์ที่มีรูปแบบที่ไม่เป็นโครงสร้างได้อย่างแม่นยำ โดยการกำหนดโครงสร้างของข้อมูลที่ต้องการอย่างชัดเจน ส่งผลให้การดึงข้อมูลเป็นไปอย่างสม่ำเสมอและมีโครงสร้าง แม้จากเว็บไซต์ที่มีเนื้อหาแบบไดนามิกหรือมีการเปลี่ยนแปลงรูปแบบบ่อยครั้ง
ในคู่มือที่ครอบคลุมนี้ เราจะแนะนำคุณตลอดกระบวนการใช้งาน AgentQL MCP server ภายใน Claude Desktop เราจะใช้ประโยชน์จากเครื่องมือการแสดงภาพรวม (visualization tools) ในตัวของ Claude เพื่อสำรวจข้อมูลที่ดึงออกมา ตัวอย่างเฉพาะของเราจะเกี่ยวข้องกับการขูดหน้าผลการค้นหาของ Amazon สำหรับ AI books โดยจะดึงรายละเอียดที่สำคัญ เช่น ราคา คะแนน และจำนวนรีวิว
ขั้นตอนที่ 1: การตั้งค่า Dependencies
ก่อนที่จะเข้าสู่การใช้งาน เราต้องตรวจสอบให้แน่ใจว่า dependencies ที่จำเป็นทั้งหมดได้รับการติดตั้งและกำหนดค่าแล้ว ซึ่งรวมถึงการตั้งค่า Node.js, Claude Desktop และการขอ AgentQL API key
Node.js
Node.js คือสภาพแวดล้อมรันไทม์ JavaScript ที่ช่วยให้เราสามารถรันโค้ด JavaScript นอกเว็บเบราว์เซอร์ได้ จำเป็นต้องใช้ในการรัน AgentQL server โดยใช้ npx
ซึ่งเป็นตัวรันแพ็กเกจที่มาพร้อมกับ Node.js
ในการติดตั้ง Node.js ให้ทำตามขั้นตอนเหล่านี้:
- เยี่ยมชมเว็บไซต์ Node.js อย่างเป็นทางการ: nodejs.org.
- ดาวน์โหลด Node.js เวอร์ชัน LTS (Long Term Support) ล่าสุด
- รันตัวติดตั้ง
- ยอมรับข้อตกลงสิทธิ์การใช้งานและดำเนินการตามตัวช่วยสร้างการติดตั้ง
- ปล่อยให้การตั้งค่าทั้งหมดเป็นค่าเริ่มต้นและทำการติดตั้งให้เสร็จสมบูรณ์
หลังจากการติดตั้ง ให้ตรวจสอบว่า Node.js และ npm
(Node Package Manager) ได้รับการติดตั้งอย่างถูกต้องโดยเปิดเทอร์มินัลหรือพรอมต์คำสั่งของคุณแล้วรันคำสั่งต่อไปนี้: