Tag: LLM

โอเพนเอไอเปิดตัวเอเจนต์ AI แบบเรียลไทม์ใน 20 นาที

บทความนี้เน้นความก้าวหน้าครั้งสำคัญ: การเปิดตัวเอเจนต์ AI แบบเรียลไทม์ของ OpenAI ที่สามารถพัฒนาได้ในเวลาเพียง 20 นาที ซึ่งแสดงให้เห็นถึงศักยภาพในการพัฒนาที่มีประสิทธิภาพสูงในขอบเขตของแอปพลิเคชันที่ขับเคลื่อนด้วย AI

โอเพนเอไอเปิดตัวเอเจนต์ AI แบบเรียลไทม์ใน 20 นาที

ลดปัญหา KV Cache ใน LLM ด้วยกลไก Attention ใหม่

การใช้ Large Language Models (LLMs) ที่เพิ่มขึ้นทำให้เกิดความท้าทายในการอนุมานขนาดใหญ่ กลไก Attention แบบดั้งเดิมมีปัญหาคอขวดที่ KV Cache ซึ่งขยายตามขนาด Batch และความยาวลำดับ ทำให้เกิดปัญหา 'memory hog' MFA และ MFA-KR เป็นกลไก Attention ใหม่ที่ลดต้นทุนการอนุมานของโมเดลภาษา พร้อมปรับปรุงประสิทธิภาพ ลดการใช้ KV Cache ได้ถึง 93.7% ออกแบบให้เรียบง่าย ทำซ้ำได้ง่าย และเข้ากันได้กับวิธี Pos-embedding ต่างๆ

ลดปัญหา KV Cache ใน LLM ด้วยกลไก Attention ใหม่

ESM3 ก้าวกระโดดในการวิจัยโปรตีน จำลองวิวัฒนาการ 500 ล้านปี API ฟรี Yann LeCun รับรอง

ESM3 โมเดลชีวภาพขนาด 98 พันล้านพารามิเตอร์ พัฒนาโดย Evolutionaryscale สามารถจำลองวิวัฒนาการของโปรตีนได้เทียบเท่า 5 ล้านล้านปี เปิดให้ใช้ API ฟรี โดย Yann LeCun ผู้เชี่ยวชาญด้าน AI ให้การรับรอง มีศักยภาพในการสร้างโปรตีนใหม่และประยุกต์ใช้ทางการแพทย์

ESM3 ก้าวกระโดดในการวิจัยโปรตีน จำลองวิวัฒนาการ 500 ล้านปี API ฟรี Yann LeCun รับรอง

MatterGen: โมเดล AI ปฏิวัติวงการออกแบบวัสดุ เพิ่มความแม่นยำ 10 เท่า

Microsoft เปิดตัว MatterGen โมเดลภาษาขนาดใหญ่ที่ปฏิวัติวงการ ออกแบบวัสดุอนินทรีย์ด้วยความแม่นยำสูงกว่าเดิมถึง 10 เท่า สร้างวัสดุใหม่ๆ ได้รวดเร็ว มีศักยภาพในการพัฒนาแบตเตอรี่และเทคโนโลยีอื่นๆ

MatterGen: โมเดล AI ปฏิวัติวงการออกแบบวัสดุ เพิ่มความแม่นยำ 10 เท่า