Tag: Fine-Tuning

Sarvam AI เปิดตัว LLM ท้าชน Meta และ Google

Sarvam AI บริษัทสตาร์ทอัพในอินเดีย เปิดตัว LLM "Sarvam-M" ที่มีประสิทธิภาพเทียบเท่า Meta และ Google โดยเน้นการรองรับภาษาอินเดีย คณิตศาสตร์ และการเขียนโปรแกรม

Sarvam AI เปิดตัว LLM ท้าชน Meta และ Google

A.X 4.0 ของ SK Telecom: เจาะลึกโมเดลภาษา

SK Telecom เปิดตัว A.X 4.0 อย่างเงียบๆ โมเดลภาษาขนาดใหญ่ที่ปรับปรุงสำหรับภาษาเกาหลี โดยใช้ประโยชน์จาก Qwen 2.5 และมีการพัฒนาเพิ่มเติมเพื่อเพิ่มประสิทธิภาพ

A.X 4.0 ของ SK Telecom: เจาะลึกโมเดลภาษา

DMind เปิดตัว DMind-1: LLM โอเพนซอร์สสำหรับ Web3

DMind เปิดตัว DMind-1, LLM โอเพนซอร์สที่ปรับแต่งสำหรับ Web3 โดยเฉพาะ ทำงานได้ดีเยี่ยมใน 9 ประเภท Web3 และต้นทุนการอนุมานต่ำ เป็นมาตรฐานใหม่สำหรับการประเมินผลในระบบ Web3

DMind เปิดตัว DMind-1: LLM โอเพนซอร์สสำหรับ Web3

Alibaba ลดค่าใช้จ่าย AI 90% ด้วย ZEROSEARCH

Alibaba อ้างว่า ZEROSEARCH ลดค่าใช้จ่ายการสอน AI ลง 90% โดยจำลองการค้นหาโดยไม่ต้องใช้ API ทำให้การพัฒนา AI ง่ายขึ้นและถูกลง

Alibaba ลดค่าใช้จ่าย AI 90% ด้วย ZEROSEARCH

AI จีนท้าทาย DeepSeek 2.0: SASR ก้าวหน้า?

กองทุนจีนอ้างเทคนิคฝึก AI ใหม่ SASR อาจเหนือกว่า DeepSeek 2.0, OpenAI เน้นการปรับปรุงประสิทธิภาพของโมเดล AI อย่างมีนัยสำคัญ

AI จีนท้าทาย DeepSeek 2.0: SASR ก้าวหน้า?

Mistral AI เปิดตัว Medium 3 เพื่อธุรกิจ

Mistral Medium 3 เป็นโมเดลภาษาที่ออกแบบมาสำหรับธุรกิจ ให้ความคุ้มค่า ประสิทธิภาพสูง และปรับใช้ได้หลากหลาย

Mistral AI เปิดตัว Medium 3 เพื่อธุรกิจ

NVIDIA เปิดตัว: Llama Nemotron Ultra & Parakeet

เจาะลึกนวัตกรรมล่าสุดของ NVIDIA: Llama Nemotron Ultra และ Parakeet โมเดลภาษาขนาดใหญ่โอเพนซอร์ส (LLMs) และระบบรู้จำเสียงพูดอัตโนมัติ (ASR) สัมภาษณ์พิเศษกับ Joey Conway.

NVIDIA เปิดตัว: Llama Nemotron Ultra & Parakeet

ชัยชนะของ RL: Phi-4 Reasoning Plus ของ Microsoft

Microsoft Phi-4 Reasoning Plus ใช้ RL เพื่อผลลัพธ์ที่น่าทึ่งในการทดสอบมาตรฐาน เอาชนะโมเดลขนาดใหญ่กว่าด้วยชุดข้อมูลคุณภาพสูง

ชัยชนะของ RL: Phi-4 Reasoning Plus ของ Microsoft

Gemma AI: 150 ล้านดาวน์โหลด เจาะลึกโมเดล

Gemma AI ของ Google ทะลุ 150 ล้านดาวน์โหลด วิเคราะห์การเติบโต จุดเด่น เปรียบเทียบกับ Llama และประเด็นเรื่องลิขสิทธิ์

Gemma AI: 150 ล้านดาวน์โหลด เจาะลึกโมเดล

ปฏิวัติการใช้เครื่องมือ LLM: Nemotron-Tool-N1

Nemotron-Tool-N1 ใช้ Reinforcement Learning เพื่อเพิ่มศักยภาพการใช้เครื่องมือของ LLM, เหนือกว่าวิธีการ Fine-Tuning แบบเดิม

ปฏิวัติการใช้เครื่องมือ LLM: Nemotron-Tool-N1