Tag: Fine-Tuning

NVIDIA חושפת Llama Nemotron Nano VL

NVIDIA השיקה את Llama Nemotron Nano VL, מודל ראייה-שפה יעיל במיוחד להבנת מסמכים. הוא בנוי על Llama 3.1 ומשלב מקודד ראייה יעיל, ומאפשר ניתוח מדויק של מבני מסמכים מורכבים.

NVIDIA חושפת Llama Nemotron Nano VL

HTX: עתיד חזק יותר בשיתוף פעולה

סוכנות המדע והטכנולוגיה של צוות הבית (HTX) מגבירה את מחויבותה להעצים את צוות הבית של סינגפור באמצעות טכנולוגיה מתקדמת, במיוחד בינה מלאכותית (AI). התחייבות זו באה לידי ביטוי בסדרה של שותפויות חדשות והרחבת שיתופי פעולה קיימים עם חברות גלובליות מובילות.

HTX: עתיד חזק יותר בשיתוף פעולה

גוגל חושפת את MedGemma: מודלי AI בקוד פתוח

גוגל הציגה לאחרונה את MedGemma, חבילה פורצת דרך של מודלי AI גנרטיביים בקוד פתוח, שמטרתם לשנות את ניתוח הטקסט והתמונה הרפואיים בתחום הבריאות.

גוגל חושפת את MedGemma: מודלי AI בקוד פתוח

QwenLong-L1: מהפכה בנימוק ארוך הקשר

QwenLong-L1 היא מסגרת חדשה מבית Alibaba Group שמטרתה לשפר את יכולות הנימוק ארוכות טווח של מודלים שפתיים גדולים.

QwenLong-L1: מהפכה בנימוק ארוך הקשר

NVIDIA חושפת Nemotron Nano 4B

NVIDIA הציגה את Nemotron Nano 4B, מודל שפה קומפקטי אך רב עוצמה, המותאם לפריסה במכשירי קצה ומשימות נימוק טכני ומדעי מתקדם.

NVIDIA חושפת Nemotron Nano 4B

HTX סינגפור: שותפות AI עם מיסטרל ומיקרוסופט

HTX בסינגפור חוברת למיסטרל AI ומיקרוסופט לפיתוח מודלים של Gen AI, לשיפור פעולות צוות הבית, תוך התמקדות בבטיחות הציבור.

HTX סינגפור: שותפות AI עם מיסטרל ומיקרוסופט

Sarvam AI חושפת מודל LLM 24B

Sarvam AI השיקה מודל שפה גדול (LLM) חדשני עם 24 מיליארד פרמטרים, המצטיין בשפות הודיות ובמשימות חשיבה מורכבות כמו מתמטיקה ותכנות.

Sarvam AI חושפת מודל LLM 24B

Sarvam AI חושפת מודל LLM מתקדם

Sarvam AI משיקה LLM רב-לשוני מתקדם, מתחרה במודלים של Meta ו-Google. המודל מצטיין בשפות הודיות, מתמטיקה ותכנות.

Sarvam AI חושפת מודל LLM מתקדם

השקת A.X 4.0 של SK Telecom: ניתוח מעמיק

סקירה מעמיקה על מודל השפה הגדול A.X 4.0 של SK Telecom, כולל פיתוח, אופטימיזציה לקוריאנית, ביצועים עתידיים והשלכות כלכליות.

השקת A.X 4.0 של SK Telecom: ניתוח מעמיק

DMind חושפת את DMind-1: מודל שפה גדול בקוד פתוח ל-Web3

חברת DMind הכריזה רשמית על שחרור DMind-1, מודל שפה גדול בקוד פתוח המיועד ליישומי Web3. מודל זה, המכוון מ-Qwen3-32B של עליבאבא, השיג ביצועים מתקדמים בתשע קטגוריות שונות של Web3.

DMind חושפת את DMind-1: מודל שפה גדול בקוד פתוח ל-Web3