ג'נסן הואנג על מודל AI עתיר מחשוב
ג'נסן הואנג, מנכ'ל Nvidia, דן בהשלכות של מודל הבינה המלאכותית החדשני של DeepSeek, המדגיש את דרישות החישוב המוגברות שלו בניגוד לתפיסות שגויות בשוק.
ג'נסן הואנג, מנכ'ל Nvidia, דן בהשלכות של מודל הבינה המלאכותית החדשני של DeepSeek, המדגיש את דרישות החישוב המוגברות שלו בניגוד לתפיסות שגויות בשוק.
OpenAI הציגה את o1-pro, גרסה משופרת של מודל ה-'reasoning' שלה, ב-API למפתחים. הוא יקר משמעותית, עם תמחור של 150 דולר למיליון טוקנים בקלט ו-600 דולר לפלט, וזמין כרגע רק למפתחים נבחרים.
בינה מלאכותית 'חושבת-ארוך' מתמקדת בניתוח מעמיק ודיוק, בניגוד למודלים 'חושבים-קצר' כמו ChatGPT. היא שואפת לתפוקות מחושבות יותר, הפחתת שגיאות וטיפול באתגרים מורכבים, במיוחד בתחומים כמו קידוד. Claude 3.7 Sonnet של Anthropic מדגים סוג חדש זה של בינה מלאכותית.
נוף הבינה המלאכותית עבר שינוי דרמטי בשנת 2024. פריצות דרך כמו מודל o1 של OpenAI, הדגישו חשיבה בזמן אמת. Nvidia, עם ארכיטקטורת Blackwell, הובילה את המירוץ. חברות כמו Google DeepMind, Anthropic, ו-DeepSeek הסינית, הציגו חידושים משמעותיים. מודלים קטנים ויעילים, ויצירת וידאו מתקדמת, גם הם היו במוקד.
השוואה מפורטת בין Claude 3.5 Sonnet ל-GPT-4o, שני מודלי AI מובילים. בחינת ביצועים, יכולות, מהירות, בטיחות ושימושים.
צ'ארלס ליאנג, מנכ'ל Super Micro, משתף פעולה עם xAI של אילון מאסק לפריסת מרכז נתונים מהירה. הפרויקט, שהושלם תוך 122 יום, מדגיש את הזריזות של Super Micro ואת השותפויות האסטרטגיות שלה בתעשיית הבינה המלאכותית.
סקירה שבועית של התפתחויות ברובוטיקה הומנואידית ולא-הומנואידית, התקדמות הבינה המלאכותית של אמזון, Anthropic ועוד. בחינת ההשלכות האתיות והיכולות המתפתחות של רובוטים, תוך התמקדות בעתיד שבו רובוטים ובני אדם חיים יחד.
מחקר בוחן שיטות לביקורת מודלי שפה, במטרה לחשוף מטרות נסתרות שעלולות להיות מנוגדות לכוונות האנושיות. ניסוי עם 'קלוד' מדגים טכניקות כמו ניתוח התנהגות, הפעלת אישיות ושימוש ב-SAEs. גישה זו חיונית לפיתוח בינה מלאכותית בטוחה.
OpenAI מציגה חזון שאפתני לעתיד הבינה המלאכותית, תוך התמקדות בגישה בלתי מוגבלת לנתונים והתאמת החקיקה העולמית לעקרונות אמריקאיים. ההצעה כוללת מדיניות בינלאומית, תשתית ורגולציה, במטרה לבסס את הובלת ארה'ב בתחום.
DeepSeek מכחישה רשמית את השמועות על השקת מודל R2 הקרוב ב-17 במרץ. החברה הבהירה כי מדובר ב'פייק ניוז', ושומרת על עמימות לגבי תאריך ההשקה והמפרט הטכני של המודל. הדיווחים הקודמים הצביעו על יכולות משופרות ביצירת קוד וחשיבה רב-לשונית.