NeuReality מעצבת מחדש את כלכלת ה-AI | he | בית

חברות וספקי שירותים פורסים יישומי AI וסוכנים בקצב שיא, ומתמקדים באספקת…

NeuReality היא חלוצה בעיצוב מחדש של ארכיטקטורות הסקת מסקנות של AI כדי לענות על הצרכים של מודלים וסביבות עבודה של היום, והודיעה כי מכשיר ההסקת מסקנות NR1 שלה מגיע כעת עם מודלים פופולריים של AI ארגוני מותקנים מראש, כולל Llama, Mistral, Qwen, Granite 1 והוא תומך בענני AI גנרטיביים פרטיים ובאשכולות מקומיים. המכשיר הגנרטיבי והמוכן לשימוש בסוכנים מופעל ופועל תוך פחות מ-30 דקות, ומספק מהירות ערך מהירה פי 3, ומאפשר ללקוחות לחדש מהר יותר. הוכחות קונספט (PoC) עדכניות מראות שהמכשיר מציג עד פי 6.5 יותר תפוקת tokens באותו תקציב עלויות והספק בהשוואה לשרתי הסקה מבוססי x86 CPU, מה שמספק לעסקים וממשלות בכל הגדלים גישה ל-AI ושימוש בו בצורה משתלמת יותר.

בתוך המכשיר, שבב NR1® הוא ה-AI-CPU האמיתי הראשון, הבנוי במיוחד לתזמור הסקת מסקנות – ניהול נתונים, משימות ושילובים – עם תוכנה, שירותים וממשקי API מובנים. הוא לא רק מאחד בין ארכיטקטורות CPU ו-NIC מסורתיות ליחידה אחת, אלא הוא גם אורז לתוך השבב עוצמת עיבוד גדולה פי 6 כדי לעמוד בקצב ההתקדמות המהירה של GPU, תוך שהוא מבטל צווארי בקבוק של CPU מסורתיים.

בשילוב עם כל GPU או מאיץ AI בתוך המכשיר, שבב NR1 מספק יעילות פורצת דרך בעלויות, באנרגיה ובנכסים, שהיא חיונית לאימוץ רחב של AI ארגוני. לדוגמה, בהשוואה לאותו מודל Llama 3.3-70B ולאותה הגדרת GPU או מאיץ AI, מכשיר ה-AI-CPU של NeuReality משיג עלות כוללת נמוכה יותר למיליון tokens של AI בהשוואה לשרת מבוסס x86 CPU.

“אף אחד לא מטיל ספק בפוטנציאל העצום של AI. האתגר הוא איך להפיכת הפריסה של הסקת מסקנות של AI לאפשרית מבחינה כלכלית”, אומר משה טנאך, מייסד שותף ומנכ”ל NeuReality. “טכנולוגיית ה-AI-CPU המפריעה של NeuReality מבטלת צווארי בקבוק, ומאפשרת לנו לספק ביצועים נוספים הנדרשים כדי לפתוח את מלוא הפונקציונליות של GPU, תוך תיאום שאילתות ו tokens של AI כדי למקסם את הביצועים וההחזר על ההשקעה של מערכות ה-AI היקרות הללו”.

טנאך המשיך: “כעת, אנו לוקחים את קלות השימוש לרמה חדשה עם מכשיר הסקת מסקנות AI משולב מסיליקון לתוכנה. הוא מגיע טעון מראש עם מודלים של AI וכל הכלים כדי לעזור למפתחי תוכנת AI לפרוס AI מהר יותר, קל יותר וזול יותר מאי פעם, ומאפשר להם להעביר משאבים ליישום AI בעסק שלהם במקום אינטגרציה ואופטימיזציה של תשתית”.

מחקר שנערך לאחרונה גילה שכ-70% מהארגונים מדווחים על שימוש ב-AI גנרטיבי לפחות בפונקציה עסקית אחת, מה שמצביע על ביקוש מוגבר. עם זאת, רק ל-25% מהארגונים יש תהליכים המופעלים במלואם על ידי AI, ואימוץ רחב היקף, ורק כשליש החלו ליישם מקרי שימוש מוגבלים של AI.

כיום, צווארי בקבוק של ביצועי CPU בשרתים שמנהלים סביבות עבודה מרובות מצבים ומודלים שפתיים גדולים הם גורם מרכזי שתורם לשיעורי ניצול GPU נמוכים עד כדי 30-40%. זה מוביל לבזבוז סיליקון יקר בפריסות AI, ולשוק שלא מקבל מספיק שירותים שעדיין מתמודד עם מכשולים של מורכבות ועלות.

ראשד עטר, סגן נשיא בכיר להנדסה ב-Qualcomm Technologies, Inc., אמר: “חברות וספקי שירותים פורסים יישומי AI וסוכנים בקצב שיא, ומתמקדים באספקת ביצועים בצורה חסכונית. על ידי שילוב מאיצי ה-Qualcomm Cloud AI 100 Ultra עם ארכיטקטורת ה-AI-CPU של NeuReality, משתמשים יכולים להשיג רמות חדשות של יעילות עלות וביצועי AI מבלי להתפשר על קלות הפריסה והמדרגיות”.

מכשירי NR1 של NeuReality נפרסו עם לקוחות שירותי ענן ושירותים פיננסיים, ותוכננו במיוחד כדי להאיץ את אימוץ ה-AI באמצעות יעילות העלות, הנגישות ויעילות החלל שלהם, עבור אפשרויות הסקה מקומיות ושירות כענן. בנוסף למודלים החדשים של AI גנרטיבי וסוכנים הטעונים מראש, ומהדורות חדשות מדי רבעון, הוא גם מותאם במלואו עם ערכות כלים וממשקי API מוגדרים מראש לפיתוח תוכנה, לראייה ממוחשבת, ל-AI שיחתי או לתמיכה בבקשות מותאמות אישית עבור מגוון מקרי שימוש עסקיים ושווקים (לדוגמה, שירותים פיננסיים, מדעי החיים, ממשלה, ספקי שירותי ענן).

מכשיר NR1 הראשון מאחד בין מודול NR1® (כרטיס PCIe) עם מאיץ Qualcomm® Cloud AI 100 Ultra.

NeuReality תציג ב-InnoVEX (בשילוב עם Computex) שיתקיים בטאיפיי, טייוואן בין ה-20 ל-23 במאי 2025 בביתן הישראלי, אולם 2, דוכן S0912 (ליד הבמה המרכזית). החברה תקיים הדגמות חיות של מכשיר הסקת המסקנות NR1, כולל העברת יישום צ’אט תוך דקות, והדגמות ביצועים של שבב NR1 המריץ את Smooth Factory Models ו-DeepSeek-R1-Distill-Llama-8B.

NeuReality, שנוסדה בשנת 2019, היא חלוצה בארכיטקטורת הסקת מסקנות AI ייעודית המופעלת על ידי שבב NR1® – ה-AI-CPU הראשון לתזמור הסקת מסקנות. בהתבסס על ארכיטקטורה פתוחה ומבוססת סטנדרטים, NR1 תואם לחלוטין לכל מאיץ AI. המשימה של NeuReality היא להפוך את ה-AI לנגיש ואוניברסלי על ידי הפחתת המכשולים הקשורים לעלויות גבוהות, צריכת חשמל ומורכבות, וניצול הטכנולוגיה המפריעה שלה כדי להרחיב את אימוץ הסקת המסקנות של AI. לחברה יש 80 עובדים במתקנים בישראל, פולין וארה”ב.

מודלים של 1 AI שנטענו מראש ועברו אופטימיזציה עבור לקוחות ארגוניים כוללים: Llama 3.3 70B, Llama 3.1 8B (סדרת Llama 4 תגיע בקרוב); Mistral 7B, Mistral 8x7B ו-Mistral Small; Qwen 2.5, כולל Coder (Qwen 3 יגיע בקרוב); DeepSeek R1**-**Distill-Llama 8B, R1 Distill-Llama 70b; וכן Granite 3, 3.1 8B (Granite 3.3 יגיע בקרוב).

מהפכת ה-AI של NeuReality: שילוב של ביצועים, יעילות עלות וקלות שימוש

ככל שבינה מלאכותית (AI) ממשיכה לחלחל לתעשיות שונות, חברות מתמודדות עם האתגר של פריסת פתרונות הסקת מסקנות של AI בצורה בת קיימא מבחינה כלכלית ויעילה. NeuReality משבשת את כלכלת ה-AI באמצעות גישה חדשנית המתמקדת באספקת גישה מיידית ומוכנה לשימוש ל-LLM (מודלים שפתיים גדולים), תוך הפחתת משמעותית של העלות הכוללת של הסקת מסקנות של AI. מכשיר הסקת המסקנות NR1, מוצר הדגל של NeuReality, מספק לעסקים ביצועים, יעילות עלות וקלות שימוש חסרי תקדים על ידי אופטימיזציה של ארכיטקטורת הסקת המסקנות של AI וטעינה מראש של מודלים פופולריים של AI ארגוני.

מכשיר הסקת המסקנות NR1: משנה משחק

בלב מכשיר הסקת המסקנות NR1 נמצא ה-AI-CPU הייעודי של NeuReality, המשמש כמרכז שליטה מרכזי לנתונים, למשימות ולשילובים. בניגוד לארכיטקטורות CPU ו-NIC מסורתיות, שבב NR1 משלב רכיבים אלה ליחידה אחת, ובכך מצמצם צווארי בקבוק וממקסם את יכולת העיבוד. גישה משולבת זו מאפשרת לשבב לעמוד בקצב ההתקדמות המהירה של GPU תוך אופטימיזציה של שאילתות ו tokens של AI לשיפור הביצועים וההחזר על ההשקעה.

AI מוכן לשימוש: ייעול פריסה

כדי לשפר עוד יותר את קלות השימוש, מכשיר הסקת המסקנות NR1 מגיע טעון מראש עם מודלים פופולריים של AI ארגוני, כולל Llama, Mistral, Qwen ו-Granite. תכונה זו מבטלת the מורכבות של תצורה ואופטימיזציה, ומאפשרת למפתחי תוכנת AI להתמקד ביישום AI בעסק שלהם במקום להשקיע זמן באינטגרציה של תשתית. ניתן להפעיל ולהריץ את המכשיר תוך פחות מ-30 דקות, מה שמספק ללקוחות ערך מהיר.

AI במחיר סביר: האצת האימוץ

הטכנולוגיה של NeuReality מאפשרת לעסקים לגשת ל-AI ולהשתמש בו בצורה משתלמת יותר על ידי אספקת עלות כוללת נמוכה יותר למיליון tokens של AI בהשוואה לשרתים מבוססי x86 CPU. יעילות עלות זו חיונית לעסקים וממשלות בכל הגדלים, מכיוון שהיא מפחיתה את the חסמים לפריסת AI ומאפשרת יישומים רחבים יותר.

שותפות עם Qualcomm Technologies: פתיחת רמות ביצועים חדשות

שותפות אסטרטגית בין NeuReality ל-Qualcomm Technologies משפרת עוד יותר את היכולות של מכשיר הסקת המסקנות NR1. על ידי שילוב מאיצי ה-Qualcomm Cloud AI 100 Ultra עם ארכיטקטורת ה-AI-CPU של NeuReality, משתמשים יכולים להשיג רמות חדשות של יעילות עלות וביצועי AI מבלי להתפשר על קלות הפריסה והמדרגיות. גישה שיתופית זו מדגימה את המחויבות של NeuReality למינוף טכנולוגיות מתקדמות כדי לייעל פתרונות הסקת מסקנות של AI.

מענה לאתגרי AI ארגוניים: שיפור ניצול ה-GPU

NeuReality נותנת מענה לאתגר משמעותי שאתו מתמודדים עסקים: צווארי בקבוק של ביצועי CPU בשרתים המפחיתים את ניצול ה-GPU. באופן מסורתי, לשרתים שמנהלים סביבות עבודה מרובות מצבים ומודלים שפתיים גדולים יש שיעור ניצול GPU ממוצע נמוך עד כדי 30-40%. שיעור ניצול נמוך זה מוביל לבזבוז סיליקון יקר בפריסות AI ומגביל את אימוץ ה-AI בשווקים שלא מקבלים מספיק שירותים. טכנולוגיית ה-AI-CPU של NeuReality פותרת זאת על ידי ביטול צווארי בקבוק בביצועים, כך שחברות תוכלנה the למנף במלואו את היכולות של GPUs שלהן ביישומי AI.

מענה על הביקוש ל-AI יוצר: הגדלת השימוש

הפתרון של NeuReality תואם היטב לאחזקות השוק הצומחות במהירות של AI גנרטיבי. מחקר שנערך לאחרונה מגלה כי כ-70% מהארגונים מדווחים על שימוש ב-AI גנרטיבי לפחות בפונקציה עסקית אחת. עם זאת, רק ל-25% מהארגונים יש תהליכים המופעלים במלואם על ידי AI, ואימוץ רחב היקף. מכשיר הסקת המסקנות NR1 של NeuReality מאפשר לעסקים להאיץ את יוזמות ה-AI הגנרטיביות שלהם על ידי ביטול חסמי אימוץ באמצעות שיפור קלות השימוש, יעילות העלות והביצועים.

ידידותיות למשתמש: הורדת חסמי פריסה

בנוסף לביצועים ויעילות העלות, ידידותיות למשתמש היא גם כוח מניע מרכזי בפתרונות ה-AI של NeuReality. מכשיר הסקת המסקנות NR1 מגיע כשהוא כולל מודלים וערכות כלי SDK מותקנים מראש של AI, לייעול תהליכי פריסה, והפחתת the דרישות לאינטגרציה ואופטימיזציה של תשתית, הופכת אותו ליותר קל משל המקבילים לו. ידידותיות למשתמש זו מאפשרת למפתחי תוכנות AI להתמקד בבנייה ופריסה של יישומי AI חדשניים, במקום לבזבז את זמנם על טיפול בתשתיות מורכבות.

יישומים נרחבים: תעשיות מרובות

מכשיר הסקת המסקנות NR1 של NeuReality מתוכנן לתמוך במגוון רחב של מקרי שימוש עסקיים ושווקים. המכשיר מותאם עם ערכות כלי SDK מוגדרות מראש, ו-API לראייה ממוחשבת, AI שיחתי ובקשות מותאמות אישית. רב-גוניות זו הופכת את מכשיר הסקת המסקנות NR1 למתאים למגוון תעשיות, כולל שירותים פיננסיים, מדעי החיים, ממשלה וספקי שירותי ענן.

האצת אימוץ AI: השתלמות, נגישות ויעילות חלל

מכשירי NR1 של NeuReality מקדמים אימוץ AI על ידי אספקת השתלמות ונגישות בו זמנית, מה שהופך אותו למתאים לתשתיות מקומיות וענן. ארגונים רבים נאבקים להרחיב את יוזמות ה-AI שלהם בגלל עלויות מורכבות גבוהות, אך הפתרון של NeuReality נותן מענה לכך על ידי אספקת פלטפורמה חסכונית ויעילה בהדבקות לטכנולוגיות גלובליות פתוחות שמאפשרת גמישות פשוטה בפיתוח ובפריסת AI.

נקודות עיקריות בהדגמה

NeuReality יציגו את מנוע ההסק ה-NR1 שלהם ב-InnoVEX ב-Computex טייוואן בין ה-20 ל-23 במאי 2025 כדי להדגים את היכולות שלהם. באירוע, החברה תדגים איזה קל להעביר ליישומי צ’אטים תוך דקות, The NR1 המריץ את Smooth Factory Models ו-DeepSeek-R1-Distill-Llama-8B.

חידושים שוטפים: היערכות לעתיד

NeuReality ייעודיים לשיפור היכולות של מכשיר הסקת המסקנות NR1 שלהם על ידי הנפקת מודלי גנרטיביות חדשים של AI, וחידושים שוטפים באבזרי כלי הפיתוח של המוצרים. חידוש שוטף זה מאפשר לעסקים להתעדכן בטכנולוגיות ה-AI העדכניות ביותר, ויבטיח שהתשתית של AI שלהם תמשיך להיתמקד לעולמות העבודה שקייימים היום, ושיהיו עתידיים.

NeuReality: מאפשר לעסקים להשתלט על פוטנציאל ה-AI

טכנולוגיית ה-AI-CPU המשבשת של NeuReality מספקת דרך חסכונית לפרוס פרישות AI הסקת מסקנות, וממקסמת את ביצועי ה-GPU, תוך אופטימיזציה של שאילתות ו tokens של AI כדי להשיג ביצועים והחזר על השקעה מרביים. כאשר NeuReality ממשיכים לחדש ולהרחיב את היכולות של מכשיר הסקת המסקנות NR1 שלהם, הם יהיו בני ברית מרכזיים עבור עסקים המתרחבים להגדיל פריון בעולמם ושל הסובבים אותם.

על ידי שילוב מיקוד בביצועים, יעילות עלויות וידידותיות עם מחויבות לחידושים שוטפים, NeuReality ממוקמים מחדש את כלכלת ה-AI, ויגרום להשתלטות כל גודל של חברות להשתמש בפוטנציאל ה-AI.

עודכן ב- 2025-05-16

# AI # LLM # Agent