העולם הטכנולוגי גועש סביב מחלוקת חדשה, כאשר חברת DeepSeek, מפתחת מודלים בולטת בתחום הבינה המלאכותית, ניצבת בפני האשמות מחודשות על שימוש בנתונים של מתחרים כדי לאמן את הדגם החדשני ביותר שלה. הפעם, הזרקור מופנה אל Gemini של גוגל, עם טענות לפיהן DeepSeek-R1-0528, מודל הבינה המלאכותית העדכני ביותר של DeepSeek, אומן באמצעות נגזרת של המודל של Gemini.
ההאשמות מגיעות מסם פייץ’, אנליסט AI אשר בחן בקפידה את שירות הבינה המלאכותית של DeepSeek באמצעות כלים ביו-אינפורמטיים מתוחכמים. הניתוח של פייץ’ הוביל אותו למסקנה כי קיימים קווי דמיון בולטים בין התגובות של DeepSeek לבין אלו של Gemini, דבר המרמז על קשר פוטנציאלי בין השניים.
עבודת הבילוש של AI: חשיפת השפעה פוטנציאלית של Gemini
החקירה של פייץ’ לא הסתפקה בתצפית פשוטה על התנהגות ה-AI. הוא העמיק באתר קהילת המפתחים של HuggingFace, פלטפורמת קוד פתוח פופולרית לפיתוח AI, והריץ את הניתוח שלו דרך חשבון קוד המפתח שלו ב-GitHub. גישה קפדנית זו אפשרה לו לבחון את הפעולה הפנימית של מודל ה-AI ולזהות דפוסים או קטעי קוד פוטנציאליים העשויים להצביע על שימוש בנתוני Gemini.
באחד הציוצים שלו, פייץ’ סיכם את ממצאיו וקבע: "אם אתם תוהים מדוע DeepSeek R1 נשמע קצת אחרת, אני חושב שהם כנראה עברו מאימון על OpenAI סינתטי לפלטים של ג’מיני סינתטיים”. הצהרה זו מצביעה על כך ש-DeepSeek עשויה הייתה לעבור משימוש בנתונים סינתטיים שנוצרו על ידי המודלים של OpenAI לשימוש בנתונים שמקורם ב- Gemini במהלך תהליך האימון.
להשלכות של מעבר כזה יש משמעות רבה. אם DeepSeek אכן השתמשה בנתונים שמקורם ב-Gemini, הדבר עלול לעורר שאלות לגבי זכויות קניין רוחני, תחרות הוגנת ושיקולים אתיים סביב פיתוח AI.
תגובת DeepSeek: יכולות וביצועים משופרים
במאי 2025, DeepSeek שחררה גרסה מעודכנת של מודל DeepSeek-R1 שלה, שכונתה DeepSeek-R1-0528, דרך HuggingFace. החברה טוענת כי מודל מעודכן זה מתהדר ביכולות היסק משופרות, מה שמצביע על הבנה מעמיקה ועיבוד מידע. DeepSeek מדגישה גם שהמודל המעודכן משתמש במשאבי מחשוב מוגברים ומשלב מנגנוני אופטימיזציה אלגוריתמיים במהלך שלאחר האימון.
לדברי DeepSeek, שיפורים אלה הובילו לביצועים מצוינים על פני מדדי הערכה שונים, כולל מתמטיקה, תכנות ולוגיקה כללית. החברה הצהירה ב-HuggingFace שביצועי המודל הכוללים מתקרבים כעת לאלה של מודלים מובילים כמו O3 ו-Gemini 2.5 Pro.
בעוד ש-DeepSeek מהללת את הביצועים והיכולות המשופרות של המודל העדכני ביותר שלה, ההאשמות על שימוש בנתוני Gemini מטילות צל על ההתקדמות הזו. אם הטענות נכונות, הדבר יעורר שאלות לגבי המידה שבה רווחי הביצועים של DeepSeek נובעים מהחידושים שלה לעומת השימוש בנתוני המתחרים.
עדות EQ-Bench: הצצה לארסנל ה-AI של גוגל
כאילו כדי להוסיף שמן למדורה, סם פייץ’ הציג צילום מסך של EQ-Bench, פלטפורמה המשמשת להערכת הביצועים של מודלי AI. צילום המסך הציג את תוצאות ההערכה של מספר מודלים לפיתוח של גוגל, כולל Gemini 2.5 Pro, Gemini 2.5 Flash ו-Gemma 3.
נוכחותם של מודלים אלה של גוגל בפלטפורמת EQ-Bench מצביעה על כך שהם נמצאים בפיתוח ובדיקה פעילים, מה שעלול לספק מקור נתונים או השראה למפתחי AI אחרים. בעוד שצילום המסך עצמו אינו מוכיח ישירות ש-DeepSeek השתמשה בנתוני Gemini, הוא כן מדגיש את הזמינות של נתונים כאלה ואת הפוטנציאל לגישה אליהם ושימוש בהם על ידי גורמים אחרים.
ספק ואישור: המים העכורים של שושלת ה-AI
בעוד שהניתוח של פייץ’ העלה שאלות רציניות לגבי שיטות האימון של DeepSeek, חשוב לציין שהראיות אינן חד משמעיות. כפי שמציין TechCrunch, הראיות לאימון על ידי Gemini אינן חזקות, אם כי מפתחים אחרים טוענים גם שמצאו עקבות של Gemini במודל של DeepSeek.
העמימות סביב הראיות מדגישה את האתגרים שבמעקב אחר שושלת של מודלים של AI וקביעה האם הם אומנו באמצעות נתוני מתחרים. האופי המורכב של אלגוריתמי AI וכמויות הנתונים העצומות המשמשות לאימון מקשים על איתור המקורות המדויקים של ההשפעה.
נושא חוזר: ההיסטוריה של DeepSeek עם OpenAI
זו לא הפעם הראשונה ש-DeepSeek ניצבה בפני האשמות על שימוש בנתוני מתחרים. בדצמבר 2024, מספר מפתחי אפליקציות הבחינו כי מודל V3 של DeepSeek מזוהה לעתים קרובות כ-ChatGPT, הצ’אטבוט הפופולרי של OpenAI. תצפית זו הובילה להאשמות ש-DeepSeek אימנו