חתירה לריבונות בינה מלאכותית: תגובת טייוואן ל-DeepSeek

בעוד שההתקדמות האחרונה של סין בתחום הבינה המלאכותית, במיוחד עם השקת DeepSeek-R1, לכדה את תשומת הלב העולמית, טייוואן מתווה נתיב שונה, כזה שנותן עדיפות לפיתוח מודלים של שפה המשקפים את הזהות התרבותית הייחודית שלה ואת הערכים הדמוקרטיים שלה. מאמץ זה נועד ליצור משקל נגד למערכות בינה מלאכותית המושפעות ממשטרים סמכותניים.

אתגר DeepSeek

חשיפת DeepSeek-R1 בינואר עוררה עניין רב בקרב קהילת הטכנולוגיה. מודלים קודמים של שפה סינית, כמו Ernie של Baidu ו-Doubao של ByteDance, הראו הבטחה ביישומי שפה סינית, מתמטיקה וקידוד, אך הוגבלו על ידי מיומנות חלשה יותר באנגלית ונגישות מוגבלת. עם זאת, DeepSeek-R1 סימן ציון דרך משמעותי כ-LLM הסיני הראשון שזכה להכרה בינלאומית.

אחד ההיבטים הבולטים ביותר של DeepSeek-R1 היה עלות הפיתוח הנמוכה שלו, כך נטען. בניגוד ל-GPT-4o של OpenAI, שלכאורה עלה יותר מ-100 מיליון דולר אמריקאי לאימון, חוקרי DeepSeek טענו שהצ’אטבוט שלהם פותח עבור 5.6 מיליון דולר אמריקאי בלבד. בנוסף לחיזוק הנרטיב של יעילות, מהנדסי DeepSeek אילפו את מודל R1 באמצעות מעבדי CPU בינוניים כמו Nvidia H800, ולא שבבים מהשורה הראשונה המשמשים במודלים כמו GPT-4o או Claude של Anthropic. למרות ההגבלות של ארה”ב על ייצוא שבבים בעלי ביצועים גבוהים לסין, DeepSeek-R1 הצליח לעלות על בוטים מובילים אחרים על ידי שימוש רק ב-2,048 מעבדים הפרוסים על פני 256 שרתים.

יעילות מדהימה זו ועלות הפיתוח הנמוכה יוחסו בעיקר לטכניקות תכנות מתוחכמות, כולל PTX, שפה דמוית אסמבלי המאפשרת למפתחים לכוונן ביצועים ולמקסם את השימוש בחומרה.

זמן קצר לאחר שחרורו, אפליקציית DeepSeek-R1 זינקה לראש דירוגי ההורדות החינמיות של חנות האפליקציות של אפל בארה”ב, ועקפה את ChatGPT, TikTok ופלטפורמות המדיה החברתית של Meta. הנאסד”ק חווה ירידה, ומניות Nvidia צנחו בעקבות הופעת הבכורה של DeepSeek-R1.

הטלת ספק בטענות DeepSeek

למרות ההתלהבות הראשונית, משקיפים רבים העלו שאלות לגבי תקפות טענות DeepSeek בנוגע ל-LLM שלה. אנליסטים העלו השערה שהנתונים המוצהרים ככל הנראה מייצגים רק עלויות חישוביות, תוך החרגה או הפחתה של הוצאות תשתית, חומרה ומשאבי אנוש.

ווסלי קואו, מייסד ומנכ”ל Ubitus, ספקית שירותי בינה מלאכותית גנרטיבית וגיימינג בענן שבסיסה בטאיפיי, חזר על חששות אלה, ואמר שהעלות בפועל היא ככל הנראה גבוהה בהרבה ממה שמדווחים. Ubitus, עם גיבוי מ-Nvidia, תמכה בפרויקט TAME, LLM מקומי המשתמש בתווים סיניים מסורתיים. הם סיפקו מעבדי H100 ונתוני גיימינג. Ubitus גם שיתפה פעולה עם Foxlink ו-Shinfox Energy כדי להקים את Ubilink.AI, ולבנות את מרכז שירותי מחשוב העל הגדול ביותר של טייוואן המופעל על ידי אנרגיה ירוקה בשיתוף עם Asus.

קואו מדגיש את מעורבות החברה בפיתוח יישומי LLM ומודלים לממשלות, כולל ממשלת יפן, על פני מגזרים כמו גיימינג, תיירות וקמעונאות, ומדגיש את הפוטנציאל של AI לטפל במחסור בעבודה והזדקנות אוכלוסיות.

חששות לגבי שלמות הנתונים

קואו מיישר קו עם OpenAI ומיקרוסופט בהצעה ש-DeepSeek אולי רכשה נתונים באמצעות זיקוק מודלים. תהליך זה כולל אימון מודלים קטנים יותר של שפה כדי לחקות את הפלטים של מודלים גדולים יותר. OpenAI ומיקרוסופט טוענות ש-DeepSeek ניצלה את ממשק תכנות האפליקציות של OpenAI כדי להקל על הפיתוח שלה.

קואו טוען ש-DeepSeek השיגה נתונים מ-OpenAI ושיש אי הבנות סביב טענות החברה לגבי יעילות. הוא מציין ש-DeepSeek-R1, עם 670 מיליארד הפרמטרים שלה, גדולה משמעותית מ-Llama 3.1 405B של Meta AI. הפרמטרים הם ערכים מספריים פנימיים שמודל לומד במהלך האימון כדי לבצע תחזיות. קואו גם מציע שאולי המודלים של DeepSeek זוקקו מ-Llama 3.1.

מעבר לתגובות נגד אלה, עלו גם חששות לגבי היכולות של DeepSeek-R1. מומחים מציעים שכמו קודמיו, R1 מצטיין בפונקציות מיוחדות וספציפיות למשימות, אך מפגר אחרי גרסאות של GPT-4o בביצועים למטרות כלליות.

מגבלה עיקרית של המודלים של DeepSeek היא ההגבלה על גישה חופשית למידע. משתמשים גילו ששאלות על נושאים פוליטיים רגישים נענו בתגובות מתחמקות. בנושאים כמו מעמדם של המיעוט האויגורי בשינג’יאנג וטייוואן, התגובות של DeepSeek משקפות את העמדות הרשמיות של המפלגה הקומוניסטית הסינית. מחקרים מצביעים על כך שחלק ניכר מהפלטים של DeepSeek מצונזרים כדי לדכא מידע הקשור לדמוקרטיה, זכויות אדם ותביעות הריבונות השנויות במחלוקת של סין.

החלופה של טייוואן: TAIDE ומעבר לכך

בתגובה, LLM שפותחו בטייוואן, כמו TAME, הופיעו כחלופות ל-DeepSeek בתוך הסינוספרה. מנוע הדיאלוג המהימן של AI (TAIDE), שהושק ביוני 2023 על ידי המכון הלאומי למחקר יישומי, נועד לפתח מודל התואם לנורמות החברתיות, התרבותיות והלשוניות של טייוואן.

בעוד שהעבודה על TAIDE נראית כאילו נעצרה, היא שימשה כאמת מידה חשובה לפרויקט TAME. TAME, שפותח על ידי המעבדה לבינה מכונה והבנה (MiuLab) באוניברסיטת טייוואן הלאומית, במימון ארגונים שונים, אומן על 500 מיליארד טוקנים. הוא עלה על המתחרים, כולל GPT-4o, על פני 39 הערכות, והשיג ציונים גבוהים יותר בבחינות כניסה לאוניברסיטה, בר ובחינות רפואה סינית מסורתית.

אחת המטרות של TAME היא לקדם את התרבות המקומית. פתיחת יכולות שפה מקומיות היא צעד משמעותי. קואו מזכיר את הפיתוח של LLM קולי טייוואני המבוסס על Whisper, שהשיג תוצאות חיוביות בהבנת טייוואנית בעל פה. מתבצעים מאמצים לפתח זיהוי שפת חאקה.

מאמצים אלה התקבלו היטב על ידי מוסדות באזורים שבהם שפות אלה נפוצות. ישנם גם מאמצים לאמן את המודל בזיהוי שפות ילידיות, אך נתונים מוגבלים נותרו מכשול. אימון AI ללמוד שפה חדשה דורש כמות משמעותית של הקלטות קוליות בשילוב עם טקסט.

גישה לנתונים היסטוריים בארכיוני הממשלה מציגה הזדמנות נוספת. עם זאת, חלק מהנתונים מוגנים בזכויות יוצרים. הופעת הבינה הכללית המלאכותית מציעה את הפוטנציאל לסייע בהחייאת שפות בסכנת הכחדה ונכחדות.

החתירה לריבונות בינה מלאכותית

הצטלבות השפה והתרבות מדגישה את החשיבות של ריבונות בינה מלאכותית כאמצעי לחיזוק הזהות הטייוואנית, העברת הנרטיב של טייוואן והגנה על סביבת המידע שלה.

ג’וליאן צ’ו, יועץ תעשייתי ומנהל במכון לייעוץ ומודיעין שוק (MIC), מדגיש את הפוטנציאל להטיה במודלים של LLM ובנתוני אימון. הוא מציין שגם בעת שימוש בתווים מסורתיים, פלטי LLM יכולים לשקף את הסגנון של הרפובליקה העממית של סין ולא לתפוס את התרבות של טייוואן. המטרה היא שחברות טייוואניות ישתמשו בשפה או בנתונים טייוואניים כדי לאמן LLM ולבנות ריבונות בינה מלאכותית.

צ’ו מזכיר את מודל הקרן פורמוסה (FFM-Llama2) כעוד LLM מבטיח בטייוואן. הוא שוחרר בספטמבר 2023 על ידי שירות האינטרנט של טייוואן, ומטרתו הייתה לדמוקרטיזציה של AI. Foxconn גם השיקה את ה-LLM שלה, FoxBrain, במרץ. עם זאת, חלק מהפרשנים נותרו סקפטיים לגבי המיזמים של תאגידים גדולים לתוך LLM.

לין ין-טינג, חברה בצוות MiuLab שפיתח את TAME, מדגישה את הצורך לטפל בפער בסביבת המידע בנוגע לטייוואן. היא מציינת ש-DeepSeek-R1 ו-LLM סיניים אחרים מציגים תמונה מעוותת של טייוואן. מודלים שפותחו בארה”ב יכולים לפעמים גם לייצג את טייוואן בצורה שגויה. מודלים בקוד פתוח עשויים שלא לתת עדיפות לטייוואן, ונתוני האימון נשלטים על ידי סין.

לכן, חשוב לשלב באופן סלקטיבי תוכן טייוואני ולאמן אותו מחדש במודל. גישה פרואקטיבית זו מבטיחה שהנוף התרבותי והלשוני הייחודי של טייוואן מיוצג במדויק בתחום הדיגיטלי, ומטפחת תחושת זהות לאומית ושומרת על מורשתה הייחודית מול התפתחות הבינה המלאכותית הגלובלית. מסירות זו לשימור הזהות הטייוואנית מבטיחה שהתרבות והערכים הייחודיים של מדינת האי לא יאפילו על ידי נרטיבים דומיננטיים.

האתגרים הטמונים במאמץ זה הם משמעותיים. בניית מודל AI מייצג באמת דורשת השקעה משמעותית של משאבים, כולל גישה למערכי נתונים עצומים של תוכן מקומי ומומחיות בעיבוד שפה טבעית. יתר על כן, הצורך המתמשך להתמודד עם דיסאינפורמציה ומידע מוטה מחייב תהליך מתמשך של עידון והתאמה.

למרות אתגרים אלה, המחויבות של טייוואן לריבונות בינה מלאכותית נותרה איתנה. הפיתוח של TAME ו-LLM מקומיים אחרים מייצג צעד מכריע לקראת הבטחת שעתיד הבינה המלאכותית ישקף את הזהות התרבותית הייחודית של האי, את הערכים הדמוקרטיים ואת המחויבות הבלתי מעורערת לשימור מקומו הייחודי בעולם. על ידי מתן עדיפות לריבונות בינה מלאכותית, טייוואן לא רק מגנה על מורשתה התרבותית, אלא גם ממצבת את עצמה כשחקנית מפתח בזירת הבינה המלאכותית העולמית, ומדגימה שהתקדמות טכנולוגית יכולה להיות מותאמת לשימור הזהות התרבותית והעקרונות הדמוקרטיים.

המשך המסע

המסע לקראת ריבונות בינה מלאכותית מוחלטת נמשך. מחקר, פיתוח ושיתוף פעולה נוספים הם חיוניים כדי להתגבר על האתגרים ולהבטיח את ההצלחה ארוכת הטווח של יוזמות אלה. על ידי המשך מתן עדיפות לריבונות בינה מלאכותית, טייוואן יכולה ליצור נוף דיגיטלי המשקף באמת את הזהות התרבותית הייחודית שלה ואת הערכים הדמוקרטיים, ולהוות דוגמה למדינות אחרות השואפות לשמור על מקומן הייחודי בעולם מקושר יותר ויותר.