ההתקדמות המהירה של בינה מלאכותית (AI) היא מסחררת, ומעקב אחר ההתפתחויות האחרונות דורש כמעט השקעה מלאה.
אני יודע זאת מקרוב, כי זו העבודה שלי. כדי להתנסות במודלים העדכניים ביותר ממקור ראשון, נרשמתי למצב Pro של Anthropic, מה שמאפשר לי להשתמש במודל Claude 3.7 האחרון שלהם במצב “חשיבה מורחבת”. במקביל, נרשמתי לעסקים של OpenAI כדי שאוכל לבדוק את המודלים העדכניים ביותר שלהם o3 ו-o4-mini-high (אסביר את מוסכמות השמות המבלבלות של OpenAI בהמשך!), ולהשתמש במודל יצירת התמונות החדש של OpenAI, 4o, ליצירת תמונות רבות. הביצועים המצוינים של 4o גרמו לי לבטל את המינוי שלי לכלי יצירת התמונות הקודם, Midjourney.
בנוסף, נרשמתי ל-Grok 3 של אלון מאסק, שיש לו את פונקציית ה-AI האהובה עלי. ניסיתי גם להשתמש בפלטפורמת ה-AI הסינית Manus לקניות וקביעת פגישות. המינויים האלה כמעט ריקנו את התקציב שלי, וזה לא כולל את כל ה-AI שבהם השתמשתי בצורות אחרות. רק בחודש בו כתבתי את המאמר הזה, גוגל העבירה שדרוג רחב היקף למוצר ה-AI הטוב ביותר שלה, Gemini 2.5, ומטא פרסמה את Llama 4, מודל ה-AI הגדול ביותר עד כה עם קוד פתוח.
אז מה לעשות אם מעקב אחר התפתחות הבינה המלאכותית אינו העבודה היומיומית שלך, אבל אתה עדיין רוצה לדעת באילו נסיבות השימוש באיזו בינה מלאכותית באמת ישפר את חייך, מבלי לבזבז זמן על מודלים עם ביצועים ירודים?
זו מטרת המאמר הזה. נחקור לעומק, בדומה ל”דו”ח צרכנים”, איזו בינה מלאכותית מתאימה ביותר לתרחישי יישום שונים, וכיצד להשתמש בהם בפועל, כל זאת על סמך הניסיון שלי במשימות ממשיות.
עם זאת, ראשית, יש להצהיר: Vox Media היא אחת מכמה מוציאים לאור שחתמו על הסכם שיתוף פעולה עם OpenAI, אך הדיווח שלנו תמיד נשאר עצמאי מבחינה עריכתית. המימון של Future Perfect מגיע בחלקו מקרן BEMC, שהתורם העיקרי שלה הוא גם משקיע מוקדם ב-Anthropic; הם גם לא יתערבו בעריכה של התוכן שלנו. אשתי עובדת בגוגל, אבל אין לה שום קשר למוצרי ה-AI שלהם; לכן, בדרך כלל איני מדווח על גוגל, אבל במאמר כזה, אי הכללת גוגל תהיה חסרת אחריות.
החדשות הטובות הן שהמאמר הזה לא דורש ממך לבטוח בעצמאות העריכתית שלי; אני אציג את העבודה שלי. ערכתי עשרות השוואות של כל ה-AI העיקריים בשוק, שרבות מהן תוכננו על ידי. אני ממליץ לך להשוות את התשובות שלהם ולהחליט בעצמך אם בחרתי את ה-AI הנכון להמלצה.
על האתיקה של אמנות AI
אמנות AI נוצרת על ידי אימון מחשב על תוכן אינטרנטי, תוך התעלמות כמעט מזכויות יוצרים או מכוונת היוצרים. לכן, רוב האמנים מתוסכלים מכך. במצב זה, האם השימוש באמנות AI מוצדק?
אני מאמין שבעולם צודק, OpenAI בהחלט תפצה כמה אמנים - בעולם צודק, הקונגרס יפעל כדי לקבוע את גבולות ההשאלה האמנותית. יחד עם זאת, אני משוכנע יותר ויותר שדיני זכויות היוצרים הקיימים אינם מתאימים לפתרון בעיה זו. אמנים משפיעים זה על זה, מגיבים זה לזה ושואלים זה מזה, ואנשים שיכולים להשתמש בכלי AI ימשיכו לעשות זאת.
הפילוסופיה האישית שלי מושפעת מתרבות המעריצים של ילדותי: זה בסדר לבנות על עבודות של אחרים להנאתך, אבל אם אתה אוהב את זה, אתה צריך לשלם על זה, ואסור לך למכור את זה. זה אומר שאסור להשתמש באמנות AI גנרטיבית למטרות מסחריות, אבל לשחק עם תמונות המשפחה שלך זה בסדר.
הבחירה הטובה ביותר ליצירת תמונות
מצב יצירת התמונות 4o החדש של OpenAI הוא כלי יצירת התמונות AI הטוב ביותר עד כה, ועם יתרון ברור. הוא מצטיין בקטגוריות החינמיות והבתשלום.
לפני ש-4o פורסם, נרשמתי לפלטפורמת יצירת התמונות AI Midjourney. כשמזכירים אמנות AI, אתם עשויים לחשוב על Midjourney: הוא יכול ליצור יצירות מסתוריות, בלתי נשכחות, יפהפיות מבחינה ויזואלית, ויש לו כמה כלים מצוינים לשיפור ועריכת התוצאות הסופיות שלכם, כמו שיפור השיער של מישהו, תוך שמירה על כל השאר ללא שינוי.
היתרון הגדול ביותר של 4o הוא שהוא יכול להפוך תמונה עם אפקט גרוע ליצירת אמנות יפה בצורה אמינה, תוך שמירה על המאפיינים של התמונה המקורית. אף מודל קודם לא הצליח לעשות זאת.
בתמונה למטה, אני ואשתי מחבקים את הילדה שלנו, חוגגים את יום הולדתה הראשון:
ה-AI העביר את העוגה (שכמעט מוסתרת על ידי מגבת נייר בתמונה המקורית) למוקד התמונה, תוך שמירה על תנוחת החיבוק של אשתי ושלי עם הילדה, ועל השולחן המבולגן והמקרר מלא התמונות ברקע. האפקט הסופי הוא חם, חביב ומקסים.
יכולת כזו היא שהפכה את 4o לפופולרי מאוד לאחרונה, וזה משהו שאף מחולל תמונות קודם לא הצליח לעשות.
בתמונה למטה, Midjourney התבקש לבצע העברת סגנון ולהפוך את אותה תמונה ל”סרט בסגנון פיקסאר”:
תשימו לב שזה נראה כמו משפחה שונה לחלוטין, ללא השראה אמיתית מהתמונה המקורית! בסופו של דבר תוכלו לקבל מ-Midjourney אפקט טוב יותר מזה, אבל זה ידרוש מספר שבועות כדי לשלוט בשפה ובערכת הכלים הספציפית במיוחד של הפלטפורמה, ולהיות מומחה בבקשות מורכבות.
לעומת זאת, ChatGPT, עם בקשה פשוטה, ללא צורך בשפה מקצועית, יכול לתת לי כבר בניסיון הראשון תוצאה טובה בהרבה מ-Midjourney.
אחרות בין 4o למודלי תמונה אחרים בולט בסוג כזה של בקשה, אבל הוא גם מתאים יותר כמעט לכל שאר משימות יצירת התמונות בהן השתמשתי. המוצר שאתם מקבלים הוא די טוב מחוץ לקופסה, ולא קשה ליצור עבודות טובות יותר. באופן אידיאלי, זה מה שאנחנו צריכים לקבל מכלי AI - שאנשים לא מקצועיים יוכלו ליצור דברים מדהימים בשפה פשוטה.
חולשה אחת של 4o כיום היא העריכה של חלקים קטנים בתמונה תוך שמירה על שאר החלקים ללא שינוי. אבל אפילו כך, אתם כבר לא צריכים את Midjourney - Gemini מציע כיום פונקציה זו בחינם.
אסטרטגיות הנחיה ליצירת תמונות 4o
כדי לקבל תמונות טובות מ-4o, אתם צריכים קודם כל לעקוף את המסננים האוסרים על תמונות שונות (כגון תמונות פוגעניות או פורנוגרפיות), אבל מסננים אלה נאכפים בדרך כלל על תוכן לא מזיק לחלוטין בצורה שנראית אקראית. כדי להימנע מנזיפות מדי פעם ממסנן התוכן, אל תבקשו ליצור יצירה בסגנון של אמן מסוים, אלא בקשו ליצור משהו שמזכיר את האמן הזה, ואז בקשו במפורש “המרת סגנון”. כדי להיות בטוחים, זה לא הפתרון התקף היחיד, אבל זה עובד בשבילי.
במרץ השנה, הופיע לרגע באינטרנט טרנד חם, שאנשים יכלו להשתמש ב-4o כדי ליצור מחדש תמונות משפחתיות חמודות בסגנון של אמן האנימציה היפני הייאו מיאזאקי, מסטודיו ג’יבלי. אבל הסגנון של סטודיו ג’יבלי הוא לא רק חמוד, אם רק תוסיפו קצת יותר הנחיות, תוכלו לקב א