मेटाचे "मल्टीमॉडल" लामा मॉडेल्स!

मेटाने (Meta) आपल्या ‘लामा’ (Llama) कृत्रिम बुद्धिमत्ता (AI) मॉडेलची (Model) नवीनतम आवृत्ती (Latest version) सादर केली आहे. या कंपनीने एआय (AI) नवकल्पनांसाठी (Innovation) मोठी बांधिलकी दर्शविली आहे. ‘लामा ४ स्काउट’ (Llama 4 Scout) आणि ‘लामा ४ मॅव्हरिक’ (Llama 4 Maverick) हे नवीन मॉडेल्स आहेत. मेटाने याला “मल्टीमॉडल मॉडेल्स” (Multimodal models) असे नाव दिले आहे. हे मॉडेल केवळ टेक्स्टच (Text) नाही, तर विविध प्रकारच्या मीडियाशी (Media) संवाद साधण्याची क्षमता ठेवतात.

याव्यतिरिक्त, मेटाने ‘लामा ४ बेहेमोथ’ (Llama 4 Behemoth) सादर केले आहे. हे जगातील सर्वात बुद्धिमान एलएलएमपैकी (LLM) एक आहे. हे नवीन मॉडेल्ससाठी शिक्षक म्हणून काम करेल.

मेटाने मागील दोन वर्षांपासून एआयमध्ये (AI) मोठी गुंतवणूक (Investment) केली आहे. सीईओ (CEO) मार्क झुकरबर्गने (Mark Zuckerberg) २०२५ पर्यंत कंपनीची एआय (AI) क्षमता वाढवण्यासाठी ६५ अब्ज डॉलर्स खर्च करण्याची घोषणा केली आहे. मेटाची (Meta) महत्वाकांक्षा (Ambition) केवळ सोशल मीडियापर्यंत (Social media) मर्यादित नाही. ‘मेटा एआय’ (Meta AI) सहाय्यकासाठी (Assistant) प्रीमियम सबस्क्रिप्शनची (Premium subscription) शक्यता शोधत आहे. याद्वारे आरक्षणे (Reservations) करणे आणि व्हिडिओ तयार करणे (Video creation) यांसारखी कार्ये करता येतील.

OpenAI चा ओपन-सोर्स प्रयत्न (Open-Source Endeavor)

समानांतर घडामोडींमध्ये, OpenAI आपल्या एलएलएमचे (LLM) ओपन-सोर्स व्हर्जन (Open-source version) Relese करण्याचा विचार करत आहे. यापूर्वी त्यांनी केलेल्या पद्धतींपेक्षा हे वेगळे आहे. यामुळे वापरकर्त्यांना (Users) लायसन्स शुल्क (License fee) न भरता मॉडेल वापरण्याची, सुधारण्याची आणि वितरित करण्याची मुभा मिळेल. OpenAI डेव्हलपर (Developer), संशोधक (Researcher) आणि सामान्य लोकांकडून मॉडेलच्या उपयुक्ततेसाठी (Utility) समुदायाचा (Community) सल्ला (Input) घेत आहे.

ओपन-सोर्स मॉडेल (Open-source model) काही महिन्यांत Relese होण्याची शक्यता आहे. OpenAI ने यापूर्वी २०१९ मध्ये ‘जीपीटी-२ एलएलएम’ (GPT-2 LLM) ओपन-सोर्स (Open-source) तत्वांचा अवलंब केला होता. त्यांचे सर्वात नवीन एलएलएम ‘जीपीटी-४.५’ (GPT-4.5) आहे. मायक्रोसॉफ्टकडून (Microsoft) एक अब्ज डॉलर्सची (Billion-dollar) गुंतवणूक (Investment) मिळाल्यानंतर OpenAI ने मालकी हक्काच्या मॉडेलकडे (Proprietary models) लक्ष केंद्रित केले. एआय मॉडेल (AI model) विकसित करण्यासाठी त्यांनी एक मजबूत युती (Alliance) केली. मायक्रोसॉफ्टने (Microsoft) OpenAI मध्ये १३ अब्ज डॉलर्सपेक्षा जास्त गुंतवणूक केली आहे. OpenAI चे मॉडेल (Model) केवळ मायक्रोसॉफ्टच्या (Microsoft) Azure क्लाउड सर्व्हिसेसच्या (Cloud services) ग्राहकांसाठी उपलब्ध आहेत.

मेटाचे लामा (Llama), मिस्ट्रलचे एलएलएम (Mistral’s LLM) आणि डीपसीक (DeepSeek) हे काही ओपन-सोर्स मॉडेल्स (Open-source models) आहेत, ज्यांनी अलीकडेच लोकप्रियता मिळवली आहे. झुकरबर्गने थ्रेड्सवर (Threads) नमूद केले की लामा (Llama) १ अब्ज वेळा डाउनलोड (Download) झाला आहे. लामा (Llama) २०२३ मध्ये लाँच (Launch) झाला होता.

मेटाच्या “बेहेमोथ” एआय मॉडेलला विलंब (Meta’s "Behemoth" AI Model Faces Delays)

मेटाने (Meta) “बेहेमोथ” (Behemoth) Relese करण्याची तारीख पुढे ढकलली आहे. हे मॉडेल उन्हाळ्यात Relese होणार होते, पण आता ते शरद ऋतूपर्यंत Relese होण्याची शक्यता आहे. सूत्रांनी दिलेल्या माहितीनुसार, मॉडेलची प्रगती (Progress) जूनमध्ये Relese करण्यासाठी पुरेशी नाही. मेटाच्या डेव्हलपर कॉन्फरन्समध्ये (Developer conference) याबद्दल माहिती देण्यात आली होती.

या विलंबामुळे मेटाच्या (Meta) मोठ्या भाषेच्या मॉडेलच्या ‘लामा’ (Llama) कुटुंबाच्या Releseवर परिणाम (Impact) होऊ शकतो. वॉल स्ट्रीट जर्नलने (Wall Street Journal) सांगितले की, ‘लामा’च्या (Llama) Releseच्या वेगासाठी त्याची प्रशंसा (Praise) करण्यात आली आहे. लहान कंपन्या, ना-नफा संस्था (Non-profit organizations) आणि शैक्षणिक संस्थांमधील (Academic institutions) डेव्हलपर्सना (Developers) सक्षम (Empowering) बनवण्यासाठी ‘लामा’ (Llama) महत्त्वाचे ठरले आहे. OpenAI, Google आणि Amazon सारख्या कंपन्यांनी देऊ केलेल्या बंद, मालकीच्या मॉडेल्सला (Proprietary models) हा एक चांगला पर्याय (Alternative) आहे.

‘बेहेमोथ’ला (Behemoth) झालेल्या विलंबाचा मोठ्या कंपन्यांवर कमी परिणाम होईल, कारण त्या क्लाउड-आधारित (Cloud-based) मालकीच्या मॉडेल्सवर (Proprietary models) अवलंबून असतात. लहान कंपन्या ओपन-सोर्स ‘लामा’ (Open-source Llama) मॉडेल कस्टमाइज (Customize) करू शकतात, पण त्यांना मेटाकडून (Meta) कोणतीही अतिरिक्त (Additional)Deployment सर्व्हिस (Service) मिळत नाही. मेटा (Meta) ‘लामा’चा (Llama) उपयोग (Use) सोशल मीडिया टूल्स (Social media tools) सुधारण्यासाठी करते, ज्यामुळे झुकरबर्गला (Zuckerberg) त्याच्या एआयच्या (AI) विकासावर नियंत्रण (Control) ठेवता येईल.

मॉडेलमध्ये (Model) पुरेसे मोठे बदल (Improvements) आहेत की नाही, हे सार्वजनिक (Public) Releseसाठी महत्त्वाचे आहे.

नवोपक्रमासाठी अनिवार्यता (The Imperative for Innovation)

तंत्रज्ञान (Technology) उद्योगात (Industry) जलदगतीने (Fast-paced) होणारे बदल (Changes) पाहता, नवीन Releseमध्ये सुधारणा (Advancements) करणे आवश्यक आहे. ‘लामाकॉन’मध्ये (LlamaCon) मेटाने (Meta) ‘लामा ४’ (Llama 4) चे दोन लहान मॉडेल्स (Small models) सादर केले, ज्यात प्रभावी (Impressive) क्षमता (Capabilities) आहेत:

  • ‘मॅव्हरिक’मध्ये (Maverick) ४०० अब्ज (Billion) पॅरामीटर्स (Parameters) आणि १० लाख (Million) टोकन (Token) Context विंडो (Window) (७,५०,००० words) आहेत.
  • ‘स्काउट’मध्ये (Scout) १०९ अब्ज (Billion) पॅरामीटर्स (Parameters) आणि १ कोटी (Million) टोकन (Token) Context विंडो (Window) (७.५ Million words) आहेत.

‘बेहेमोथ’ (Behemoth) सुरुवातीला एकाच वेळी Relese होणार होते, त्यात २ ट्रिलियन (Trillion) पॅरामीटर्स (Parameters) होते.

वॉल स्ट्रीट जर्नलनुसार (Wall Street Journal), मेटा (Meta) आपल्या ‘लामा ४’ (Llama 4) टीमवर (Team) नाराज (Impatient) आहे, कारण कंपनीने एआयमध्ये (AI) सतत गुंतवणूक (Investments) केली आहे. २०२४ मध्ये, कंपनीने भांडवली खर्चात (Capital expenditures) $७२ अब्ज (Billion) पर्यंतची वाढ केली आहे, ज्याचा बहुतेक भाग एआय (AI) विकासाकडे (Development) वळवला आहे.

वाढत्या चिंता (Growing Concerns)

झुकरबर्ग (Zuckerberg) आणि इतर वरिष्ठ (Senior) अधिकाऱ्यांनी (Executives) ‘बेहेमोथ’च्या (Behemoth) Releseची निश्चित (Definitive) तारीख (Date) जाहीर (Announce) केलेली नाही. ‘मेटा’ने (Meta) केलेल्या सार्वजनिक (Public) विधानांमुळे (Statements) त्याची कामगिरी (Performance) अपेक्षेप्रमाणे (Expectations) नसेल, अशी भीती (Fear) व्यक्त (Express) केली जात आहे.

सूत्रांनी दिलेल्या माहितीनुसार, ‘लामा ४’ (Llama 4) मॉडेल (Model) विकसित (Developed) करणाऱ्या टीमने (Team) केलेल्या प्रगतीवर (Progress) ‘मेटा’च्या (Meta) नेतृत्वामध्ये (Leadership) असंतोष (Dissatisfaction) वाढत आहे. त्यामुळे एआय (AI) प्रोडक्ट (Product) ग्रुपमध्ये (Group) नेतृत्वामध्ये (Leadership) बदल (Changes) होण्याची शक्यता (Possible) आहे.

‘मेटा’ने (Meta) ‘बेहेमोथ’ला (Behemoth) एक अत्यंत (Highly) सक्षम (Capable) प्रणाली (System) म्हणून सादर (Touted) केले आहे, जी OpenAI, Google आणि Anthropic सारख्या प्रतिस्पर्धकांना (Competitors) विशिष्ट (Specific) बेंचमार्कवर (Benchmarks) मागे टाकते. त्याच्या विकासाशी (Development) परिचित (Familiar) असलेल्या लोकांच्या (People) दाव्यानुसार, अंतर्गत (Internal) आव्हानांमुळे (Challenges) त्याची कार्यक्षमता (Efficiency) कमी झाली आहे.

OpenAI ला देखील विलंबाचा (Delays) सामना (Encountered) करावा लागला आहे. त्यांचे पुढील मोठे मॉडेल (Major model) ‘GPT-5’ हे मूलत: (Originally) २०२४ च्या मध्यात Relese होणार होते. वॉल स्ट्रीट जर्नलने (Wall Street Journal) डिसेंबरमध्ये (December) कळवले (Reported) की, विकास (Development) नियोजित वेळेपेक्षा (Schedule) मागे पडला आहे.

फेब्रुवारीमध्ये (February), OpenAI चे CEO सॅम ऑल्टमन (Sam Altman) म्हणाले की, ‘GPT-4.5’ हे अंतरिम मॉडेल (Interim model) असेल, तर ‘GPT-5’ लाँच (Launch) होण्यासाठी आणखी काही महिने लागतील.

थांबलेल्या प्रगतीची संभाव्य कारणे (Possible Causes for Stalled Progress)

एआय (AI) मॉडेलच्या (Model) विकासातील (Development) मंदीला (Slowdown) अनेक घटक (Factors) कारणीभूत (Contribute) असू शकतात, ज्यात खालील गोष्टींचा समावेश (Include) आहे:

कमी होत जाणारा उच्च-गुणवत्तेचा डेटा (Diminishing High-Quality Data)

मोठ्या भाषेच्या मॉडेल्सना (Large language models) प्रशिक्षणासाठी (Training) मोठ्या प्रमाणात (Massive amounts) डेटाची (Data) आवश्यकता (Require) असते, जसे इंटरनेटचा (Internet) मोठा विस्तार (Expanse). सार्वजनिकरित्या (Publicly) उपलब्ध (Available) डेटा स्रोत (Source) कमी होत आहेत आणि कॉपीराइट-संबंधित (Copyright-related) कायदेशीर (Legal) दायित्वांचा (Liabilities) सामना (Facing) करावा लागत आहे.

त्यामुळे OpenAI, Google आणि Microsoft ने कॉपीराइट केलेल्या (Copyrighted) सामग्रीवर (Material) प्रशिक्षण (Train) देण्याचा अधिकार (Right) जपण्याची वकिली (Advocate) केली आहे.

OpenAI ने नमूद (Mentioned) केले की, सरकार (Government) अमेरिकन लोकांचे (Americans) एआय (AI) कडून शिकण्याचे स्वातंत्र्य (Freedom) सुरक्षित (Secure) करू शकते आणि अमेरिकन एआय (American AI) मॉडेल्समध्ये (Models) कॉपीराइट केलेल्या (Copyrighted) सामग्रीमधून (Material) शिकण्याची क्षमता (Ability) टिकवून (Preserving) ठेवून पीआरसी [People’s Republic of China] कडे एआयचे (AI) नेतृत्व (Lead) जाणे टाळू शकते.

अल्गोरिदममधील अडचणी (Algorithmic Hurdles)

मॉडेलचा (Model) आकार (Size) वाढवणे, जास्त (More) Compute वापरणे आणि अधिक (More) डेटावर (Data) प्रशिक्षण (Training) देणे हे मोठे बदल (Advances) घडवून आणू शकतात, हा समज (Belief) खोटा (Proven wrong) ठरला आहे. ब्लूमबर्गने (Bloomberg) म्हटले आहे की, घटते (Diminishing) रिटर्न्समुळे (Returns) स्केलिंग कायदे (Scaling laws) मंदावत (Slowing down) आहेत, असे काही लोकांचे म्हणणे (Saying) आहे.