२०२५ मधील AI कंपन्या

2. Nvidia

कृत्रिम बुद्धिमत्ता (AI) प्रणाली अधिकाधिक प्रगत होत असल्यामुळे, मोठ्या भाषा मॉडेल (large language model) डेव्हलपर्सकडून मोठ्या प्रमाणात गुंतवणूक होत आहे. Nvidia कंपनी या AI क्रांतीचा फायदा घेत आहे. AI शर्यतीला गती देणाऱ्या ग्राफिक्स प्रोसेसिंग युनिट्स (GPUs) मुळे Nvidia आता मानवी बुद्धिमत्तेच्या पातळीवर पोहोचण्यासाठी प्रयत्न करत आहे. यासाठी कंपनीने ‘ब्लॅकवेल प्रोसेसर’ आणि ‘प्लॅटफॉर्म’ तयार केले आहे.

ब्लॅकवेल हे H100 पेक्षा अधिक शक्तिशाली आहे. ते मॉडेल-ट्रेनिंगसाठी 2.5 पट जास्त शक्ती देते आणि कमी ऊर्जा वापरते. Google, Meta, Microsoft, OpenAI, Tesla, आणि xAI यांसारख्या मोठ्या डेटा सेंटर आणि AI लॅबने हजारो ब्लॅकवेल GPUs खरेदी करण्याची तयारी दर्शवली आहे.

DeepSeek आणि Alibaba यांसारख्या चिनी कंपन्यांनी जुन्या Nvidia GPUs वापरून चांगली कामगिरी केली आहे. पण Nvidia ने विविध क्षेत्रांसाठी प्लॅटफॉर्म विकसित करत आहे, जसे की औषध संशोधन (Clara for Biopharma), स्वयंचलित वाहने (Drive AGX), व्हिडिओ निर्मिती (Holoscan) आणि डिजिटल ट्विन्स (Omniverse). Nvidia भविष्यात कमी कम्प्युटिंग पॉवरवर चालणाऱ्या मॉडेल्ससाठी तयार राहत आहे, ज्यामुळे त्यांची वाढती मागणी कायम राहील.

3. OpenAI

2019 पासून, OpenAI ने आपल्या मॉडेल्सना अधिक डेटा आणि कम्प्युटिंग संसाधने देऊन सुधारले आहे. हि पद्धत उद्योगात मोठ्या प्रमाणावर वापरली गेली. पण, या स्केलिंग दृष्टिकोनाचा प्रभाव कमी होऊ लागल्यावर, OpenAI ने AGI (Artificial General Intelligence) साध्य करण्यासाठी एक नवीन मार्ग शोधला - अशी मॉडेल्स जी बहुतेक कामांमध्ये मानवी बुद्धिमत्तेला मागे टाकतील.

OpenAI ने o1 मॉडेल सादर केले. प्रीट्रेनिंग दरम्यान संसाधने वाढवण्यावर लक्ष केंद्रित करण्याऐवजी, OpenAI ने o1 ला इंफेरेंस (inference) दरम्यान अधिक वेळ आणि कम्प्युटिंग पॉवर वापरण्यासाठी तयार केले. इंफेरेंस म्हणजे मॉडेल सक्रियपणे वापरकर्त्याच्या प्रश्नांना उत्तरे देत असते. या प्रक्रियेदरम्यान, o1 वापरकर्त्याकडून आणि संबंधित डेटा स्रोतांकडून माहिती गोळा करते आणि संदर्भानुसार माहिती साठवते. उत्तराचा योग्य मार्ग निश्चित करण्यासाठी ते ‘ट्रायल-अँड-एरर’ पद्धत वापरते. यामुळे o1 ला अवघड प्रश्नांची PhD-पातळीची उत्तरे तयार करता येतात, ज्यामुळे ते कार्यप्रदर्शन बेंचमार्क क्रमवारीत अव्वल स्थानावर पोहोचले.

OpenAI ‘ChatGPT Plus’ सदस्यांना o1 ची ‘एक्सपेरिमेंटल’ आणि ‘मिनी’ आवृत्ती ऑफर करते. तसेच, ‘ChatGPT Pro’ नावाची प्रीमियम सेवा $200 प्रति महिना दराने o1 मॉडेलमध्ये अमर्यादित प्रवेश देते. डिसेंबर 2024 मध्ये, OpenAI ने o1 चे उत्तराधिकारी, o3 लाँच केले आणि फेब्रुवारी 2025 मध्ये, सशुल्क वापरकर्त्यांना o3-मिनीमध्ये प्रवेश दिला. o3-मिनी हे विज्ञान, गणित आणि कोडिंगसाठी ऑप्टिमाइझ केलेले लहान आणि वेगवान मॉडेल आहे. OpenAI च्या नवीन रिझनिंग मॉडेल्सचा सर्वात मोठा परिणाम म्हणजे AGI च्या दिशेने प्रगती करण्यासाठी इंफेरेंसच्या वेळी कम्प्युटिंग वाढवणे हा एक चांगला मार्ग आहे.

4. Google DeepMind

आजच्या चॅटबॉट्सचा पाया Google मध्ये 2010 च्या दशकात घातला गेला. ChatGPT च्या आधीच Google ने एक मोठे लँग्वेज मॉडेल-चालित चॅटबॉट विकसित केले होते. पण, सुरक्षितता, गोपनीयता आणि कायदेशीर समस्यांमुळे ते सार्वजनिकरित्या लाँच करण्यास उशीर झाला. यामुळे ChatGPT च्या लाँचनंतर सुरू झालेल्या AI शर्यतीत Google सुरुवातीला मागे पडले.

2024 मध्ये Google DeepMind च्या Gemini 2.0 च्या रिलीझने Google चे पुनरागमन झाले. Gemini 2.0 हे पहिले मास-मार्केट AI मॉडेल आहे जे मुळात मल्टीमॉडल आहे. हे प्रतिमा, व्हिडिओ, ऑडिओ आणि संगणक कोड मजकुराप्रमाणेच प्रक्रिया करू शकते आणि तयार करू शकते. यामुळे मॉडेल व्हिडिओ क्लिप्स किंवा फोन कॅमेरामधून थेट व्हिडिओ फीडचे विश्लेषण करू शकते.

Gemini ची आणखी एक खास गोष्ट म्हणजे ते Google च्या इतर सेवा, जसे की Maps आणि Search नियंत्रित करू शकते. हे Google च्या AI संशोधनाला माहिती आणि उत्पादकता साधनांसह एकत्रित करते. Gemini हे पहिले AI मॉडेल आहे जे वापरकर्त्यासाठी स्वतंत्रपणे काम करू शकते आणि जटिल समस्यांवर विचार करू शकते. Gemini 2.0 Flash Thinking Experimental मॉडेल वापरकर्त्यांना उत्तर कसे मिळवले याचा विचार करण्याची प्रक्रिया देखील दर्शवते. डिसेंबरमध्ये, Google ने ‘प्रोजेक्ट मेरिनर’ सादर केले, जे Gemini-आधारित एजंटिक AI वैशिष्ट्य आहे. हे ऑनलाइन किराणा खरेदीसारखी कामे स्वतंत्रपणे करते.

5. Anthropic

जनरेटिव्ह AI चा प्राथमिक वापर मुख्यतः मजकूर लेखन, सारांश आणि प्रतिमा निर्मितीसाठी केला जातो. पुढील टप्पा म्हणजे मोठ्या भाषा मॉडेल्सना (large language models) तर्क क्षमता आणि साधने वापरण्याची क्षमता देणे. Anthropic च्या ‘कॉम्प्युटर यूज’ मॉडेलने याची झलक दिली.

2024 मध्ये Claude 3.5 Sonnet पासून, Anthropic चे मॉडेल इंटरनेटवरील माहितीसह स्क्रीनवरील क्रियाकलाप पाहू शकते. ते कर्सर हलवू शकते, बटणे क्लिक करू शकते आणि मजकूर इनपुट करू शकते. एका डेमो व्हिडिओमध्ये, Claude ने ब्राउझर टॅबमध्ये उघडलेल्या वेबसाइटवरील माहिती वापरून एक फॉर्म पूर्ण केला. ते वैयक्तिक वेबसाइट तयार करणे किंवा दिवसाच्या सहलीचे नियोजन करणे यासारखी कामे करू शकते. AI ची स्वतंत्र कृती, जसे की नवीन टॅब उघडणे, शोध घेणे आणि डेटा फील्ड भरणे, खरोखरच उल्लेखनीय आहे.

सध्या मॉडेल हळू काम करते आणि कदाचित नेहमीच अचूक उत्तर देत नाही, परंतु Anthropic त्याच्या मर्यादा ओळखून त्यावर काम करत आहे, ज्यामुळे लवकरच सुधारणा अपेक्षित आहे. Google च्या आधी नमूद केलेल्या ‘प्रोजेक्ट मेरिनर’ ने डिसेंबरमध्ये Anthropic चे अनुकरण केले आणि OpenAI ने जानेवारी 2025 मध्ये स्वतःचे कॉम्प्युटर यूज मॉडेल, ‘ऑपरेटर’ सादर केले. फेब्रुवारी 2025 मध्ये, Anthropic ने Claude 3.7 Sonnet लाँच केले, जे एक मोठे मॉडेल आहे आणि आव्हानात्मक प्रश्नांसाठी आपोआप रिझनिंग मोडमध्ये जाते.

6. Microsoft

Microsoft च्या Phi मॉडेल्सचा विकास 2023 मध्ये कंपनीच्या संशोधकांनी विचारलेल्या एका मूलभूत प्रश्नातून झाला: “उभरती बुद्धिमत्ता दर्शविण्यासाठी सर्वात लहान मॉडेल आकार काय आहे?” हा प्रश्न ‘स्मॉल लँग्वेज मॉडेल्स’ च्या विकासातील एक महत्त्वाचा क्षण होता. स्मॉल लँग्वेज मॉडेल्स मर्यादित मेमरी, प्रोसेसिंग पॉवर किंवा कनेक्टिव्हिटी असलेल्या परिस्थितीत മികച്ച कार्यक्षमतेसाठी डिझाइन केलेले आहेत, जिथे जलद प्रतिसाद मिळणे आवश्यक आहे.

2024 मध्ये, Microsoft ने स्मॉल मॉडेल्सच्या दोन पिढ्या जारी केल्या, ज्यांनी तर्क आणि तर्कशास्त्र क्षमता दर्शविली. एप्रिलमध्ये, कंपनीने Phi-3 मॉडेल्सची मालिका लाँच केली, जी भाषा, तर्क, कोडिंग आणि गणिताच्या बेंचमार्कमध्ये उत्कृष्ट ठरली. हे शक्यतो मोठ्या आणि अधिक सक्षम LLMs द्वारे तयार केलेल्या सिंथेटिक डेटावर आधारित होते. 2024 मध्ये Hugging Face वर ओपन-सोर्स Phi-3 चे 4.5 दशलक्षाहून अधिक वेळा डाउनलोड झाले.

2024 च्या शेवटी, Microsoft ने Phi-4 स्मॉल लँग्वेज मॉडेल्स लाँच केले, ज्यांनी तर्क-केंद्रित कार्यांमध्ये Phi-3 मॉडेल्सला मागे टाकले आणि OpenAI च्या GPT-4o ला GPQA (वैज्ञानिक प्रश्न) आणि MATH बेंचमार्कवर मागे टाकले. Microsoft ने मॉडेल ओपन-सोर्स आणि ओपन-वेट्स लायसन्स अंतर्गत जारी केले, ज्यामुळे डेव्हलपर्सना फोन किंवा लॅपटॉपसाठी एज मॉडेल्स किंवा ॲप्लिकेशन्स तयार करता येतील. एका महिन्यापेक्षा कमी कालावधीत, Phi-4 ला Hugging Face वर 375,000 डाउनलोड मिळाले.

7. Amazon

Amazon AWS ने अलीकडेच Trainium2 सादर केले, जे AI साठी Trainium प्रोसेसरची नवीन आवृत्ती आहे. हे Nvidia GPUs ला विशिष्ट परिस्थितीत आव्हान देऊ शकते. Trainium2 सर्वात मोठ्या जनरेटिव्ह AI मॉडेल्सना प्रशिक्षण देण्यासाठी आणि मॉडेल उपयोजनानंतर इंफेरेंस-टाइम ऑपरेशन्ससाठी आवश्यक असलेली प्रचंड कम्प्युटिंग पॉवर देण्यासाठी तयार केले आहे. AWS चा दावा आहे की Trainium GPUs पेक्षा 30% ते 40% अधिक किफायतशीर आहे.

Trainium2 पहिल्या Trainium चिपमधील पॉवर आणि सॉफ्टवेअर इंटिग्रेशनच्या कमतरता दूर करते, ज्यामुळे Amazon Nvidia सोबतची स्पर्धा कमी करू शकते. (हे लक्षात घेणे महत्त्वाचे आहे की AWS स्वतः GPUs साठी Nvidia वर खूप अवलंबून आहे.) Nvidia ला मागे टाकणे हे एक मोठे आव्हान आहे कारण ग्राहक Nvidia च्या CUDA सॉफ्टवेअर लेयरमध्ये अडकलेले आहेत, जे संशोधकांना त्यांच्या मॉडेल्सनी चिपची संसाधने कशी वापरावी यावर नियंत्रण ठेवण्यास मदत करते. Amazon स्वतःचे कर्नेल कंट्रोल सॉफ्टवेअर लेयर, Neuron Kernel Interface (NKI) ऑफर करते, जे CUDA प्रमाणेच संशोधकांना चिप कर्नेल इंटरॅक्शनवर नियंत्रण ठेवण्यास मदत करते.

हे लक्षात घेणे महत्त्वाचे आहे की Trainium2 ची अद्याप मोठ्या प्रमाणावर चाचणी झालेली नाही. AWS सध्या Anthropic साठी 400,000 Trainium2 चिप्ससह एक सर्व्हर क्लस्टर तयार करत आहे, ज्यामुळे मोठ्या प्रमाणावर AI चिप्सची कार्यक्षमता ऑप्टिमाइझ करण्यासाठी मौल्यवान माहिती मिळू शकेल.

8. Arm

ब्रिटिश सेमीकंडक्टर डिझायनर Arm बऱ्याच काळापासून फोन, सेन्सर आणि IoT हार्डवेअरसारख्या लहान उपकरणांमध्ये वापरल्या जाणाऱ्या चिप्ससाठी आर्किटेक्चर पुरवते. एज डिव्हाइस चिप्स AI मॉडेल्स कार्यान्वित करतील अशा युगात ही भूमिका अधिक महत्त्वाची ठरते. डेटा सेंटर्स देखील या उत्क्रांतीमध्ये महत्त्वपूर्ण भूमिका बजावतील, अनेकदा सर्वात जास्त मागणी असलेल्या AI प्रक्रियेचा काही भाग किंवा सर्व भाग हाताळतील आणि एज उपकरणांना परिणाम देतील.

जगभरात डेटा सेंटर्स वाढत असताना, त्यांचा वीज वापर ही एक गंभीर समस्या बनत आहे. Arm च्या नवीनतम Neoverse CPU आर्किटेक्चरमध्ये कार्यक्षमतेला महत्त्व दिले आहे. कंपनीच्या म्हणण्यानुसार, हे मागील पिढ्यांपेक्षा 50% अधिक कार्यप्रदर्शन आणि प्रतिस्पर्धी x86 आर्किटेक्चर वापरणाऱ्या प्रोसेसरपेक्षा 20% प्रति वॅट अधिक कार्यप्रदर्शन देते.

Arm ने सांगितले की Amazon, Microsoft, Google आणि Oracle या सर्वांनी सामान्य-उद्देश कम्प्युटिंग आणि CPU-आधारित AI इंफेरेंस आणि प्रशिक्षणासाठी Arm Neoverse चा वापर केला आहे. उदाहरणार्थ, 2024 मध्ये, Microsoft ने जाहीर केले की क्लाउडसाठी डिझाइन केलेले त्यांचे पहिले कस्टम सिलिकॉन, Cobalt 100 प्रोसेसर, Arm Neoverse वर तयार केले गेले आहे. काही सर्वात मोठी AI डेटा सेंटर्स NVIDIA च्या Grace Hopper Superchip वर अवलंबून असतील, जे Neoverse वर आधारित Hopper GPU आणि Grace CPU एकत्र करते. Arm यावर्षी स्वतःचे CPU लाँच करणार आहे, ज्यामध्ये Meta त्यांच्या पहिल्या ग्राहकांपैकी एक असेल.

9. Gretel

गेल्या वर्षभरात, AI कंपन्यांना वेबवरून स्क्रॅप केलेल्या डेटासह त्यांच्या मॉडेल्सना प्रशिक्षण देण्याचा फायदा कमी होत आहे. त्यामुळे, त्यांनी प्रशिक्षण डेटाच्या गुणवत्तेवर लक्ष केंद्रित केले आहे. यामुळे प्रकाशक भागीदारांकडून (publisher partners) परवाना घेतलेल्या गैर-सार्वजनिक आणि विशेष सामग्रीमध्ये गुंतवणूक वाढली आहे. AI संशोधकांना त्यांच्या मानवनिर्मित किंवा मानवाद्वारे तयार केलेल्या प्रशिक्षण डेटामधील त्रुटी दूर करणे आवश्यक आहे. यासाठी, त्यांनी विशेष AI मॉडेल्सद्वारे तयार केलेल्या सिंथेटिक प्रशिक्षण डेटाचा वापर वाढवला आहे.

Gretel 2024 मध्ये सिंथेटिक प्रशिक्षण डेटा तयार करण्यात आणि त्याचे संकलन करण्यात अग्रेसर ठरली. कंपनीने Gretel Navigator हे त्यांचे प्रमुख उत्पादन लाँच केले, जे डेव्हलपर्सना नैसर्गिक भाषा किंवा SQL प्रॉम्प्ट वापरून सिंथेटिक प्रशिक्षण डेटासेट तयार करण्यास, वाढवण्यास, संपादित करण्यास आणि क्युरेट करण्यास सक्षम करते. प्लॅटफॉर्मने 150,000 पेक्षा जास्त डेव्हलपर्सना आकर्षित केले आहे, ज्यांनी 350 अब्जाहून अधिक प्रशिक्षण डेटा तयार केला आहे.

इतर उद्योगांनी Gretel च्या क्षमतांची दखल घेतली आहे. Gretel ने Google सोबत भागीदारी केली आहे, ज्यामुळे Google Cloud ग्राहकांना सिंथेटिक प्रशिक्षण डेटा सहज उपलब्ध होईल. Databricks सोबत जूनमध्ये अशीच भागीदारी जाहीर करण्यात आली, ज्यामुळे Databricks च्या एंटरप्राइझ ग्राहकांना त्यांच्या मॉडेल्ससाठी सिंथेटिक प्रशिक्षण डेटा वापरता येईल.

10. Mistral AI

Mistral AI, फ्रान्सची जनरेटिव्ह AI मधील स्पर्धक कंपनी, OpenAI, Anthropic आणि Google यांच्यावर सातत्याने दबाव आणत आहे. Mistral AI ने 2024 मध्ये नवीन मॉडेल्सची मालिका जारी केली, ज्यामध्ये महत्त्वपूर्ण तांत्रिक प्रगती दिसून आली.

कंपनीने Mixtral नावाचे ओपन-सोर्स मॉडेल्स सादर केले, जे ‘मिक्सचर ऑफ एक्सपर्ट्स’ आर्किटेक्चरचा वापर करतात. यामध्ये मॉडेलचे फक्त काही विशेष पॅरामीटर्स क्वेरी हाताळण्यासाठी वापरले जातात, ज्यामुळे कार्यक्षमता वाढते. जुलै 2024 मध्ये, Mistral ने Mistral Large 2 लाँच केले, ज्यामध्ये 123 अब्ज पॅरामीटर्स होते आणि कोड जनरेशन, गणित, तर्क आणि फंक्शन कॉलिंगमध्ये सुधारणा दिसून आली. फ्रेंच कंपनीने Ministral 3B आणि Ministral 8B देखील जारी केले, जे लॅपटॉप किंवा फोनवर चालण्यासाठी डिझाइन केलेले लहान मॉडेल्स आहेत आणि वापरकर्त्याने दिलेली सुमारे 50 मजकूर पृष्ठांची माहिती साठवू शकतात.

Mistral ने युरोपमध्ये स्वतःला OpenAI सारख्या अमेरिकन AI कंपन्यांपेक्षा कमी खर्चिक आणि लवचिक पर्याय म्हणून स्थापित केले आहे. 2024 मध्ये त्यांनी अमेरिकन एंटरप्राइझ मार्केटमध्येही विस्तार केला. जूनमध्ये, कंपनीने $640 दशलक्ष निधी मिळवला, ज्यामुळे Mistral चे मूल्य $6.2 अब्ज झाले.

11. Fireworks AI

Fireworks एक कस्टम रनटाइम एन्व्हायर्नमेंट (custom runtime environment) ऑफर करते, जे AI उपयोजनांसाठी (deployments) आवश्यक असलेले इन्फ्रास्ट्रक्चर तयार करण्याचे काम सोपे करते. Fireworks प्लॅटफॉर्म वापरून, कंपन्या 100 पेक्षा जास्त AI मॉडेल्स एकत्रित करू शकतात आणि त्यांना त्यांच्या विशिष्ट गरजांनुसार कस्टमाइझ आणि फाइन-ट्यून करू शकतात.

कंपनीने 2024 मध्ये नवीन उत्पादने सादर केली, जी AI उद्योगातील प्रमुख ट्रेंडमध्ये स्थान मिळवण्यास मदत करतील. प्रथम, डेव्हलपर्स AI-चालित मॉडेल्स आणि ॲप्लिकेशन्सच्या प्रतिसादावर अधिक लक्ष केंद्रित करत आहेत. Fireworks ने FireAttention V2 लाँच केले, जे मॉडेलची कार्यक्षमता वाढवते आणि नेटवर्क लेटन्सी (network latency) कमी करते. दुसरे म्हणजे, AI प्रणाली अधिकाधिक ‘पाइपलाइन’मध्ये विकसित होत आहेत, जी APIs द्वारे विविध मॉडेल्स आणि साधनांचा वापर करतात. नवीन FireFunction V2 सॉफ्टवेअर या वाढत्या जटिल प्रणालींमधील सर्व घटकांसाठी ऑर्केस्ट्रेटर (orchestrator) म्हणून काम करते, विशेषत: जेव्हा कंपन्या अधिक स्वायत्त AI ॲप्लिकेशन्स उपयोजित करतात.

Fireworks ने 2024 मध्ये महसुलात 600% वाढ नोंदवली आहे. त्यांच्या ग्राहक कंपन्यांमध्ये Verizon, DoorDash, Uber, Quora आणि Upwork यांचा समावेश आहे.

12. Snorkel AI

कंपन्यांना हे समजले आहे की त्यांच्या AI प्रणालींची प्रभावीता त्यांच्या डेटाच्या गुणवत्तेवर अवलंबून असते. Snorkel AI ने कंपन्यांना त्यांचा डेटा AI मॉडेल्समध्ये वापरण्यासाठी तयार करण्यात मदत करून एक यशस्वी व्यवसाय तयार केला आहे. कंपनीचे Snorkel Flow AI डेटा डेव्हलपमेंट प्लॅटफॉर्म कंपन्यांना त्यांच्या डेटाला लेबल आणि क्युरेट करण्याचा एक किफायतशीर मार्ग प्रदान करते, ज्यामुळे AI मॉडेल्सना त्यांच्या विशिष्ट व्यवसायाच्या गरजांसाठी कस्टमाइझ करता येते.

2024 मध्ये, Snorkel ने प्रतिमांसाठी (images) समर्थन वाढवले, ज्यामुळे कंपन्यांना त्यांच्या स्वतःच्या प्रतिमा वापरून मल्टीमॉडल AI मॉडेल्स आणि इमेज जनरेटर्सना प्रशिक्षित करता येते. त्यांनी प्लॅटफॉर्ममध्ये रिट्रीव्हल-ऑगमेंटेड जनरेशन (RAG) देखील समाविष्ट केले, ज्यामुळे ग्राहकांना AI प्रशिक्षणासाठी मोठ्या दस्तऐवजांमधून, जसे की नॉলেजबेस सामग्रीमधून फक्त सर्वात संबंधित माहिती मिळवता येते. Snorkel Custom, एक नवीन, उच्च-टच सेवा स्तर, ज्यामध्ये Snorkel चे मशीन लर्निंग तज्ञ ग्राहकांसोबत थेट प्रकल्पांवर काम करतात.

Snorkel च्या म्हणण्यानुसार, 2024 मध्ये त्यांचे वार्षिक बुकिंग दुप्पट झाले. कंपनीच्या मते, सहा मोठ्या बँका आता Snorkel Flow वापरतात, तसेच Chubb, Wayfair आणि Experian सारख्या कंपन्याही वापर करतात.

13. CalypsoAI

AI जसजसे महत्त्वाच्या निर्णय प्रक्रियेत महत्त्वपूर्ण भूमिका बजावत आहे, तसतसे कंपन्यांना मॉडेल्सच्या अंतर्गत कार्यपद्धती সম্পর্কে अधिक जाणून घ्यायचे आहे. विशेषतः नियमन केलेल्या उद्योगांमध्ये (regulated industries), जिथे पक्षपात आणि इतर अनपेक्षित परिणामांवर सतत लक्ष ठेवणे आवश्यक असते. CalypsoAI ने ही गरज ओळखली आणि त्यांच्या AI इन्फ्रास्ट्रक्चर प्लॅटफॉर्ममध्ये सुधारित वैशिष्ट्ये (enhanced explainability features) सादर केली.

Calypso ची खासियत म्हणजे त्याच्या ऑब्झर्वेबिलिटी (observability) तंत्रज्ञानाची व्याप्ती. 2024 मध्ये, कंपनीने AI Security Platform लाँच केले, जे एंटरप्राइझ डेटाचे संरक्षण करते. ते कंपनी वापरत असलेल्या सर्व सक्रिय जनरेटिव्ह AI मॉडेल्सची सुरक्षा, ऑडिट आणि मॉनिटर करते, मग ते मॉडेल कोणत्याही कंपनीचे असो किंवा मॉडेल अंतर्गत होस्ट केलेले असो किंवा बाहेरून. Calypso ने नवीन व्हिज्युअलायझेशन टूल्स (visualization tools) देखील सादर केले जे वापरकर्त्यांना रिअल टाइममध्ये AI निर्णयामागील तर्क पाहू देतात.

Calypso च्या AI ऑब्झर्वेबिलिटीवर लक्ष केंद्रित केल्यामुळे बाजारात चांगली प्रतिक्रिया मिळत आहे. कंपनीने 2024 मध्ये महसुलात दहापट वाढ नोंदवली आहे आणि 2025 मध्ये आणखी पाचपट वाढ होण्याची अपेक्षा आहे.

14. Galileo

AI प्रणालींमध्ये तथ्यात्मक त्रुटी (factual hallucinations) आणि पक्षपात (biases) कमी असले तरी, ते अजूनही या समस्यांना बळी पडू शकतात. AI वापरणाऱ्या कोणत्याही व्यवसायासाठी, विशेषतः आरोग्यसेवा आणि बँकिंगसारख्या नियमन केलेल्या क्षेत्रांसाठी ही एक मोठी चिंता आहे. AI डेव्हलपमेंट टीम Galileo च्या AI प्लॅटफॉर्मचा वापर त्यांच्या मॉडेल्स आणि ॲप्लिकेशन्सची अचूकता मोजण्यासाठी, ऑप्टिमाइझ करण्यासाठी आणि मॉनिटर करण्यासाठी करतात.

2024 च्या सुरुवातीला, दोन वर्षांच्या संशोधनानंतर, Galileo ने Luna लाँच केले, जे हानिकारक आउटपुट ओळखण्यासाठी प्रशिक्षित केलेले इव्हॅल्युएशन मॉडेल्स (evaluation models) आहेत. हे मॉडेल्स Galileo च्या प्लॅटफॉर्मला LLM चे काम जलदगतीने तपासण्यास आणि त्याचे मूल्यांकन करण्यास सक्षम करतात. ही प्रक्रिया सुमारे 200 मिलीसेकंद घेते, ज्यामुळे AI चे आउटपुट वापरकर्त्याला प्रदर्शित करण्यापूर्वी थांबवता येते. एक सामान्य LLM हे काम करू शकते, परंतु ते खूप महाग असेल. Galileo चे खास तयार केलेले मॉडेल्स अधिक अचूकता, खर्च-कार्यक्षमता आणि वेग देतात.

Galileo ने 2024 मध्ये त्यांच्या ग्राहकांची संख्या चौपट झाल्याचे सांगितले आहे, ज्यात Twilio, Reddit, Chegg, Comcast आणि JPMorgan Chase यांचा समावेश आहे. स्टार्टअपला Hugging Face चे CEO क्लेमेंट डेलान्ग्यू यांच्यासह गुंतवणूकदारांकडून $68 दशलक्ष निधी मिळाला.

15. Runway

AI बद्दलची सर्वात मोठी आकांक्षा आणि चिंता म्हणजे व्हिडिओ तयार करण्याची क्षमता, ज्यामुळे चित्रपट निर्मितीची कला आणि अर्थशास्त्र बदलू शकते. 2024 मध्ये या दिशेने महत्त्वपूर्ण प्रगती झाली, ज्यामध्ये न्यूयॉर्क-आधारित व्हिडिओ जनरेशन स्टार्टअप Runway ने महत्त्वाची भूमिका बजावली. जून 2024 मध्ये Runway च्या Gen-3 Alpha मॉडेलच्या रिलीझने AI समुदायात प्रशंसा मिळवली कारण त्यामुळे तयार केलेले व्हिडिओ अधिक वास्तववादी वाटत होते.

Runway ने AI व्हिडिओच्या सौंदर्यावर नियंत्रण ठेवण्यासाठी त्यांच्या साधनांमध्ये मोठे बदल केले. मॉडेलला प्रतिमा आणि व्हिडिओ दोन्हीवर प्रशिक्षित केले गेले होते आणि ते मजकूर किंवा प्रतिमा इनपुटवर आधारित व्हिडिओ तयार करू शकते. कंपनीने नंतर Gen-3 Alpha Turbo लाँच केले, जे Gen-3 ची अधिक किफायतशीर आणि वेगवान आवृत्ती आहे.

हॉलिवूड जनरेटिव्ह AI च्या प्रगतीवर लक्ष ठेवून आहे, आणि Runway ने सांगितले की त्यांनी मनोरंजन उद्योगातील कंपन्यांसाठी त्यांच्या मॉडेल्सच्या कस्टम आवृत्त्या तयार करण्यास सुरुवात केली आहे. सप्टेंबर 2024 मध्ये त्यांनी Lionsgate Studios सोबत औपचारिक भागीदारी केली. Runway ने प्रॉडक्शन कंपनीसाठी एक कस्टम मॉडेल विकसित केले आणि Lionsgate च्या फिल्म कॅटलॉगवर (film catalog) प्रशिक्षण दिले. Runway चे म्हणणे आहे की हे मॉडेल Lionsgate च्या चित्रपट निर्माते, दिग्दर्शक आणि इतर कलाकारांना त्यांचे काम ‘वाढवण्यासाठी’ मदत करेल, तसेच ‘वेळ, पैसा आणि संसाधने वाचवेल.’ Runway ला वाटते की Lionsgate सोबतची त्यांची व्यवस्था इतर प्रॉडक्शन कंपन्यांसोबतच्या अशाच प्रकारच्या भागीदारीसाठी एक ब्लूप्रिंट (blueprint) म्हणून काम करू शकते.

16. Cerebras Systems

AI प्रणाली, विशेषत: मोठ्या फ्रंटियर मॉडेल्सना (frontier models) मोठ्या प्रमाणावर काम करण्यासाठी प्रचंड कम्प्युटिंग पॉवरची आवश्यकता असते. यासाठी, कामाचा भार वितरित करण्यासाठी हजारो किंवा लाखो चिप्स एकमेकांशी जोडणे आवश्यक आहे. पण, चिप्समधील नेटवर्क कनेक्शनमुळे कार्यक्षमतेत अडथळे येऊ शकतात. Cerebras Systems चे तंत्रज्ञान एका मोठ्या चिपवर प्रचंड कम्प्युटिंग पॉवर एकत्रित करण्याचे फायदे घेण्यासाठी डिझाइन केलेले आहे.

कंपनीची नवीनतम WSE-3 (third-generation Wafer Scale Engine) चिप 814 स्क्वेअर मिलीमीटर आकाराची आहे, जी डिनर प्लेटच्या आकाराची आहे आणि Nvidia च्या H100 चिप्सपेक्षा 56 पट मोठी आहे. चिपमध्ये 4 ट्रिलियन ट्रान्झिस्टर आहेत आणि 44 गिगाबिट मेमरी आहे. या चिप्सना एकत्र करून सुपर कॉम्प्युटर तयार केले जाऊ शकतात, जसे की Condor Galaxy, जे Cerebras त्यांच्या सर्वात मोठ्या ग्राहक, G42, UAE-आधारित AI आणि क्लाउड कम्प्युटिंग कंपनीसोबत विकसित करत आहे.

आतापर्यंत, Cerebras ने मोठ्या संशोधन संस्थांमध्ये स्थान मिळवले आहे, ज्यात Mayo Clinic, Sandia National Laboratories, Lawrence Livermore National Laboratory, आणि Los Alamos National Laboratory यांचा समावेश आहे. कंपनीने सप्टेंबर 2024 मध्ये IPO साठी अर्ज केला. प्रॉस्पेक्टसमध्ये (prospectus) असे म्हटले आहे की कंपनीची विक्री 2023 मध्ये तिप्पट होऊन $78.7 दशलक्ष झाली आणि 2024 च्या पहिल्या सहामाहीत ती $136.4 दशलक्ष झाली.