Google की हेल्थकेयर AI में प्रगति
Google ने हाल ही में अपने वार्षिक ‘द चेक अप’ इवेंट में Health AI अपडेट्स का अनावरण किया, जो विभिन्न स्वास्थ्य सेवा अनुप्रयोगों के लिए AI का लाभ उठाने के लिए कंपनी की प्रतिबद्धता को दर्शाता है। ये अपडेट Google Search में स्वास्थ्य संबंधी प्रश्नों को बढ़ाने से लेकर AI-संचालित दवा खोज की दक्षता को बढ़ावा देने के लिए डिज़ाइन किए गए नए ‘ओपन’ AI मॉडल पेश करने तक फैले हुए हैं।
Google Search के माध्यम से स्वास्थ्य सूचना पहुंच बढ़ाना
Google व्यापक स्वास्थ्य संबंधी विषयों के लिए ‘नॉलेज पैनल’ उत्तरों के दायरे को व्यापक बनाने के लिए AI और परिष्कृत गुणवत्ता और रैंकिंग सिस्टम तैनात कर रहा है। इस विस्तार में मोबाइल प्लेटफ़ॉर्म पर शुरुआत में स्पेनिश, पुर्तगाली और जापानी जैसी कई भाषाओं में स्वास्थ्य सेवा प्रश्नों के लिए समर्थन जोड़ना शामिल है। जबकि Search पहले से ही इन्फ्लूएंजा या सामान्य सर्दी जैसी प्रचलित स्वास्थ्य चिंताओं के लिए नॉलेज पैनल उत्तर प्रस्तुत करता था, यह अपडेट उन विषयों की सरणी को महत्वपूर्ण रूप से बढ़ाता है जिन्हें ये पैनल शामिल करते हैं।
इसके अलावा, Google Search में ‘व्हाट पीपल सजेस्ट’ नामक एक नई सुविधा पेश करता है। यह सुविधा उपयोगकर्ताओं को उन व्यक्तियों से प्राप्त जानकारी प्रस्तुत करने के लिए डिज़ाइन की गई है जिन्होंने समान चिकित्सा अनुभव साझा किए हैं। यह जोड़ उपयोगकर्ताओं को अंतर्दृष्टि प्राप्त करने के लिए एक अनूठा रास्ता प्रदान करता है। यह उपयोगकर्ताओं को उसी स्थिति वाले अन्य लोगों से प्रामाणिक दृष्टिकोणों को जल्दी से खोजने की अनुमति देता है, आगे की खोज के लिए लिंक के साथ पूरा होता है। ‘व्हाट पीपल सजेस्ट’ वर्तमान में संयुक्त राज्य अमेरिका के भीतर मोबाइल उपकरणों पर उपलब्ध है।
नई API के साथ मेडिकल रिकॉर्ड को सुव्यवस्थित करना
Google ने Android उपकरणों के साथ संगत अपने Health Connect प्लेटफ़ॉर्म के लिए वैश्विक स्तर पर नए मेडिकल रिकॉर्ड एप्लिकेशन प्रोग्रामिंग इंटरफेस (API) भी लॉन्च किए हैं। ये API एप्लिकेशन को एलर्जी, दवाएं, टीकाकरण और प्रयोगशाला परिणाम सहित मेडिकल रिकॉर्ड डेटा को पढ़ने और लिखने दोनों के लिए सशक्त बनाते हैं, सभी मानकीकृत FHIR प्रारूप में। ये संवर्द्धन Health Connect के समर्थन को गतिविधि, नींद, पोषण, महत्वपूर्ण संकेत और अब मेडिकल रिकॉर्ड सहित 50 से अधिक डेटा प्रकारों में लाते हैं। यह एकीकरण उपयोगकर्ताओं के दैनिक स्वास्थ्य डेटा और उनके स्वास्थ्य सेवा प्रदाताओं की जानकारी के बीच एक सहज संबंध की सुविधा प्रदान करता है।
AI को-साइंटिस्ट: एक वर्चुअल रिसर्च पार्टनर
Google की ओर से एक अभूतपूर्व नवाचार ‘AI को-साइंटिस्ट’ है, जो Gemini 2.0 द्वारा रेखांकित एक नई प्रणाली है। इस प्रणाली की परिकल्पना शोधकर्ताओं और वैज्ञानिकों के लिए एक ‘वर्चुअल साइंटिफिक कोलैबोरेटर’ के रूप में की गई है। AI को-साइंटिस्ट को व्यापक वैज्ञानिक साहित्य को नेविगेट करने में शोधकर्ताओं की सहायता करने के लिए डिज़ाइन किया गया है, जिससे नई परिकल्पनाओं की पीढ़ी को सुविधा मिलती है। विशाल डेटासेट और जटिल शोध पत्रों के विश्लेषण में सहायता करके, AI को-साइंटिस्ट का उद्देश्य विशेषज्ञों को नए विचारों को उजागर करने और उनके शोध प्रयासों में तेजी लाने के लिए सशक्त बनाना है। Google इस उपकरण के व्यावहारिक अनुप्रयोगों का पता लगाने के लिए इंपीरियल कॉलेज लंदन, ह्यूस्टन मेथोडिस्ट और स्टैनफोर्ड यूनिवर्सिटी जैसे संस्थानों के साथ सक्रिय रूप से सहयोग कर रहा है और एक विश्वसनीय परीक्षक कार्यक्रम शुरू करने का इरादा रखता है।
TxGemma: ड्रग डिस्कवरी में तेजी लाना
Google ने TxGemma भी पेश किया,जो Gemma-आधारित ओपन मॉडल का एक संकलन है जिसका उद्देश्य AI-संचालित दवा खोज की दक्षता को बढ़ाना है। TxGemma में मानक पाठ और विभिन्न चिकित्सीय संस्थाओं की संरचनाओं, जिसमें छोटे अणु, रसायन और प्रोटीन शामिल हैं, दोनों को समझने की क्षमता है। TxGemma की रिलीज निकट भविष्य के लिए निर्धारित है।
कैप्रिकॉर्न AI टूल: बाल चिकित्सा ऑन्कोलॉजी को आगे बढ़ाना
नीदरलैंड में प्रिंसेस मैक्सिमा सेंटर फॉर पीडियाट्रिक ऑन्कोलॉजी के सहयोग से, Google कैप्रिकॉर्न नामक एक AI उपकरण विकसित कर रहा है। यह उपकरण विशेष चिकित्सा क्षेत्रों, विशेष रूप से बाल चिकित्सा ऑन्कोलॉजी में AI को लागू करने के लिए Google के समर्पण को रेखांकित करता है।
स्वास्थ्य सेवा पर AI का व्यापक प्रभाव
Google ने पहले वैश्विक स्वास्थ्य परिणामों पर AI के सकारात्मक प्रभाव पर प्रकाश डाला है। कंपनी ने स्तन कैंसर, फेफड़ों के कैंसर और मधुमेह संबंधी रेटिनोपैथी जैसी बीमारियों का पता लगाने में सहायता के लिए AI मॉडल विकसित किए हैं। मई 2024 में, Google ने मेड-जेमिनी की घोषणा की, जो मल्टीमॉडल मेडिकल अनुप्रयोगों के लिए फाइन-ट्यून किए गए जेमिनी मॉडल का एक परिवार है। इसके अलावा, जून 2024 में, Google ने मोबाइल और पहनने योग्य उपकरणों के लिए पर्सनल हेल्थ लार्ज लैंग्वेज मॉडल पेश किया। जेमिनी का यह फाइन-ट्यून किया गया संस्करण सेंसर डेटा की व्याख्या करने और किसी व्यक्ति की नींद और फिटनेस पैटर्न के बारे में व्यक्तिगत अंतर्दृष्टि और सिफारिशें प्रदान करने के लिए डिज़ाइन किया गया है।
xAI द्वारा हॉटशॉट का अधिग्रहण: जेनरेटिव AI वीडियो में एक कदम
Elon Musk के AI वेंचर, xAI ने AI-संचालित वीडियो जेनरेशन टूल में विशेषज्ञता वाले एक स्टार्टअप, हॉटशॉट का अधिग्रहण किया है। यह अधिग्रहण xAI को जेनरेटिव AI वीडियो स्पेस में एक अग्रणी प्लेटफॉर्म, OpenAI के Sora के साथ प्रतिस्पर्धा करने के लिए तैयार करता है। हॉटशॉट ने अपनी वेबसाइट पर घोषणा की कि उसने 14 मार्च को नए वीडियो निर्माण को चरणबद्ध करना शुरू कर दिया, जिसमें मौजूदा ग्राहकों के पास अपने बनाए गए वीडियो डाउनलोड करने के लिए 30 मार्च तक का समय था।
Grok 3: xAI का महत्वाकांक्षी AI चैटबॉट
19 फरवरी को, xAI ने Grok 3 का अनावरण किया, जो अपने चैटबॉट का नवीनतम पुनरावृत्ति है, जिसे Elon Musk ने “पृथ्वी पर सबसे स्मार्ट AI” घोषित किया। इसके बाद, कंपनी ने दो रीजनिंग मॉडल, Grok 3 (थिंक) और Grok 3 मिनी (थिंक) के बीटा रिलीज की घोषणा की। xAI ने कहा कि Grok 3, अपने कोलोसस सुपरक्लस्टर पर प्रशिक्षित, पिछली अत्याधुनिक मॉडलों की तुलना में दस गुना कम्प्यूटेशनल शक्ति के साथ, तर्क, गणित, कोडिंग, विश्व ज्ञान और निर्देश-निम्नलिखित कार्यों में पर्याप्त सुधार प्रदर्शित करता है।
Mistral AI का Mistral Small 3.1: कॉम्पैक्ट और शक्तिशाली
फ्रांसीसी AI स्टार्टअप Mistral AI ने 17 मार्च को Mistral Small 3.1 नामक एक नया ओपन-सोर्स मॉडल पेश किया। कंपनी का दावा है कि यह मॉडल Google के Gemma 3 और OpenAI के GPT-4o Mini जैसे तुलनीय मॉडलों को पीछे छोड़ देता है, जिससे बड़े पैमाने पर अमेरिकी तकनीकी दिग्गजों के प्रभुत्व वाले बाजार में प्रतिस्पर्धा तेज हो जाती है।
Mistral Small 3.1 पाठ और छवियों दोनों को 24 बिलियन मापदंडों के साथ संसाधित करता है - अग्रणी मालिकाना मॉडल की तुलना में काफी छोटा आकार - जबकि उनके प्रदर्शन से मेल खाता है या उससे अधिक है। Mistral AI ने जोर देकर कहा कि Mistral Small 3.1 पहला ओपन-सोर्स मॉडल है जो न केवल विभिन्न आयामों में अग्रणी छोटे मालिकाना मॉडल के प्रदर्शन को पूरा करता है बल्कि उससे आगे निकल जाता है।
Mistral Small 3 पर निर्माण करते हुए, यह नया मॉडल बेहतर टेक्स्ट प्रदर्शन, मल्टीमॉडल समझ और 128,000 टोकन तक की विस्तारित संदर्भ विंडो का दावा करता है। Mistral AI का दावा है कि मॉडल 150 टोकन प्रति सेकंड की गति से जानकारी संसाधित करता है, जिससे यह उन अनुप्रयोगों के लिए उपयुक्त हो जाता है जिनके लिए तेजी से प्रतिक्रिया समय की आवश्यकता होती है।
Mistral Small 3.1 की बहुमुखी प्रतिभा और पहुंच
Mistral Small 3.1 को एक RTX 4090 या 32GB RAM वाले Mac जैसे सुलभ हार्डवेयर पर चलाने के लिए डिज़ाइन किया गया है, जो इसे ऑन-डिवाइस अनुप्रयोगों के लिए अत्यधिक उपयुक्त बनाता है। मॉडल को विशेष डोमेन के लिए फाइन-ट्यून किया जा सकता है, जिससे अत्यधिक सटीक विषय वस्तु विशेषज्ञों का निर्माण सक्षम होता है, जो विशेष रूप से कानूनी सलाह, चिकित्सा निदान और तकनीकी सहायता जैसे क्षेत्रों में उपयोगी होता है।
नया मॉडल मल्टीमॉडल समझ की आवश्यकता वाले उद्यम और उपभोक्ता अनुप्रयोगों के व्यापक स्पेक्ट्रम के लिए तैयार किया गया है। संभावित उपयोग के मामलों में दस्तावेज़ सत्यापन, निदान, ऑन-डिवाइस छवि प्रसंस्करण, गुणवत्ता नियंत्रण के लिए दृश्य निरीक्षण, सुरक्षा प्रणालियों में वस्तु का पता लगाना, छवि-आधारित ग्राहक सहायता और सामान्य-उद्देश्य सहायता शामिल हैं।
Mistral OCR: उन्नत दस्तावेज़ समझ
मार्च की शुरुआत में, Mistral AI ने Mistral OCR की घोषणा की, जिसे कंपनी “दुनिया का सर्वश्रेष्ठ दस्तावेज़ समझ API” बताती है। Mistral OCR एक ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) API है जो जटिल दस्तावेजों से पाठ, टेबल, समीकरण और छवियों को निकालने में सक्षम है। Mistral AI का मानना है कि यह तकनीक संगठनों द्वारा विशाल सूचना भंडार को संसाधित करने और उपयोग करने के तरीके में क्रांति लाएगी।
कंपनी के अनुसार, Mistral OCR प्रति मिनट 2000 पृष्ठों तक संसाधित करता है, बहुभाषी और मल्टीमॉडल क्षमताओं का समर्थन करता है, और AI वर्कफ़्लो में सहज एकीकरण के लिए JSON जैसे संरचित आउटपुट प्रदान करता है। आंतरिक परीक्षण इंगित करते हैं कि Mistral OCR पाठ निष्कर्षण सटीकता में बाजार का नेतृत्व करता है, खासकर स्कैन किए गए दस्तावेजों, गणितीय सामग्री और बहुभाषी पाठ के लिए। पारंपरिक OCR समाधानों के विपरीत, यह एम्बेडेड छवियों को भी निकालता है, जिससे यह वैज्ञानिक अनुसंधान, नियामक फाइलिंग और ऐतिहासिक दस्तावेज़ डिजिटलीकरण के लिए आदर्श बन जाता है।
Mistral AI की रिपोर्ट है कि OCR पहले से ही उद्यमों और अनुसंधान संस्थानों को साहित्य को डिजिटल बनाने, ग्राहक सेवा को सुव्यवस्थित करने और ऐतिहासिक अभिलेखागार को संरक्षित करने में सहायता कर रहा है। इसके अतिरिक्त, OCR कंपनियों को तकनीकी साहित्य, इंजीनियरिंग चित्र, व्याख्यान नोट्स, प्रस्तुतियाँ, नियामक फाइलिंग और बहुत कुछ को अनुक्रमित, उत्तर-तैयार प्रारूपों में बदलने में मदद कर रहा है। Mistral OCR क्षमताएं le Chat पर मुफ्त परीक्षण के लिए उपलब्ध हैं, और कंपनी आने वाले हफ्तों में मॉडल में और सुधार की उम्मीद करती है। ये चल रहे विकास AI की गतिशील प्रकृति और विभिन्न उद्योगों को फिर से आकार देने की इसकी क्षमता को दर्शाते हैं।