जेम्मा 3n: AI च्या नवीन युगाची सुरुवात

गुगलचे (Google) जेम्मा 3n: AI च्या नवीन युगाची सुरुवात

गुगलच्या (Google) जेम्मा 3n च्या आगमनाने जनरेटिव्ह एआय (Generative AI) मध्ये एका नव्या पर्वाची नांदी झाली आहे. हे मॉडेल (Model) लहान आकारमानाचे आणि प्रचंड वेगवान आहे. विशेष म्हणजे ते आपल्या नेहमीच्या वापरातील उपकरणांवर म्हणजेच मोबाईलवर (Mobile) ऑफलाइन (Offline) देखील चालू शकते. जेम्मा 3n केवळ ऑडिओ (Audio), इमेज (Image) आणि टेक्स्ट (Text)data समजून घेण्यास सक्षम नाही, तर त्याची अचूकताही उत्कृष्ट आहे. चॅटबॉट एरिना (Chatbot Arena) मध्ये त्याची कामगिरी GPT-4.1 नॅनोपेक्षाही (Nano) सरस ठरली आहे​.

जेम्मा 3n ची अभिनव रचना

डिव्हाइस एंड एआयच्या (Device end AI) भविष्याचा वेध घेत गुगल डीप माइंडने (Google DeepMind) क्वालकॉम टेक्नॉलॉजी (Qualcomm Technologies), मीडिया टेक (MediaTek) आणि सॅमसंग सिस्टम एलएसआय (Samsung System LSI) यांसारख्या मोबाईल हार्डवेअरमधील (Mobile hardware) दिग्गज कंपन्यांसोबत भागीदारी केली आहे. या कंपन्यांनी एकत्रितपणे एक नवीन रचना विकसित केली आहे.

या रचनेचा उद्देश कमी क्षमता असलेल्या उपकरणांवर (जसे की मोबाईल, टॅब्लेट (Tablet) आणि लॅपटॉप (Laptop)) जनरेटिव्ह एआयची (Generative AI) कार्यक्षमता वाढवणे हा आहे. हे उद्दिष्ट साध्य करण्यासाठी या रचनेत तीन महत्त्वाचे बदल करण्यात आले आहेत: लेयर वाईज एम्बेडिंग (Layer Wise Embedding - PLE) कॅशिंग (Caching), मॅटफॉर्मर आर्किटेक्चर (MatFormer Architecture) आणि **कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading)**​.

पीएलई (PLE) कॅशे: मेमरीच्या (Memory) मर्यादांवर मात

पीएलई (PLE) कॅशे ही एक अशी प्रणाली आहे, जी मॉडेलला (Model) लेयरनुसार (Layer) एम्बेडिंग पॅरामीटर्स (Embedding parameters) जलद एक्सटर्नल स्टोरेजमध्ये (External storage) हलवण्याची परवानगी देते. यामुळे कार्यक्षमतेशी तडजोड न करता मेमरीचा (Memory) वापर मोठ्या प्रमाणात कमी होतो. हे पॅरामीटर्स (Parameters) मॉडेलच्या (Model) ऑपरेटिंग मेमरीच्या (Operating memory) बाहेर तयार होतात आणि आवश्यकतेनुसार ॲक्सेस (Access) केले जातात. त्यामुळे कमी क्षमता असलेल्या उपकरणांवरही (Devices) प्रभावीपणे काम करणे शक्य होते​.

कल्पना करा, तुम्ही एक गुंतागुंतीचे एआय मॉडेल (AI Model) वापरत आहात, परंतु तुमच्या डिव्हाइसमध्ये (Device) मेमरी (Memory) कमी आहे. पीएलई (PLE) कॅशे एका स्मार्ट लायब्रेरियनसारखे (Librarian) कार्य करते, जे कमी वापरलेली पुस्तके (पॅरामीटर्स) जवळच्या वेअरहाऊसमध्ये (Warehouse) (एक्सटर्नल स्टोरेजमध्ये) ठेवते. जेव्हा मॉडेलला (Model) या पॅरामीटर्सची (Parameters) गरज भासते, तेव्हा तो लायब्रेरियन (Librarian) त्यांना त्वरित परत आणतो, ज्यामुळे मॉडेल (Model) कोणत्याही अडथळ्याशिवाय सुरळीतपणे चालू राहते आणि मौल्यवान मेमरी (Memory) वाचते.

थोडक्यात, पीएलई (PLE) कॅशे खालीलप्रमाणे मेमरी (Memory) वापर आणि कार्यक्षमतेत सुधारणा करते:

  • मेमरीचा (Memory) वापर घटवते: गरजेनुसार पॅरामीटर्स (Parameters) एक्सटर्नल स्टोरेजमध्ये (External storage) हलवून, पीएलई (PLE) कॅशे मॉडेलला (Model) रनटाइममध्ये (Runtime) लागणारी मेमरी (Memory) कमी करते. त्यामुळे कमी क्षमता असलेल्या डिव्हाइसवरही (Device) मोठे एआय (AI) मॉडेल (Model) चालवणे शक्य होते.
  • कार्यक्षमता सुधारते: एक्सटर्नल स्टोरेजमधून (External storage) पॅरामीटर्स (Parameters) परत मिळवण्यासाठी थोडा वेळ लागत असला तरी, पीएलई (PLE) कॅशे भविष्यात कोणत्या पॅरामीटर्सची (Parameters) आवश्यकता आहे, याचा अंदाज घेऊन ते अगोदरच कॅशमध्ये (Cache) लोड (Load) करते. यामुळे विलंब कमी होतो आणि मॉडेल (Model) जवळपास रिअल टाइममध्ये (Real time) कार्य करते.
  • मोठ्या मॉडेलला (Model) सपोर्ट (Support) करते: मेमरीची (Memory) गरज कमी करून, पीएलई (PLE) कॅशे मोठ्या आणि अधिक कॉम्प्लेक्स (Complex) एआय (AI) मॉडेल (Model) तयार करण्यास मदत करते. ही मॉडेल (Model) अधिक प्रभावीपणे कार्य करू शकतात आणि गुंतागुंतीची कामे पूर्ण करू शकतात.

मॅटफॉर्मर (MatFormer) आर्किटेक्चर: रशियन बाहुल्यांसारखी रचना

मॅट्रिओश्का ट्रान्सफॉर्मर (Matryoshka Transformer - MatFormer) आर्किटेक्चर एक नेस्टेड (Nested) ट्रान्सफॉर्मर डिझाइन (Transformer design) आहे. यात लहान सब-मॉडेल (Sub model), मोठ्या मॉडेलमध्ये (Model) एम्बेड (Embed) केलेले असतात, जसे रशियन बाहुल्या एकमेकांमध्ये असतात. हे स्ट्रक्चर (Structure) निवडकपणे सब-मॉडेल ॲक्टिव्हेट (Sub model activate) करण्याची परवानगी देते. त्यामुळे मॉडेल (Model) टास्कनुसार (Task) स्वतःचा आकार आणि गरजेनुसार कंप्यूटिंग (Computing) क्षमता बदलू शकते. ही लवचिकता कंप्यूटेशनल कॉस्ट (Computational cost), रिस्पॉन्स टाइम (Response time) आणि ऊर्जा वापर कमी करते. त्यामुळे हे एज (Edge) आणि क्लाउड डिप्लॉयमेंटसाठी (Cloud deployment) अत्यंत उपयुक्त आहे​.

मॅटफॉर्मर आर्किटेक्चरचा (MatFormer Architecture) मूळ विचार हा आहे की, प्रत्येक कामासाठी संपूर्ण एआय (AI) मॉडेलची (Model) आवश्यकता नसते. सोप्या कामांसाठी, लहान सब-मॉडेल ॲक्टिव्हेट (Sub model activate) केले जाऊ शकतात, ज्यामुळे कंप्यूटिंग (Computing) संसाधने वाचतात. अधिक कॉम्प्लेक्स (Complex) कामांसाठी, मोठे सब-मॉडेल ॲक्टिव्हेट (Sub model activate) करून अचूकता वाढवता येते.

एका उदाहरणाद्वारे मॅटफॉर्मर आर्किटेक्चरचे (MatFormer Architecture) फायदे समजून घेऊ. समजा, तुम्ही एखाद्या इमेजमधील (Image) वस्तू ओळखण्यासाठी एआय (AI) मॉडेल (Model) वापरत आहात. साध्या इमेजसाठी, ज्यात फक्त एकच वस्तू आहे, त्या वस्तूसाठी असलेले लहान सब-मॉडेल ॲक्टिव्हेट (Sub model activate) केले जाऊ शकते. पण जर इमेज (Image) कॉम्प्लेक्स (Complex) असेल, ज्यात अनेक वस्तू आहेत, तर मोठे सब-मॉडेल ॲक्टिव्हेट (Sub model activate) करणे अधिक योग्य ठरते, जे विविध प्रकारच्या वस्तू ओळखण्यास सक्षम असते.

मॅटफॉर्मर आर्किटेक्चरचे (MatFormer Architecture) फायदे:

  • कमी कंप्यूटेशनल कॉस्ट (Computational cost): फक्त आवश्यक सब-मॉडेल ॲक्टिव्हेट (Sub model activate) केल्याने, मॅटफॉर्मर आर्किटेक्चर (MatFormer Architecture) कंप्यूटेशनल कॉस्ट (Computational cost) मोठ्या प्रमाणात कमी करते. हे कमी क्षमता असलेल्या डिव्हाइसवर (Device) एआय (AI) मॉडेल (Model) चालवण्यासाठी महत्त्वाचे आहे.
  • कमी रिस्पॉन्स टाइम (Response time): मॅटफॉर्मर आर्किटेक्चर (MatFormer Architecture) टास्कनुसार (Task) मॉडेलचा (Model) आकार बदलू शकत असल्याने, रिस्पॉन्स टाइम (Response time) कमी होतो. त्यामुळे एआय (AI) मॉडेल (Model) युजरच्या (User) विनंतीला अधिक लवकर प्रतिसाद देऊ शकते.
  • कमी ऊर्जा वापर: कंप्यूटेशनल कॉस्ट (Computational cost) कमी झाल्यामुळे, मॅटफॉर्मर आर्किटेक्चर (MatFormer Architecture) ऊर्जा वापर देखील कमी करते. हे बॅटरीचे (Battery) आयुष्य वाढवण्यासाठी आवश्यक आहे​.

कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading): गरजेनुसार लोडिंग (Loading), संसाधनांचे ऑप्टिमायझेशन (Optimization)

कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) डेव्हलपर्सना (Developers) न वापरलेले पॅरामीटर्स (Parameters) जसे की ऑडिओ (Audio) किंवा व्हिज्युअल प्रोसेसिंगसाठीचे (Visual processing) पॅरामीटर्स (Parameters) मेमरीत (Memory) लोड (Load) करणे टाळण्याची परवानगी देते. आवश्यक असल्यास, हे पॅरामीटर्स (Parameters) रनटाइममध्ये (Runtime) डायनॅमिकली (Dynamically) लोड (Load) केले जाऊ शकतात, ज्यामुळे मेमरीचा (Memory) वापर आणखी ऑप्टिमाइझ (Optimize) होतो आणि मॉडेलला (Model) विविध उपकरणे आणि कामांसाठी जुळवून घेणे सोपे होते​.

कल्पना करा, तुम्ही टेक्स्ट (Text) प्रोसेस (Process) करण्यासाठी एआय (AI) मॉडेल (Model) वापरत आहात. जर तुमच्या कामात ऑडिओ (Audio) किंवा व्हिज्युअल प्रोसेसिंगची (Visual processing) गरज नसेल, तर त्या संबंधित पॅरामीटर्स (Parameters) लोड (Load) करणे संसाधनांचा अपव्यय आहे. कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) मॉडेलला (Model) फक्त आवश्यक पॅरामीटर्स (Parameters) लोड (Load) करण्याची परवानगी देते, ज्यामुळे मेमरीचा (Memory) वापर कमी होतो आणि कार्यक्षमता सुधारते.

कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) खालीलप्रमाणे कार्य करते:

  1. मॉडेल (Model) सध्याच्या टास्कचे (Task) विश्लेषण करते आणि कोणत्या पॅरामीटर्सची (Parameters) आवश्यकता आहे हे ठरवते.
  2. मॉडेल (Model) फक्त आवश्यक पॅरामीटर्स (Parameters) मेमरीत (Memory) लोड (Load) करते.
  3. टास्क (Task) पूर्ण झाल्यावर, मॉडेल (Model) अनावश्यक पॅरामीटर्स (Parameters) रिलीज (Release) करते.

कंडिशनल पॅरामीटर लोडिंगचे (Conditional Parameter Loading) फायदे:

  • मेमरीचा (Memory) वापर ऑप्टिमाइझ (Optimize) करणे: केवळ आवश्यक पॅरामीटर्स (Parameters) लोड (Load) करून, कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) मेमरीचा (Memory) वापर मोठ्या प्रमाणात ऑप्टिमाइझ (Optimize) करते. हे कमी क्षमता असलेल्या डिव्हाइसवर (Device) एआय (AI) मॉडेल (Model) चालवण्यासाठी महत्त्वाचे आहे.
  • कार्यक्षमता सुधारणे: लोड (Load) केलेल्या पॅरामीटर्सची (Parameters) संख्या कमी करून, कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) कार्यक्षमता सुधारते. त्यामुळे एआय (AI) मॉडेल (Model) युजरच्या (User) विनंतीला अधिक लवकर प्रतिसाद देऊ शकते.
  • डिव्हाइसची (Device) विस्तृत श्रेणी सपोर्ट (Support) करणे: मेमरीचा (Memory) वापर ऑप्टिमाइझ (Optimize) करून, कंडिशनल पॅरामीटर लोडिंग (Conditional Parameter Loading) एआय (AI) मॉडेलला (Model) कमी मेमरी (Memory) असलेल्या उपकरणांवर चालवण्यास मदत करते​.

जेम्मा 3n ची उत्कृष्ट वैशिष्ट्ये

जेम्मा 3n मध्ये अनेक नवीन तंत्रज्ञान आणि वैशिष्ट्ये आहेत, ज्यामुळे डिव्हाइस एंड एआयच्या (Device end AI) शक्यतांची नव्याने व्याख्या केली जात आहे.

याची काही महत्त्वाची वैशिष्ट्ये खालीलप्रमाणे आहेत:

  1. डिव्हाइस एंड परफॉर्मन्स (Device end performance) आणि कार्यक्षमतेत सुधारणा: जेम्मा 3n हे त्याच्या आधीच्या मॉडेलपेक्षा (Gemma 3 4B) जवळपास 1.5 पट जास्त वेगवान आहे, तसेच आउटपुट क्वालि