Arm Kleidi: Arm CPU-களில் AI அனுமானத்தை மேம்படுத்துதல்
AI-யின் அதிவேக பரிணாமம் பன்முக மாதிரி (Multimodal Models)களின் ஒரு புதிய சகாப்தத்தை அறிமுகப்படுத்துகிறது. இந்த அதிநவீன அமைப்புகள் உரை, படங்கள், ஆடியோ, வீடியோ மற்றும் சென்சார் தரவு உள்ளிட்ட பல்வேறு மூலங்களிலிருந்து தகவல்களை செயலாக்குவதற்கும் விளக்குவதற்கும் திறனைக் கொண்டுள்ளன. இருப்பினும், இந்த சக்திவாய்ந்த மாடல்களை எட்ஜ் சாதனங்களில் (Edge Devices) பயன்படுத்துவது குறிப்பிடத்தக்க தடைகளை முன்வைக்கிறது. எட்ஜ் வன்பொருளின் உள்ளார்ந்த வரம்புகளான சக்தி மற்றும் நினைவக திறன், ஒரே நேரத்தில் பல்வேறு தரவு வகைகளை செயலாக்குவதற்கான சிக்கலான பணியுடன் இணைந்து, ஒரு சிக்கலான சவாலை உருவாக்குகிறது.
Arm Kleidi இந்த சவாலை எதிர்கொள்ளும் வகையில் சிறப்பாக வடிவமைக்கப்பட்டுள்ளது, இது Arm CPU-களில் இயங்கும் அனைத்து AI அனுமான பணிச்சுமைகளுக்கும் (AI Inference Workloads) தடையற்ற செயல்திறன் மேம்படுத்தலை வழங்குகிறது. Kleidi-யின் மையத்தில் KleidiAI உள்ளது, இது AI-ஐ துரிதப்படுத்த உருவாக்கப்பட்ட மிகவும் திறமையான, திறந்த மூல Arm நடைமுறைகளின் நெறிப்படுத்தப்பட்ட தொகுப்பாகும்.
KleidiAI ஏற்கனவே எட்ஜ் சாதனங்களுக்கான பரவலாகப் பயன்படுத்தப்படும் AI கட்டமைப்புகளின் சமீபத்திய பதிப்புகளில் ஒருங்கிணைக்கப்பட்டுள்ளது. இவற்றில் ExecuTorch, Llama.cpp, XNNPACK வழியாக LiteRT மற்றும் MediaPipe ஆகியவை அடங்கும். இந்த பரவலான ஒருங்கிணைப்பு மில்லியன் கணக்கான டெவலப்பர்களுக்கு ஒரு குறிப்பிடத்தக்க நன்மையை வழங்குகிறது, அவர்கள் இப்போது எந்த கூடுதல் முயற்சியும் இல்லாமல் AI செயல்திறன் மேம்படுத்தல்களிலிருந்து தானாகவே பயனடையலாம்.
அலிபாபாவுடனான கூட்டு: Qwen2-VL-2B-Instruct மாதிரி
MNN உடனான நெருக்கமான ஒத்துழைப்பின் மூலம் எட்ஜ் சாதனங்களில் பன்முக AI-யின் முன்னேற்றத்தில் ஒரு புதிய மைல்கல் எட்டப்பட்டுள்ளது. MNN என்பது அலிபாபாவால் உருவாக்கப்பட்ட மற்றும் பராமரிக்கப்படும் இலகுரக, திறந்த மூல ஆழமான கற்றல் கட்டமைப்பாகும் (Deep Learning Framework). இந்த கூட்டாண்மை KleidiAI-யின் வெற்றிகரமான ஒருங்கிணைப்புக்கு வழிவகுத்தது, இது Arm CPU-களைப் பயன்படுத்தி மொபைல் சாதனங்களில் பன்முக AI பணிச்சுமைகளை திறமையாக இயக்க உதவுகிறது. இந்த சாதனைக்கு முக்கியமானது அலிபாபாவின் அறிவுறுத்தல்-சரிசெய்யப்பட்ட (Instruction-Tuned) 2B அளவுரு Qwen2-VL-2B-Instruct மாதிரி ஆகும். இந்த மாதிரி குறிப்பாக படத்தைப் புரிந்துகொள்வதற்கும், உரையிலிருந்து பட பகுத்தறிவு (Text-to-Image Reasoning) செய்வதற்கும், பல மொழிகளில் பன்முக தலைமுறைக்கும் (Multimodal Generation) வடிவமைக்கப்பட்டுள்ளது, இவை அனைத்தும் எட்ஜ் சாதனங்களின் கட்டுப்பாடுகளுக்கு ஏற்ப வடிவமைக்கப்பட்டுள்ளன.
அளவிடக்கூடிய செயல்திறன் ஆதாயங்கள்
KleidiAI-ஐ MNN உடன் ஒருங்கிணைப்பது Qwen2-VL-2B-Instruct மாதிரிக்கான குறிப்பிடத்தக்க, அளவிடக்கூடிய செயல்திறன் மேம்பாடுகளை அளித்துள்ளது. எட்ஜில் முக்கியமான AI பன்முக பயன்பாட்டு நிகழ்வுகளில் வேகமான பதிலளிப்பு நேரங்கள் காணப்பட்டுள்ளன. இந்த மேம்பாடுகள் பல்வேறு வாடிக்கையாளர் சார்ந்த அலிபாபா பயன்பாடுகளில் மேம்பட்ட பயனர் அனுபவங்களைத் திறக்கின்றன. உதாரணங்கள் பின்வருமாறு:
- வாடிக்கையாளர் சேவைக்கான சாட்போட்கள் (Chatbots): வாடிக்கையாளர் விசாரணைகளுக்கு விரைவான மற்றும் திறமையான பதில்களை வழங்குதல்.
- மின்-ஷாப்பிங் பயன்பாடுகள்: புகைப்படத்திலிருந்து பொருட்களைத் தேடும் வசதியை செயல்படுத்துதல், வாடிக்கையாளர்கள் ஒரு படத்தை பதிவேற்றுவதன் மூலம் அவர்கள் தேடும் பொருட்களை விரைவாகக் கண்டறிய அனுமதிக்கிறது.
இந்த பயன்பாடுகளில் மேம்பட்ட வேகம் கணிசமான செயல்திறன் ஆதாயங்களின் நேரடி விளைவாகும்:
- முன் நிரப்புதல் மேம்பாடு (Pre-fill Improvement): முன் நிரப்புதலில் குறிப்பிடத்தக்க 57 சதவீத செயல்திறன் மேம்பாடு அடையப்பட்டுள்ளது. இது AI மாதிரிகள் பதிலைத் உருவாக்குவதற்கு முன் பல மூல தூண்டுதல் உள்ளீடுகளை (Multi-Source Prompt Inputs) கையாளும் முக்கியமான கட்டத்தைக் குறிக்கிறது.
- டிகோட் மேம்பாடு (Decode Enhancement): டிகோடில் குறிப்பிடத்தக்க 28 சதவீத செயல்திறன் மேம்பாடு காணப்பட்டுள்ளது. இது AI மாதிரி ஒரு தூண்டுதலைச் செயலாக்கிய பிறகு உரையை உருவாக்கும் செயல்முறையாகும்.
வேகத்திற்கு அப்பால், KleidiAI ஒருங்கிணைப்பு எட்ஜில் AI பணிச்சுமைகளை மிகவும் திறமையாக செயலாக்குவதற்கும் பங்களிக்கிறது. இது பன்முக பணிச்சுமைகளுடன் தொடர்புடைய ஒட்டுமொத்த கணக்கீட்டு செலவைக் குறைப்பதன் மூலம் அடையப்படுகிறது. இந்த செயல்திறன் மற்றும் திறன் ஆதாயங்கள் மில்லியன் கணக்கான டெவலப்பர்களுக்கு உடனடியாக கிடைக்கின்றன. MNN கட்டமைப்பில் பயன்பாடுகளையும் பணிச்சுமைகளையும் இயக்கும் எந்த டெவலப்பரும், KleidiAI ஒருங்கிணைக்கப்பட்ட எட்ஜ் சாதனங்களுக்கான பிற பிரபலமான AI கட்டமைப்புகளும் உடனடியாகப் பயனடையலாம்.
உண்மையான உலக செயல்விளக்கம்: MWC காட்சிப்படுத்தல்
Qwen2-VL-2B-Instruct மாதிரியின் நடைமுறை திறன்கள், MNN உடனான புதிய KleidiAI ஒருங்கிணைப்பால் இயக்கப்படுகிறது, இது Mobile World Congress (MWC)-ல் காட்சிப்படுத்தப்பட்டது. Arm அரங்கில் ஒரு செயல்விளக்கம் காட்சி மற்றும் உரை உள்ளீடுகளின் பல்வேறு சேர்க்கைகளைப் புரிந்துகொள்ளும் மாதிரியின் திறனை எடுத்துக்காட்டுகிறது. மாதிரி பின்னர் படத்தின் உள்ளடக்கத்தின் சுருக்கமான சுருக்கத்துடன் பதிலளித்தது. இந்த முழு செயல்முறையும் ஸ்மார்ட்போன்களின் Arm CPU-வில் செயல்படுத்தப்பட்டது, இது தீர்வின் சக்தி மற்றும் செயல்திறனைக் காட்டுகிறது. இந்த ஸ்மார்ட்போன்கள் MediaTek-யின் Arm-இயங்கும் Dimensity 9400 மொபைல் சிஸ்டம்-ஆன்-சிப் (SoC) இல் உருவாக்கப்பட்டன, இதில் vivo X200 தொடரும் அடங்கும்.
பயனர் அனுபவத்தில் ஒரு குறிப்பிடத்தக்க படி
Arm-ன் KleidiAI-ஐ அலிபாபாவின் Qwen2-VL-2B-Instruct மாதிரிக்கான MNN கட்டமைப்புடன் ஒருங்கிணைப்பது பன்முக AI பணிச்சுமைகளுக்கான பயனர் அனுபவத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது. இந்த முன்னேற்றம் இந்த மேம்பட்ட அனுபவங்களை நேரடியாக எட்ஜில் வழங்குகிறது, இவை அனைத்தும் Arm CPU-ஆல் இயக்கப்படுகின்றன. இந்த திறன்கள் மொபைல் சாதனங்களில் உடனடியாக கிடைக்கின்றன, முன்னணி வாடிக்கையாளர் எதிர்கொள்ளும் பயன்பாடுகள் ஏற்கனவே KleidiAI-யின் நன்மைகளைப் பயன்படுத்துகின்றன.
எட்ஜ் சாதனங்களில் பன்முக AI-யின் எதிர்காலம்
எதிர்காலத்தைப் பார்க்கும்போது, AI பணிச்சுமைகளுக்கான KleidiAI-யின் தடையற்ற மேம்படுத்தல்கள் மில்லியன் கணக்கான டெவலப்பர்களுக்கு தொடர்ந்து அதிகாரம் அளிக்கும். அவர்கள் எட்ஜ் சாதனங்களில் பெருகிய முறையில் அதிநவீன பன்முக அனுபவங்களை உருவாக்க முடியும். இந்த தொடர்ச்சியான கண்டுபிடிப்பு AI-யின் தொடர்ச்சியான பரிணாம வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க படியாக, அறிவார்ந்த கணினியின் (Intelligent Computing) அடுத்த அலைக்கு வழி வகுக்கும்.
அலிபாபா தலைமையின் மேற்கோள்கள்
‘அலிபாபா கிளவுட்’ன் பெரிய மொழி மாதிரி Qwen, Arm KleidiAI மற்றும் MNN ஆகியவற்றுக்கு இடையேயான ஒத்துழைப்பைக் கண்டு நாங்கள் மகிழ்ச்சியடைகிறோம். MNN’ன் ஆன்-டிவைஸ் அனுமான கட்டமைப்பை Arm KleidiAI உடன் ஒருங்கிணைப்பது Qwen’ன் தாமதம் மற்றும் ஆற்றல் திறனை கணிசமாக மேம்படுத்தியுள்ளது. இந்த கூட்டாண்மை மொபைல் சாதனங்களில் LLMகளின் திறனை உறுதிப்படுத்துகிறது மற்றும் AI பயனர் அனுபவத்தை மேம்படுத்துகிறது. ஆன்-டிவைஸ் AI கணினியை மேம்படுத்துவதில் தொடர்ச்சியான முயற்சிகளை நாங்கள் எதிர்நோக்குகிறோம்.’ - டோங் சூ, GM of Tongyi Large Model Business, Alibaba Cloud.
‘MNN அனுமான கட்டமைப்பு மற்றும் Arm KleidiAI ஆகியவற்றுக்கு இடையேயான தொழில்நுட்ப ஒருங்கிணைப்பு ஆன்-டிவைஸ் முடுக்கத்தில் ஒரு பெரிய திருப்புமுனையைக் குறிக்கிறது. கட்டமைப்பின் கூட்டு உகப்பாக்கத்துடன், Tongyi LLM’ன் ஆன்-டிவைஸ் அனுமான செயல்திறனை நாங்கள் பெரிதும் மேம்படுத்தியுள்ளோம், இது வரையறுக்கப்பட்ட மொபைல் கணினி சக்திக்கும் மேம்பட்ட AI திறன்களுக்கும் இடையிலான இடைவெளியைக் குறைக்கிறது. இந்த சாதனை எங்கள் தொழில்நுட்ப நிபுணத்துவத்தையும் குறுக்கு-தொழில் ஒத்துழைப்பையும் எடுத்துக்காட்டுகிறது. ஆன்-டிவைஸ் கணினி சுற்றுச்சூழல் அமைப்பை மேம்படுத்த, மொபைலில் மென்மையான மற்றும் திறமையான AI அனுபவங்களை வழங்க இந்த கூட்டாண்மையை தொடர நாங்கள் எதிர்நோக்குகிறோம்.’ - சியாவோடாங் ஜியாங், Head of MNN, Taobao and Tmall Group, Alibaba.
தொழில்நுட்ப அம்சங்களை ஆழமாக ஆராய்தல்
இந்த ஒத்துழைப்பின் முக்கியத்துவத்தை முழுமையாகப் பாராட்ட, சில அடிப்படை தொழில்நுட்ப விவரங்களை ஆராய்வது உதவியாக இருக்கும்.
MNN-ன் பங்கு
MNN-ன் வடிவமைப்பு தத்துவம் திறன் மற்றும் பெயர்வுத்திறனை (Portability) மையமாகக் கொண்டுள்ளது. இது பல முக்கிய அம்சங்கள் மூலம் இதை அடைகிறது:
- இலகுரக கட்டமைப்பு: MNN ஒரு சிறிய அடிச்சுவட்டைக் கொண்டிருக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது, இது எட்ஜ் சாதனங்களில் சேமிப்பு மற்றும் நினைவக தேவைகளை குறைக்கிறது.
- உகந்த செயல்பாடுகள்: இந்த கட்டமைப்பு Arm CPU-களுக்கு குறிப்பாக வடிவமைக்கப்பட்ட மிகவும் உகந்த கணித செயல்பாடுகளை உள்ளடக்கியது, இது செயல்திறனை அதிகரிக்கிறது.
- குறுக்கு-தளம் இணக்கத்தன்மை (Cross-Platform Compatibility): MNN பரந்த அளவிலான இயக்க முறைமைகள் மற்றும் வன்பொருள் தளங்களை ஆதரிக்கிறது, இது டெவலப்பர்களுக்கான ஒரு பல்துறை தேர்வாக அமைகிறது.
KleidiAI-யின் பங்களிப்பு
KleidiAI MNN-ன் பலங்களை பூர்த்தி செய்கிறது, இது AI அனுமானத்தை மேலும் துரிதப்படுத்தும் சிறப்பு நடைமுறைகளின் தொகுப்பை வழங்குகிறது. இந்த நடைமுறைகள் Arm-ன் CPU கட்டமைப்பில் உள்ள விரிவான அனுபவத்தைப் பயன்படுத்தி, மற்றபடி அடைய கடினமாக இருக்கும் செயல்திறன் ஆதாயங்களைத் திறக்கின்றன. KleidiAI-யின் பங்களிப்பின் முக்கிய அம்சங்கள் பின்வருமாறு:
- மிகவும் உகந்த கர்னல்கள் (Highly Optimized Kernels): KleidiAI மேட்ரிக்ஸ் பெருக்கல் மற்றும் சுருள்வு (Convolution) போன்ற பொதுவான AI செயல்பாடுகளுக்கு மிகவும் உகந்த கர்னல்களை வழங்குகிறது. இந்த கர்னல்கள் Arm CPU-களின் குறிப்பிட்ட அம்சங்களைப் பயன்படுத்திக் கொள்ளும் வகையில் கவனமாக வடிவமைக்கப்பட்டுள்ளன.
- தானியங்கி ஒருங்கிணைப்பு: பிரபலமான AI கட்டமைப்புகளில் KleidiAI-யின் தடையற்ற ஒருங்கிணைப்பு என்பது டெவலப்பர்கள் இந்த மேம்படுத்தல்களை கைமுறையாக இணைக்க வேண்டியதில்லை என்பதாகும். செயல்திறன் நன்மைகள் தானாகவே பயன்படுத்தப்படுகின்றன, இது மேம்பாட்டு செயல்முறையை எளிதாக்குகிறது.
- தொடர்ச்சியான முன்னேற்றம்: Arm KleidiAI-ஐ தொடர்ந்து புதுப்பித்து மேம்படுத்துவதில் உறுதியாக உள்ளது, இது AI முடுக்கம் தொழில்நுட்பத்தில் முன்னணியில் இருப்பதை உறுதி செய்கிறது.
Qwen2-VL-2B-Instruct: ஒரு சக்திவாய்ந்த பன்முக மாதிரி
Qwen2-VL-2B-Instruct மாதிரி அலிபாபாவின் பெரிய மொழி மாதிரிகள் மற்றும் பன்முக AI-யில் உள்ள நிபுணத்துவத்திற்கு ஒரு சான்றாகும். அதன் முக்கிய அம்சங்கள் பின்வருமாறு:
- அறிவுறுத்தல் சரிசெய்தல்: மாதிரி குறிப்பாக அறிவுறுத்தல்களைப் பின்பற்றுவதற்கு ஏற்றவாறு வடிவமைக்கப்பட்டுள்ளது, இது பரந்த அளவிலான பணிகளுக்கு மிகவும் ஏற்றதாக அமைகிறது.
- பன்முக திறன்கள்: இது காட்சி மற்றும் உரை தகவல்களைப் புரிந்துகொள்வதிலும் செயலாக்குவதிலும் சிறந்து விளங்குகிறது, இது பட தலைப்பு (Image Captioning) மற்றும் காட்சி கேள்வி பதில் (Visual Question Answering) போன்ற பயன்பாடுகளை செயல்படுத்துகிறது.
- பன்மொழி ஆதரவு: மாதிரி பல மொழிகளுடன் வேலை செய்யும் வகையில் வடிவமைக்கப்பட்டுள்ளது, இது பல்வேறு பிராந்தியங்கள் மற்றும் பயனர் தளங்களில் அதன் பயன்பாட்டை விரிவுபடுத்துகிறது.
- எட்ஜ் சாதனங்களுக்கு உகந்தது: அதன் சக்திவாய்ந்த திறன்கள் இருந்தபோதிலும், மாதிரி எட்ஜ் சாதனங்களின் வள கட்டுப்பாடுகளுக்குள் செயல்படும் வகையில் கவனமாக வடிவமைக்கப்பட்டுள்ளது.
பன்முக AI-யின் நோக்கத்தை விரிவுபடுத்துதல்
இங்கே விவாதிக்கப்பட்ட முன்னேற்றங்கள் ஸ்மார்ட்போன்களுக்கு மட்டும் அல்ல. அதே கொள்கைகள் மற்றும் தொழில்நுட்பங்களை பரந்த அளவிலான எட்ஜ் சாதனங்களுக்கும் பயன்படுத்தலாம், அவற்றுள்:
- ஸ்மார்ட் ஹோம் சாதனங்கள்: குரல் உதவியாளர்கள் (Voice Assistants), பாதுகாப்பு கேமராக்களுக்கான பட அங்கீகாரம் (Image Recognition) மற்றும் பிற அறிவார்ந்த அம்சங்களை செயல்படுத்துதல்.
- அணியக்கூடிய சாதனங்கள்: சுகாதார கண்காணிப்பு, உடற்பயிற்சி கண்காணிப்பு மற்றும் ஆக்மென்டட் ரியாலிட்டி (Augmented Reality) பயன்பாடுகளை இயக்குதல்.
- தொழில்துறை IoT: உற்பத்தி அமைப்புகளில் முன்கணிப்பு பராமரிப்பு (Predictive Maintenance), தரக் கட்டுப்பாடு (Quality Control) மற்றும் ஆட்டோமேஷன் (Automation) ஆகியவற்றை எளிதாக்குதல்.
- வாகனம்: ஓட்டுநர் உதவி அமைப்புகள், கேபின் உள்ளே பொழுதுபோக்கு (In-Cabin Entertainment) மற்றும் தன்னாட்சி ஓட்டுநர் (Autonomous Driving) திறன்களை மேம்படுத்துதல்.
எட்ஜில் பன்முக AI-யின் சாத்தியமான பயன்பாடுகள் பரந்தவை மற்றும் தொடர்ந்து விரிவடைகின்றன. மாதிரிகள் மிகவும் அதிநவீனமாகி வருவதாலும், வன்பொருள் மிகவும் சக்திவாய்ந்ததாகி வருவதாலும், இன்னும் புதுமையான மற்றும் தாக்கத்தை ஏற்படுத்தும் பயன்பாட்டு நிகழ்வுகள் வெளிப்படுவதை நாம் எதிர்பார்க்கலாம். Arm மற்றும் அலிபாபா இடையேயான இந்த ஒத்துழைப்பு அந்த திசையில் ஒரு குறிப்பிடத்தக்க படியாகும், இது பன்முக AI-யின் சக்தியை பரந்த பார்வையாளர்களுக்கு கொண்டு வருகிறது மற்றும் அறிவார்ந்த சாதனங்களின் புதிய தலைமுறையை செயல்படுத்துகிறது. திறன், செயல்திறன் மற்றும் டெவலப்பர் அணுகல் ஆகியவற்றில் கவனம் செலுத்துவது இந்த முன்னேற்றங்கள் தொழில்நுட்பத்தின் எதிர்காலத்தில் பரந்த மற்றும் நீடித்த தாக்கத்தை ஏற்படுத்தும் என்பதை உறுதி செய்கிறது.