Pixtral 12B பற்றிய ஒரு ஆழமான பார்வை
Pixtral 12B, Mistral’இன் VLMs க்கான முதல் முயற்சியாகும், இது பலவிதமான பெஞ்ச்மார்க்குகளில் ஈர்க்கக்கூடிய செயல்திறனைக் காட்டுகிறது. Mistral’இன் அக மதிப்பீடுகளின்படி, இது மற்ற ஓப்பன் மாடல்களை விட சிறப்பாக செயல்படுகிறது மற்றும் பெரிய மாடல்களுடன் போட்டியிடுகிறது. Pixtral படம் மற்றும் ஆவண புரிதலுக்காக வடிவமைக்கப்பட்டுள்ளது, பார்வை சார்ந்த பணிகளில் மேம்பட்ட திறன்களை வெளிப்படுத்துகிறது. வரைபடங்கள் மற்றும் புள்ளிவிவரங்களை விளக்குவது, ஆவண உள்ளடக்கத்தைப் பற்றிய கேள்விகளுக்கு பதிலளிப்பது, பன்முக பகுத்தறிவில் ஈடுபடுவது மற்றும் வழிமுறைகளை உன்னிப்பாகப் பின்பற்றுவது ஆகியவை இதில் அடங்கும். இந்த மாதிரியின் முக்கிய அம்சம், படங்களை அவற்றின் நேட்டிவ் ரெசல்யூஷன் மற்றும் ஆஸ்பெக்ட் ரேஷியோவில் செயலாக்குவதற்கான திறன் ஆகும், இது உயர்-நம்பகத்தன்மை உள்ளீட்டு கையாளுதலை உறுதி செய்கிறது. மேலும், பல ஓப்பன் சோர்ஸ் மாற்றுகளைப் போலல்லாமல், Pixtral 12B உரை அடிப்படையிலான பெஞ்ச்மார்க்குகளில் சிறந்த முடிவுகளை அடைகிறது - அதன் பன்முக பணி செயல்திறனில் சமரசம் செய்யாமல், அறிவுறுத்தல் பின்பற்றுதல், கோடிங் மற்றும் கணித பகுத்தறிவு ஆகியவற்றில் தேர்ச்சியை நிரூபிக்கிறது.
Pixtral 12B இன் பின்னால் உள்ள கண்டுபிடிப்பு, Mistral’இன் நாவல் ஆர்கிடெக்சரில் உள்ளது, இது கணிப்பு திறன் மற்றும் உயர் செயல்திறன் ஆகிய இரண்டிற்கும் உன்னிப்பாக வடிவமைக்கப்பட்டுள்ளது. இந்த மாதிரி இரண்டு முக்கிய கூறுகளைக் கொண்டுள்ளது: 400-மில்லியன்-அளவுரு விஷன் என்கோடர், படங்களை டோக்கனைஸ் செய்யும் பணியை மேற்கொள்கிறது, மற்றும் 12-பில்லியன்-அளவுரு மல்டிமோடல் டிரான்ஸ்ஃபார்மர் டிகோடர். இந்த டிகோடர் கொடுக்கப்பட்ட உரை மற்றும் படங்களின் வரிசையின் அடிப்படையில் அடுத்தடுத்த உரை டோக்கனை கணிக்கிறது. விஷன் என்கோடர் குறிப்பாக மாறி பட அளவுகளை நேட்டிவ்வாக கையாள பயிற்சி அளிக்கப்படுகிறது. இது Pixtral ஐ உயர்-ரெசல்யூஷன் வரைபடங்கள், விளக்கப்படங்கள் மற்றும் ஆவணங்களை துல்லியமாக விளக்கவும், அதே நேரத்தில் சிறிய படங்களான ஐகான்கள், கிளிபார்ட் மற்றும் சமன்பாடுகள் ஆகியவற்றிற்கான விரைவான அனுமான வேகத்தை பராமரிக்கவும் அனுமதிக்கிறது. இந்த கவனமாக வடிவமைக்கப்பட்ட கட்டமைப்பு 128,000 டோக்கன்களின் கணிசமான சூழல் சாளரத்திற்குள், மாறுபட்ட அளவுகளின் தன்னிச்சையான படங்களை செயலாக்குவதை ஆதரிக்கிறது.
ஓப்பன்-வெயிட் மாடல்களைப் பயன்படுத்தும் போது, உரிம ஒப்பந்தங்கள் மிக முக்கியமான கருத்தாகும். Mistral 7B, Mixtral 8x7B, Mixtral 8x22B மற்றும் Mistral Nemo 12B போன்ற பிற Mistral மாடல்களின் உரிம அணுகுமுறையைப் பிரதிபலிக்கும் வகையில், Pixtral 12B வணிக ரீதியாக அனுமதிக்கக்கூடிய Apache 2.0 உரிமத்தின் கீழ் வெளியிடப்படுகிறது. இது எண்டர்பிரைஸ் மற்றும் ஸ்டார்ட்அப் வாடிக்கையாளர்களுக்கு உயர் செயல்திறன் கொண்ட VLM விருப்பத்தை வழங்குகிறது, அதிநவீன பன்முக பயன்பாடுகளை உருவாக்க அவர்களுக்கு அதிகாரம் அளிக்கிறது.
செயல்திறன் அளவீடுகள் மற்றும் பெஞ்ச்மார்க்குகள்: ஒரு நெருக்கமான பார்வை
Pixtral 12B இயற்கை படங்கள் மற்றும் ஆவணங்கள் இரண்டையும் புரிந்துகொள்ள உன்னிப்பாக பயிற்சி அளிக்கப்படுகிறது. Mistral ஆல் அறிவிக்கப்பட்டபடி, இது பாரிய மல்டிடாஸ்க் மொழி புரிதல் (MMLU) பகுத்தறிவு பெஞ்ச்மார்க்கில் 52.5% மதிப்பெண்ணை அடைந்தது, பல பெரிய மாடல்களை விட சிறப்பாக செயல்பட்டது. MMLU பெஞ்ச்மார்க் ஒரு கடுமையான சோதனையாக செயல்படுகிறது, இது ஒரு மொழி மாதிரியின் பல்வேறு பாடங்களில் மொழியைப் புரிந்துகொண்டு பயன்படுத்துவதற்கான திறனை மதிப்பிடுகிறது. MMLU கணிதம், தத்துவம், சட்டம் மற்றும் மருத்துவம் உள்ளிட்ட பல்வேறு கல்வித் துறைகளில் 10,000 க்கும் மேற்பட்ட பல தேர்வு கேள்விகளைக் கொண்டுள்ளது.
Pixtral 12B விளக்கப்படங்கள் மற்றும் புள்ளிவிவரங்களைப் புரிந்துகொள்வது, ஆவண உள்ளடக்கத்தின் அடிப்படையில் கேள்விகளுக்குப் பதிலளிப்பது, பன்முக பகுத்தறிவில் ஈடுபடுவது மற்றும் வழிமுறைகளைப் பின்பற்றுவது போன்ற பணிகளில் வலுவான திறன்களை நிரூபிக்கிறது. படங்களை அவற்றின் இயல்பான ரெசல்யூஷன் மற்றும் ஆஸ்பெக்ட் ரேஷியோவில் உள்வாங்கும் மாதிரியின் திறன், பட செயலாக்கத்திற்கு பயன்படுத்தப்படும் டோக்கன்களின் எண்ணிக்கையில் பயனர்களுக்கு நெகிழ்வுத்தன்மையை வழங்குகிறது. கூடுதலாக, Pixtral அதன் விரிவான 128,000-டோக்கன் சூழல் சாளரத்திற்குள் பல படங்களை செயலாக்க முடியும். குறிப்பாக, முந்தைய ஓப்பன் சோர்ஸ் மாடல்களுக்கு மாறாக, Mistral’இன் கண்டுபிடிப்புகளின்படி, Pixtral பன்முக பணிகளில் சிறந்து விளங்குவதற்காக உரை பெஞ்ச்மார்க்குகளில் செயல்திறனை தியாகம் செய்யாது.
Amazon Bedrock Marketplace இல் Pixtral 12B ஐ வரிசைப்படுத்துதல்: படிப்படியான வழிகாட்டி
Amazon Bedrock கன்சோல் குறிப்பிட்ட பயன்பாட்டு வழக்குகள் அல்லது மொழிகளுக்கு ஏற்ப மாடல்களைத் தேடுவதை எளிதாக்குகிறது. தேடல் முடிவுகள் சர்வர்லெஸ் மாடல்கள் மற்றும் Amazon Bedrock Marketplace மூலம் கிடைக்கும் மாடல்கள் இரண்டையும் உள்ளடக்கியது. பயனர்கள் வழங்குநர், முறைமை (எ.கா., உரை, படம் அல்லது ஆடியோ) அல்லது பணி (எ.கா., வகைப்பாடு அல்லது உரை சுருக்கம்) ஆகியவற்றின் அடிப்படையில் முடிவுகளை வடிகட்டுவதன் மூலம் தங்கள் தேடலைச் செம்மைப்படுத்தலாம்.
Amazon Bedrock Marketplace க்குள் Pixtral 12B ஐ அணுக, இந்த விரிவான வழிமுறைகளைப் பின்பற்றவும்:
மாடல் கேட்டலாக்கிற்கு செல்லவும்: Amazon Bedrock கன்சோலுக்குள், நேவிகேஷன் பேனில் ‘Foundation models’ பிரிவின் கீழ் ‘Model catalog’ என்பதைக் கண்டுபிடித்து தேர்ந்தெடுக்கவும்.
Pixtral 12B ஐ வடிகட்டி தேர்ந்தெடுக்கவும்: வழங்குநராக ‘Hugging Face’ என்பதைத் தேர்ந்தெடுத்து, பின்னர் Pixtral 12B மாடலைத் தேர்ந்தெடுப்பதன் மூலம் மாடல் பட்டியலைச் செம்மைப்படுத்தவும். மாற்றாக, ‘Filter for a model’ இன்புட் பாக்ஸில் நேரடியாக ‘Pixtral’ என்று தேடலாம்.
மாடல் விவரங்களை மதிப்பாய்வு செய்யவும்: மாடல் விவரப் பக்கம் மாடலின் திறன்கள், விலை அமைப்பு மற்றும் செயலாக்க வழிகாட்டுதல்கள் தொடர்பான முக்கியமான தகவல்களை வழங்குகிறது. இந்தப் பக்கம் விரிவான பயன்பாட்டு வழிமுறைகளை வழங்குகிறது, இதில் மாதிரி API அழைப்புகள் மற்றும் குறியீடு துணுக்குகள் ஒருங்கிணைப்பை எளிதாக்குகின்றன. இது Pixtral 12B ஐ உங்கள் பயன்பாடுகளில் இணைக்கும் செயல்முறையை நெறிப்படுத்த வரிசைப்படுத்தல் விருப்பங்கள் மற்றும் உரிம தகவலையும் வழங்குகிறது.
வரிசைப்படுத்தலைத் தொடங்கவும்: Pixtral 12B ஐப் பயன்படுத்தத் தொடங்க, ‘Deploy’ பொத்தானைக் கிளிக் செய்யவும்.
வரிசைப்படுத்தல் அமைப்புகளை உள்ளமைக்கவும்: Pixtral 12B க்கான வரிசைப்படுத்தல் விவரங்களை உள்ளமைக்கும்படி கேட்கப்படுவீர்கள். மாடல் ஐடி உங்கள் வசதிக்காக முன்பே நிரப்பப்படும்.
இறுதி பயனர் உரிம ஒப்பந்தத்தை (EULA) ஏற்கவும்: இறுதி பயனர் உரிம ஒப்பந்தத்தை (EULA) கவனமாகப் படித்து ஏற்கவும்.
எண்ட்பாயிண்ட் பெயர்: ‘Endpoint Name’ தானாகவே நிரப்பப்படும்; இருப்பினும், வாடிக்கையாளர்கள் எண்ட்பாயிண்ட்டை மறுபெயரிடுவதற்கான விருப்பம் உள்ளது.
இன்ஸ்டன்ஸ்களின் எண்ணிக்கை: 1 முதல் 100 வரையிலான விரும்பிய இன்ஸ்டன்ஸ்களின் எண்ணிக்கையைக் குறிப்பிடவும்.
இன்ஸ்டன்ஸ் வகை: உங்களுக்கு விருப்பமான இன்ஸ்டன்ஸ் வகையைத் தேர்ந்தெடுக்கவும். Pixtral 12B உடன் உகந்த செயல்திறனுக்காக, ml.g6.12xlarge போன்ற GPU அடிப்படையிலான இன்ஸ்டன்ஸ் வகை பரிந்துரைக்கப்படுகிறது.
மேம்பட்ட அமைப்புகள் (விரும்பினால்): விருப்பமாக, நீங்கள் மேம்பட்ட பாதுகாப்பு மற்றும் உள்கட்டமைப்பு அமைப்புகளை உள்ளமைக்கலாம். இதில் விர்ச்சுவல் பிரைவேட் கிளவுட் (VPC) நெட்வொர்க்கிங், சர்வீஸ் ரோல் அனுமதிகள் மற்றும் என்க்ரிப்ஷன் அமைப்புகள் ஆகியவை அடங்கும். இயல்புநிலை அமைப்புகள் பெரும்பாலான பயன்பாட்டு நிகழ்வுகளுக்கு ஏற்றதாக இருந்தாலும், தயாரிப்பு வரிசைப்படுத்தல்களுக்கு, உங்கள் நிறுவனத்தின் பாதுகாப்பு மற்றும் இணக்கத் தேவைகளுடன் சீரமைப்பை உறுதிப்படுத்த இந்த அமைப்புகளை மதிப்பாய்வு செய்வது நல்லது.
மாடலை வரிசைப்படுத்தவும்: மாடல் வரிசைப்படுத்தல் செயல்முறையைத் தொடங்க ‘Deploy’ என்பதைக் கிளிக் செய்யவும்.
வரிசைப்படுத்தல் நிலையை கண்காணிக்கவும்: வரிசைப்படுத்தல் முடிந்ததும், ‘Endpoint status’ ‘In Service’ க்கு மாற வேண்டும். எண்ட்பாயிண்ட் செயலில் இருந்த பிறகு, Amazon Bedrock பிளேகிரவுண்டிற்குள் Pixtral 12B இன் திறன்களை நீங்கள் நேரடியாக சோதிக்கலாம்.
பிளேகிரவுண்டை அணுகவும்: ஒரு ஊடாடும் இடைமுகத்தை அணுக ‘Open in playground’ என்பதைத் தேர்ந்தெடுக்கவும். இந்த இடைமுகம் பல்வேறு ப்ராம்ப்ட்களுடன் பரிசோதனை செய்யவும், வெப்பநிலை மற்றும் அதிகபட்ச நீளம் போன்ற மாடல் அளவுருக்களை சரிசெய்யவும் உங்களை அனுமதிக்கிறது.
பிளேகிரவுண்ட் உங்கள் பயன்பாடுகளில் ஒருங்கிணைப்பதற்கு முன் மாடலின் பகுத்தறிவு மற்றும் உரை உருவாக்க திறன்களை ஆராய்வதற்கான சிறந்த சூழலை வழங்குகிறது. இது உடனடி கருத்தை வழங்குகிறது, மாடல் வெவ்வேறு உள்ளீடுகளுக்கு எவ்வாறு பதிலளிக்கிறது என்பதைப் புரிந்துகொள்ளவும், உகந்த முடிவுகளுக்கு உங்கள் ப்ராம்ப்ட்களை நன்றாகச் சரிசெய்யவும் உதவுகிறது.
பிளேகிரவுண்ட் UI மூலம் விரைவான சோதனையை அனுமதிக்கும் அதே வேளையில், Amazon Bedrock APIகளைப் பயன்படுத்தி வரிசைப்படுத்தப்பட்ட மாடலை நிரல் ரீதியாக இயக்குவதற்கு, Amazon Bedrock SDK இல் model-id
ஆக எண்ட்பாயிண்ட் ARN ஐப் பயன்படுத்த வேண்டும்.
Pixtral 12B பயன்பாட்டு நிகழ்வுகளை ஆராய்தல்
இந்த பிரிவு Pixtral 12B இன் திறன்களின் நடைமுறை எடுத்துக்காட்டுகளில் கவனம் செலுத்துகிறது, மாதிரி ப்ராம்ப்ட்கள் மூலம் அதன் பன்முகத்தன்மையைக் காட்டுகிறது.
விஷுவல் லாஜிக்கல் ரீசனிங்: ஒரு சக்திவாய்ந்த பயன்பாடு
விஷன் மாடல்களின் மிகவும் கட்டாயமான பயன்பாடுகளில் ஒன்று, லாஜிக்கல் ரீசனிங் சிக்கல்கள் அல்லது விஷுவல் புதிர்களைத் தீர்ப்பதற்கான அவற்றின் திறன் ஆகும். Pixtral 12B விஷன் மாடல்கள் லாஜிக்கல் ரீசனிங் கேள்விகளைக் கையாள்வதில் விதிவிலக்கான திறமையை நிரூபிக்கின்றன. இந்த திறனை விளக்குவதற்கு ஒரு குறிப்பிட்ட உதாரணத்தை ஆராய்வோம். முக்கிய வலிமை படத்தை பார்ப்பது மட்டுமல்லாமல், வடிவங்களை பிரித்தெடுத்து லாஜிக்கைப் பயன்படுத்துவதும் ஆகும். பெரிய மொழி மாதிரி திறன்கள் ஒரு பதிலை வழங்க பயன்படுத்தப்படுகின்றன.
எடுத்துக்காட்டு:
வடிவங்களின் வரிசை வழங்கப்படும் ஒரு விஷுவல் புதிரை கற்பனை செய்து பாருங்கள், மேலும் மறைக்கப்பட்ட வடிவத்தின் அடிப்படையில் வரிசையில் அடுத்த வடிவத்தை தீர்மானிப்பதே பணியாகும்.
ப்ராம்ப்ட்: “பின்வரும் வடிவங்களின் வரிசையை ஆராய்ந்து, தொடரில் அடுத்த வடிவத்தை கணிக்கவும். உங்கள் பகுத்தறிவை விளக்கவும்.”
உள்ளீட்டு பேலோட்: (வடிவங்களின் வரிசையை சித்தரிக்கும் ஒரு படம்)
எதிர்பார்க்கப்படும் வெளியீடு: Pixtral 12B சிறப்பாக:
- வடிவத்தை அடையாளம் காணவும்: வடிவங்களின் வரிசையை நிர்வகிக்கும் அடிப்படை வடிவத்தை சரியாகப் புரிந்துகொள்ளுங்கள். இது வடிவம், நிறம், நோக்குநிலை அல்லது இந்த காரணிகளின் கலவையில் ஏற்படும் மாற்றங்களை அங்கீகரிப்பதை உள்ளடக்கியிருக்கலாம்.
- அடுத்த வடிவத்தை கணிக்கவும்: அடையாளம் காணப்பட்ட வடிவத்தின் அடிப்படையில், வரிசையில் அடுத்த வடிவத்தின் பண்புகளை துல்லியமாக கணிக்கவும்.
- பகுத்தறிவை விளக்கவும்: கணிப்புக்கு வர எடுக்கப்பட்ட லாஜிக்கல் படிகளை தெளிவாகக் கூறுங்கள், அடுத்த வடிவத்தை தீர்மானிக்க அடையாளம் காணப்பட்ட வடிவம் எவ்வாறு பயன்படுத்தப்பட்டது என்பதை விளக்குகிறது.
இந்த உதாரணம் Pixtral 12B இன் விஷுவல் தகவலை செயலாக்குவது மட்டுமல்லாமல், தகவலை விளக்குவதற்கும் கணிப்புகளைச் செய்வதற்கும் லாஜிக்கல் ரீசனிங்கைப் பயன்படுத்துவதற்கான திறனையும் எடுத்துக்காட்டுகிறது. இந்த திறன் எளிய வடிவ அங்கீகாரத்திற்கு அப்பால் நீண்டுள்ளது, ஸ்பேஷியல் ரீசனிங், ரூல்-பேஸ்டு டிடக்ஷன்ஸ் மற்றும் அப்ஸ்ட்ராக்ட் கான்செப்ட் புரிதல் உள்ளிட்ட மிகவும் சிக்கலான காட்சிகளை உள்ளடக்கியது.
மேலும் பயன்பாட்டு நிகழ்வுகள் மற்றும் விரிவாக்கங்கள்
விஷுவல் புதிர்களுக்கு அப்பால், Pixtral 12B இன் விஷுவல் லாஜிக்கல் ரீசனிங் திறன்களை பரந்த அளவிலான நிகழ் உலக காட்சிகளுக்கு பயன்படுத்தலாம்:
- தரவு பகுப்பாய்வு மற்றும் விளக்கம்: முக்கிய நுண்ணறிவு மற்றும் போக்குகளைப் பிரித்தெடுக்க விளக்கப்படங்கள், வரைபடங்கள் மற்றும் வரைபடங்களை பகுப்பாய்வு செய்தல். எடுத்துக்காட்டாக, ஒரு சிக்கலான காட்சிப்படுத்தலில் வழங்கப்பட்ட வெவ்வேறு தரவு தொகுப்புகளுக்கு இடையிலான தொடர்புகளை அடையாளம் காண்பது.
- மருத்துவ பட பகுப்பாய்வு: எக்ஸ்-ரே, சிடி ஸ்கேன் மற்றும் எம்ஆர்ஐ போன்ற மருத்துவ படங்களின் விளக்கத்தில் உதவுதல், குறிப்பிட்ட நிலைமைகளைக் குறிக்கும் முரண்பாடுகள் அல்லது வடிவங்களை அடையாளம் காண்பதன் மூலம்.
- ரோபாட்டிக்ஸ் மற்றும் தன்னாட்சி அமைப்புகள்: விஷுவல் குறிப்புகளை விளக்குவதன் மூலமும், காட்சியின் புரிதலின் அடிப்படையில் முடிவுகளை எடுப்பதன் மூலமும் சிக்கலான சூழல்களில் செல்ல ரோபோக்களுக்கு உதவுதல்.
- பாதுகாப்பு மற்றும் கண்காணிப்பு: சந்தேகத்திற்கிடமான நடவடிக்கைகளைக் கண்டறிய அல்லது ஆர்வமுள்ள பொருட்களை அடையாளம் காண வீடியோ காட்சிகளை பகுப்பாய்வு செய்தல்.
- கல்வி மற்றும் பயிற்சி: விஷுவல் ப்ராம்ப்ட்களுக்கான பதில்களின் அடிப்படையில் பயனரின் புரிதலுக்கு ஏற்ப ஊடாடும் கற்றல் பொருட்களை உருவாக்குதல்.
- ஆவண புரிதல்: சிக்கலான ஆவணங்களிலிருந்து கட்டமைக்கப்பட்ட தரவைப் பிரித்தெடுத்தல்.
Pixtral 12B இன் பன்முகத்தன்மை, Amazon Bedrock இன் அணுகலுடன் இணைந்து, விஷன் லாங்குவேஜ் மாடல்களின் சக்தியைப் பயன்படுத்த விரும்பும் டெவலப்பர்கள் மற்றும் வணிகங்களுக்கு பரந்த அளவிலான சாத்தியக்கூறுகளைத் திறக்கிறது. படங்கள் மற்றும் உரையை ஒருங்கிணைந்த முறையில் செயலாக்குவதற்கான திறன், வலுவான பகுத்தறிவு திறன்களுடன் இணைந்து, Pixtral 12B ஐ பல பயன்பாடுகளுக்கு ஒரு மதிப்புமிக்க கருவியாக ஆக்குகிறது. வரிசைப்படுத்தலின் எளிமை மற்றும் வணிக ரீதியாக அனுமதிக்கக்கூடிய உரிமம் ஆகியவை அதன் கவர்ச்சியை மேலும் மேம்படுத்துகின்றன, இது ஆராய்ச்சி மற்றும் வணிக முயற்சிகள் இரண்டிற்கும் ஒரு கவர்ச்சிகரமான விருப்பமாக அமைகிறது.