அலிபாபா க்வென்னின் க்வென்3 AI இன் அளவு மாதிரிகள் வெளியிடப்பட்டுள்ளன, மேலும் இப்போது LM Studio, Ollama, SGLang மற்றும் vLLM போன்ற தளங்கள் மூலம் இதைப் பயன்படுத்தலாம். பயனர்கள் GGUF, AWQ மற்றும் GPTQ உள்ளிட்ட பல்வேறு வடிவங்களிலிருந்து தேர்வு செய்யலாம். இவை Qwen3-235B-A22B முதல் Qwen3-0.6B வரை அளவு மாறுபடும், இது வெவ்வேறு தேவைகளைப் பூர்த்தி செய்கிறது.
Qwen3 குவாண்டமாய்ஸ் செய்யப்பட்ட மாடல்: உள்நாட்டில் பயன்படுத்த ஒரு சக்திவாய்ந்த தேர்வு
அலிபாபாவின் Qwen இன்று Qwen3 AI குறித்த அளவு மாதிரிகள் வெளியிடப்பட்டன என அறிவித்துள்ளது. இந்த மாதிரிகள் LM Studio, Ollama, SGLang மற்றும் vLLM போன்ற தளங்களில் தயாராக உள்ளன. ஆர்வமுள்ள பயனர்கள் GGUF (GPT-Generated Unified Format), AWQ (Activation-aware Weight Quantisation) மற்றும் GPTQ (Gradient Post-Training Quantisation) போன்ற பல்வேறு வடிவங்களில் தேர்வு செய்யலாம். Qwen3 அளவுருவாக்கம் செய்யப்பட்ட மாதிரி கொண்டுள்ளது:
- Qwen3-235B-A22B
- Qwen3-30B-A3B
- Qwen3-32B
- Qwen3-14B
- Qwen3-8B
- Qwen3-4B
- Qwen3-1.7B
- Qwen3-0.6B
இந்த வகைப்படுத்தப்பட்ட மாடல்களின் வெளியீடு Qwen இன் AI மாடல் வரிசையில் ஒரு முக்கியமான படியாகும். இது டெவலப்பர்கள் மற்றும் ஆய்வாளர்களுக்கு அதிக நெகிழ்வுத்தன்மையையும் விருப்பத்தையும் வழங்குகிறது. முழு மாதிரித் துல்லியத்துடன் ஒப்பிடும்போது, அளவிடுதல் செய்யப்பட்ட மாதிரிகள் சிறிய அளவு மற்றும் வேகமான கணக்கீட்டுத் தேவை காரணமாக அமைந்திருப்பதால், வரையறுக்கப்பட்ட வளங்களைக் கொண்ட சாதனங்களுக்கு ஏற்றதாக இது அமைகிறது. எட்ஜ் கம்ப்யூட்டிங், மொபைல் பயன்பாடுகள் மற்றும் பெரிய அளவிலான அனுமானச் சேவைகள் போன்ற சூழ்நிலைகளுக்கு இது மிகவும் முக்கியமானது.
Qwen3 குவாண்டமாய்ஸ் செய்யப்பட்ட மாடல் முழுமையான திறனாய்வு
Qwen3 தொடர் மாடல் என்பது அலிபாபா Qwen குழுவால் உருவாக்கப்பட்ட அதிநவீன பெரிய மொழி மாதிரி. இவைகள் ஏராளமான தரவுகளில் முன்-பயிற்சி அளிக்கப்பட்டவையாகும், எனவே வலிமையான மொழி புரிதல் மற்றும் உருவாக்கும் திறன்களைக் கொண்டுள்ளது. அளவுறுவாக்கம் மூலம், Qwen3 மாடல் அதன் செயல்திறனைப் பராமரிக்கும் திறனைக் கொண்டுள்ளது, அதே நேரத்தில் மெமரி உபயோகம் மற்றும் கணக்கீட்டு சிக்கலான தன்மையைக் கணிசமாகக் குறைக்கிறது. இது பரந்த அளவிலான பயன்பாடுகளைச் செய்ய உதவுகிறது.
அளவுறுவாக்கம் டெக்னிக்ஸ்: மாடல் சுருக்கத்திற்கான முக்கியம்
மாடல் அளவுறுவாக்கம் என்பது மாதிரியில் உள்ள அளவுருக்களுக்குத் தேவையான சேமிப்பிட இடம் மற்றும் கணக்கீட்டு ஆதாரங்களைக் குறைப்பதை நோக்கமாகக் கொண்ட ஒரு மாடல் சுருக்கப்படுத்தும் நுட்பமாகும். இது மாதிரியில் உள்ள மிதக்கும் புள்ளி எண்களை குறைவான துல்லியமான முழு எண் பிரதிநிதித்துவமாக மாற்றுவதன் மூலம் அடையப்படுகிறது. உதாரணமாக, 32-பிட் மிதக்கும் புள்ளி எண் (float32) 8-பிட் முழு எண்ணாக(int8) மாற்றப்படுகிறது. இந்த மாற்றம் மாடலின் அளவைக் கணிசமாகக் குறைத்து கணக்கீட்டு திறனை அதிகரிக்கிறது.
இருப்பினும், அளவிடுதல் சில சவால்களையும் தருகிறது. தகவல் இழப்பு காரணமாக, அளவிடுதல் மாடல் செயல்திறனில் சரிவுக்கு வழிவகுக்கும். எனவே, செயல்திறன் இழப்பை முடிந்தவரை குறைக்க சிறப்பு அளவுறுவாக்கம் முறைகள் தேவைப்படுகின்றன. பொதுவான அளவுறுவாக்கம் முறைகள் பின்வருமாறு:
- பயிற்றுவிப்புக்குப் பின் அளவுறுவாக்கம் (Post-Training Quantization, PTQ): மாதிரி பயிற்சி பெற்ற பின்பு, மாடல் அளவிடப்படுகிறது. இந்த முறை எளிதானது, ஆனால் செயல்திறன் இழப்பு அதிகமாக இருக்கலாம்.
- அளவுறுவாக்கம் உஷார் பயிற்சி (Quantization-Aware Training, QAT): மாதிரி பயிற்சி செய்யும் போது, அளவுறுவாக்க செயல்பாடு மாதிரியாக்கப்படுகிறது. இந்த முறை அளவுறு மாதிரியின் செயல்திறனை மேம்படுத்துகிறது, ஆனால் அதிக பயிற்சி ஆதாரங்கள் தேவைப்படுகின்றன.
Qwen3 மாடலின் அளவுறுவாக்கம் புதிய தொழில்நுட்பங்களைப் பயன்படுத்துகிறது, அதிக செயல்திறனை பராமரிக்கும் அதே நேரத்தில் அதிகபட்ச சுருக்க விகிதத்தை அடைய முயற்சிக்கிறது.
பல அளவிடுதல் முறைகள்: நெகிழ்வான தேர்வுகள்
Qwen3 அளவுறுவாக்கம் செய்யப்பட்ட மாடல் வெவ்வேறு பயனர்களின் தேவைகளைப் பூர்த்தி செய்ய பல வடிவங்களை வழங்குகிறது:
- GGUF (GPT-Generated Unified Format): CPU அனுமானத்திற்கு ஏற்ற ஒரு பொதுவான வடிவமாகும். அளவுறு மாதிரிகளைச் சேமிக்கவும் விநியோகிக்கவும் பயன்படுகிறது. GGUF வடிவ மாதிரியை LM Studio போன்ற தளங்களில் எளிதாகப் பயன்படுத்தலாம்.
- AWQ (Activation-aware Weight Quantisation): ஒரு மேம்பட்ட அளவுறுமுறை நுட்பம். இது எடை அளவுருக்கத்தை மேம்படுத்த அக்ஷன் மதிப்புகளின் பகிர்வுகளைக் கருத்தில் கொள்கிறது. இதன் மூலம் கிடைக்கும் அளவுருமாதிரியின் துல்லியத்தையும் அதிகரிக்கிறது.
- GPTQ (Gradient Post-Training Quantisation): மற்றொரு பிரபலமான அளவுறுவாக்கம் முறை. இது சாய்வுத் தகவலைப் பயன்படுத்தி எடை அளவுருக்கத்தை மேம்படுத்துகிறது. இதனால் செயல்திறன் இழப்பு குறைகிறது.
பயனர்கள் தங்கள் வன்பொருள் தளம் மற்றும் செயல்திறன் தேவைகளின் அடிப்படையில் பொருத்தமான அளவுறுவாக்கம் முறையைத் தேர்வு செய்யலாம்.
Qwen3 மாதிரியின் பயன்பாட்டு சூழ்நிலைகள்
Qwen3 மாடல் பரந்த பயன்பாட்டு வாய்ப்புகளைக் கொண்டுள்ளது. அவற்றில் சில பின்வருமாறு:
- இயற்கை மொழி செயலாக்கம் (NLP): Qwen3 மாடல் உரை வகைப்பாடு, உணர்ச்சி பகுப்பாய்வு, இயந்திர மொழிபெயர்ப்பு, உரை சுருக்கம் போன்ற பல்வேறு NLP பணிகளுக்குப் பயன்படுத்தப்படலாம்.
- உரையாடல் சிஸ்டம்ஸ்: Qwen3 மாடல் ஒரு அறிவார்ந்த உரையாடல் சிஸ்டத்தை உருவாக்கவும், இயற்கையான மற்றும் தொந்தரவில்லாத உரையாடல் அனுபவத்தை வழங்கவும் பயன்படுகிறது.
- உள்ளடக்க உருவாக்கம்: கட்டுரைகள், கதைகள், கவிதைகள் போன்ற பல்வேறு வகையான உரை உள்ளடக்கத்தை உருவாக்க Qwen3 மாடல் பயன்படுகிறது.
- குறியீடு உருவாக்கம்: Qwen3 மாடல் குறியீட்டை உருவாக்கவும் மென்பொருள் மேம்பாட்டிற்கு உதவவும் பயன்படுகிறது.
அளவுறுவாக்கம் மூலம், Qwen3 மாடல் பல்வேறு சாதனங்களில் சுலபமாக பயன்படுத்தப்படுவதன் மூலம், பரந்த பயன்பாடுகளைச் செய்ய முடியும்.
Qwen3 அளவு மாதிரிப் பரவல்
Qwen3 அளவு மாதிரியைப் பல தளங்களைப் பயன்படுத்திப் பரப்ப முடியும், அவை:
- LM Studio: பல்வேறு அளவு மாதிரிகளைப் பதிவிறக்கம் செய்யவும், நிறுவவும், மற்றும் இயக்கவும் கூடிய எளிதான GUI கருவி இது.
- Ollama: பெரிய மொழி மாதிரிகளைப் பதிவிறக்கம் செய்து இயக்குவதற்கான கட்டளை-வரி கருவி.
- SGLang: AI பயன்பாடுகளை உருவாக்கிப் பயன்படுத்தக்கூடிய ஒரு தளம்.
- vLLM: பெரிய மொழி மாதிரி 추리를 முடுக்கி விடுவதற்கான நூலகம்.
பயனர்கள் அவர்கள் சார்ந்த டெக்னிக்கல் அறிவு மற்றும் தேவைகளுக்கு ஏற்ப பொருத்தமான பரவல் தளத்தைத் തിരഞ്ഞെടുக்க முடியும்.
LM Studio பயன்படுத்தி Qwen3 மாதிரிப் பரவல்
LM Studio புதிய பயனர்களுக்கு ஏற்ற சிறந்த தேர்வாகும். இது Qwen3 தரவு மாதிரியை எளிதாக பதிவிறக்கம் செய்து இயக்கக்கூடிய கிராஃபிகல் இடைமுகத்தை வழங்குகிறது.
- LM Studio பதிவிறக்கம் செய்து நிறுவுதல்: LM Studio அதிகாரப்பூர்வ வலைத்தளத்திலிருந்து LM Studio-வைப் பதிவிறக்கம் செய்து நிறுவவும்.
- Qwen3 மாதிரியைத் தேடுதல்: LM Studio-வில் கிடைக்கும் Qwen3 மாதிரியைத் தேடவும்.
- மாதிரி பதிவிறக்கம்: பதிவிறக்கம் செய்ய வேண்டிய Qwen3 மாதிரி பதிப்பை(உதாரணமாக, Qwen3-4B) தேர்ந்தெடுத்து பதிவிறக்கம் என்பதைக் கிளிக் செய்க.
- மாதிரியை இயக்குதல்: பதிவிறக்கம் முடிந்ததும், LM Studio தானாகவே மாதிரியை ஏற்றும். நீங்கள் மாதிரிக்கு கேள்விகள் கேட்பது அல்லது உரையை உருவாக்குவது போன்ற செயல்களைச் செய்ய தொடங்கலாம்.
Ollama-வைப் பயன்படுத்தி Qwen3 மாதிரிப் பரவல்
Ollama என்பது ஒரு கட்டளை வரி கருவியாக இருப்பதால் டெக்னிக்கல் நிபுணத்துவம் கொண்ட பயனர்களுக்கு இது பொருத்தமானது.
- Ollama நிறுவுதல்: Ollama அதிகாரப்பூர்வ வலைத்தளத்தின் அறிவுறுத்தல்களின்படி Ollama-வை நிறுவவும்.
- Qwen3 மாதிரி பதிவிறக்கம்: Qwen3 மாதிரி பதிவிறக்கம் செய்ய Ollama கட்டளையைப் பயன்படுத்தவும். உதாரணமாக, Qwen3-4B தரவு மாதிரியைப் பதிவிறக்க, பின்வரும் கட்டளையை இயக்கலாம்: