மைக்ரோசாஃப்ட் ஆராய்ச்சியாளர்கள் பிட்நெட் பி1.58 2பி4டி (BitNet b1.58 2B4T) என்ற ஒரு புரட்சிகரமான ஓப்பன் சோர்ஸ் (open-source) 1-பிட் பெரிய மொழி மாதிரியை (LLM) வெளியிட்டுள்ளனர். இது இரண்டு பில்லியன் அளவுருக்களைக் (parameters) கொண்டது மற்றும் நான்கு டிரில்லியன் டோக்கன்களில் (tokens) பயிற்சி பெற்றது. இந்த AI மாதிரியின் சிறப்பம்சம் என்னவென்றால், இது பாரம்பரிய CPUகளில் திறமையாக செயல்படும் திறன் கொண்டது. இது AI அணுகல் மற்றும் ஆற்றல் திறன் ஆகியவற்றில் புதிய சாத்தியங்களைத் திறந்து விடுகிறது. டெக் க்ரஞ்ச் (TechCrunch) சுட்டிக்காட்டியுள்ளபடி, இந்த புதுமையான அணுகுமுறை ஆப்பிள் எம்2 சிப் (Apple M2 chip) போன்ற சாதனங்களிலும் திறம்பட இயங்க அனுமதிக்கிறது. ஹக்கிங் ஃபேஸ் (Hugging Face) போன்ற தளங்களில் இதை எளிதாகப் பரிசோதிக்க முடியும்.
முக்கிய கண்டுபிடிப்பு: 1-பிட் கட்டமைப்பு
பிட்நெட்டின் (BitNet) செயல்திறனுக்கான அடிப்படை, 1-பிட் எடைகளைப் பயன்படுத்துவதாகும். இது -1, 0, மற்றும் +1 ஆகிய மூன்று சாத்தியமான மதிப்புகளை மட்டுமே பயன்படுத்துகிறது. இந்த வடிவமைப்பு, தொழில்நுட்ப ரீதியாக மூன்று மதிப்புகளுக்கான ஆதரவு காரணமாக ‘1.58-பிட் மாதிரி’ என்று வகைப்படுத்தப்படுகிறது. இது 32-பிட் அல்லது 16-பிட் மிதக்கும் புள்ளி வடிவங்களைப் பயன்படுத்தும் பாரம்பரிய AI மாதிரிகளுடன் ஒப்பிடும்போது நினைவகத் தேவைகளை வெகுவாகக் குறைக்கிறது. இதன் விளைவாக, பிட்நெட் (BitNet) உயர்ந்த செயல்பாட்டுத் திறனை அடைவதோடு, குறைந்த நினைவகம் மற்றும் கணக்கீட்டு சக்தியையும் பயன்படுத்துகிறது. இந்த நெறிப்படுத்தப்பட்ட கட்டமைப்பு, குறைந்த வளங்களைக் கொண்ட ஹார்ட்வேரிலும் (hardware) திறம்பட செயல்பட உதவுகிறது, இது AI ஐ பரந்த அளவிலான பயனர்கள் மற்றும் சாதனங்களுக்கு மிகவும் அணுகக்கூடியதாக ஆக்குகிறது.
இருப்பினும், இந்த எளிமை ஒரு குறைபாட்டையும் கொண்டுள்ளது: பெரிய, மிகவும் சிக்கலான AI மாதிரிகளுடன் ஒப்பிடும்போது துல்லியத்தில் சிறிய குறைபாடு உள்ளது. இதை ஈடுசெய்ய, பிட்நெட் பி1.58 2பி4டி (BitNet b1.58 2B4T) 33 மில்லியனுக்கும் அதிகமான புத்தகங்களைக் கொண்ட ஒரு பெரிய பயிற்சித் தரவுத்தொகுப்பைப் பயன்படுத்துகிறது. இது சிறிய அளவு இருந்தபோதிலும், போட்டித்தன்மை வாய்ந்த செயல்திறனை அடைய உதவுகிறது.
முக்கிய மாடல்களுக்கு எதிராக தரப்படுத்தல்
மைக்ரோசாஃப்ட் (Microsoft) ஆராய்ச்சி குழு, மெட்டாவின் லாமா 3.2 1பி (Meta’s LLaMa 3.2 1B), கூகிளின் ஜெம்மா 3 1பி (Google’s Gemma 3 1B) மற்றும் அலிபாபாவின் கியூவென் 2.5 1.5பி (Alibaba’s Qwen 2.5 1.5B) உள்ளிட்ட முன்னணி முக்கிய மாடல்களுக்கு எதிராக பிட்நெட் பி1.58 2பி4டி-ஐ (BitNet b1.58 2B4T) கடுமையாகச் சோதித்தது. பெரும்பாலான சோதனைகளில் பிட்நெட் பி1.58 2பி4டி (BitNet b1.58 2B4T) சாதகமாக செயல்பட்டது, சில தரநிலைகளில் இந்த மாடல்களை விட சிறப்பாக செயல்பட்டது என்று முடிவுகள் காட்டுகின்றன. குறிப்பாக, இது 400MB உள்ளமைக்கப்படாத நினைவகத்தை மட்டுமே பயன்படுத்தியது, இது ஜெம்மா 3 1பிக்கு (Gemma 3 1B) தேவையான 1.4 GB ஐ விடக் கணிசமாகக் குறைவு. இது பிட்நெட்டின் (BitNet) விதிவிலக்கான நினைவகத் திறனையும், வள-கட்டுப்படுத்தப்பட்ட சாதனங்களில் பயன்படுத்துவதற்கான திறனையும் அடிக்கோடிட்டுக் காட்டுகிறது.
bitnet.cpp உடன் செயல்திறனை மேம்படுத்துதல்
பிட்நெட்டின் (BitNet) செயல்திறனுக்கான முழு திறனையும் திறக்க, bitnet.cpp அனுமான கட்டமைப்பைப் பயன்படுத்துவது அவசியம். தேவையான மாற்றங்களுடன் நிலையான டிரான்ஸ்ஃபார்மர்கள் (transformers) நூலகங்களுடன் பயன்படுத்தும்போது, இந்த மாதிரி அதே செயல்திறன் ஆதாயங்களை அடையாது என்று வளர்ச்சி குழு வெளிப்படையாகக் கூறியுள்ளது.
github-இல் கிடைக்கும் bitnet.cpp கட்டமைப்பு, CPU களில் 1.58-பிட் மாடல்களின் வேகமான மற்றும் இழப்பற்ற அனுமானத்தை இயக்கும் உகந்த கர்னல்களின் தொகுப்பை வழங்குகிறது. எதிர்காலத்தில் NPU கள் மற்றும் GPU களுக்கான ஆதரவு திட்டமிடப்பட்டுள்ளது. இது தற்போது AI-குறிப்பிட்ட ஹார்ட்வேருக்கான ஆதரவைக் கொண்டிருக்கவில்லை என்றாலும், விலையுயர்ந்த, சிறப்பு கூறுகள் தேவையில்லாமல் AI உடன் பரிசோதனை செய்ய நிலையான கணினிகளைக் கொண்ட தனிநபர்களுக்கு இது அதிகாரம் அளிக்கிறது.
நிலையான AI க்கான தாக்கங்கள்
AI மாதிரிகள் பயிற்சி மற்றும் செயல்பாட்டின் போது அவற்றின் அதிகப்படியான ஆற்றல் நுகர்வுக்காக அடிக்கடி விமர்சிக்கப்படுகின்றன. பிட்நெட் பி1.58 2பி4டி (BitNet b1.58 2B4T) போன்ற இலகுரக LLM கள் (Lightweight LLMs) குறைந்த சக்திவாய்ந்த ஹார்ட்வேரில் AI மாடல்களை உள்ளூரில் இயக்க உதவுகின்றன. பரவலாக்கப்பட்ட AI செயலாக்கத்திற்கான இந்த மாற்றம் பெரிய தரவு மையங்களுக்கான எங்கள் சார்புநிலையை கணிசமாகக் குறைத்து, செயற்கை நுண்ணறிவுக்கான அணுகலை ஜனநாயகப்படுத்தக்கூடும். சமீபத்திய செயலிகள், NPU க்கள் அல்லது GPU க்கான அணுகல் இல்லாத தனிநபர்கள் AI இன் சக்தியைப் பயன்படுத்த இது உதவும்.
தொழில்நுட்ப அம்சங்களில் ஆழமாக மூழ்குதல்
பிட்நெட்டின் (BitNet) கட்டடக்கலை கண்டுபிடிப்பு குறைந்தபட்ச பிட்களுடன் எடைகளைப் பிரதிநிதித்துவப்படுத்தும் திறனில் உள்ளது. பாரம்பரியமாக, நரம்பியல் நெட்வொர்க்குகள் (neural networks) நியூரான்களுக்கு (neurons) இடையிலான இணைப்புகளின் வலிமையை தீர்மானிக்கும் எடைகளைப் பிரதிநிதித்துவப்படுத்த மிதக்கும் புள்ளி எண்களைப் பயன்படுத்துகின்றன, பொதுவாக 32-பிட் அல்லது 16-பிட். இந்த மிதக்கும் புள்ளி எண்கள் பரந்த அளவிலான மதிப்புகள் மற்றும் பயிற்சியின் போது துல்லியமான சரிசெய்தல்களுக்கு அனுமதிக்கின்றன, இது நெட்வொர்க்கை சிக்கலான வடிவங்களைக் கற்றுக்கொள்ள உதவுகிறது. இருப்பினும், அவை குறிப்பிடத்தக்க நினைவகம் மற்றும் கணக்கீட்டு வளங்களையும் பயன்படுத்துகின்றன.
மறுபுறம், பிட்நெட் (BitNet) 1-பிட் எடைகளைப் பயன்படுத்தி இந்த பிரதிநிதித்துவத்தை வெகுவாக எளிதாக்குகிறது, இது -1, 0 அல்லது +1 மதிப்புகளை எடுக்க முடியும். இந்த எளிமைப்படுத்தல் மாதிரியின் நினைவக தடத்தை கணிசமாகக் குறைக்கிறது, இது மிகவும் சிறியதாகவும் திறமையானதாகவும் இருக்க அனுமதிக்கிறது. கணக்கீட்டு சிக்கலான தன்மையின் குறைப்பு, GPU கள் அல்லது NPU கள் போன்ற சிறப்பு முடுக்கிகள் தேவையில்லாமல் CPU கள் போன்ற குறைந்த சக்திவாய்ந்த ஹார்ட்வேரில் பிட்நெட்டை (BitNet) இயக்க முடியும் என்பதாகும்.
1-பிட் எடைகளுக்கான சாத்தியமான மதிப்புகளாக -1, 0 மற்றும் +1 ஆகியவற்றைத் தேர்ந்தெடுப்பது முக்கியமானது. -1 மற்றும் +1 மதிப்புகள் முறையே வலுவான எதிர்மறை மற்றும் நேர்மறை இணைப்புகளைக் குறிக்கின்றன, அதே நேரத்தில் 0 மதிப்பு எந்த இணைப்பையும் குறிக்கவில்லை. இந்த மூன்று பிரதிநிதித்துவம் நெட்வொர்க்கை உற்சாகமான மற்றும் தடுக்கும் இணைப்புகள் இரண்டையும் கற்றுக்கொள்ள அனுமதிக்கிறது, இது சிக்கலான வடிவ அங்கீகாரத்திற்கு அவசியம்.
பயிற்சி சவால்கள் மற்றும் தீர்வுகள்
1-பிட் நரம்பியல் நெட்வொர்க்கிற்குப் (neural network) பயிற்சி அளிப்பது தனித்துவமான சவால்களை முன்வைக்கிறது. எடைகளின் தனித்துவமான தன்மை தரமான சாய்வு அடிப்படையிலான மேம்படுத்தல் நுட்பங்களைப் பயன்படுத்துவதை கடினமாக்குகிறது. ஏனெனில் அவை எடைகளுக்கு தொடர்ச்சியான சரிசெய்தல்களை நம்பியுள்ளன. இந்த சவாலை சமாளிக்க, ஆராய்ச்சியாளர்கள் 1-பிட் நெட்வொர்க்குகளின் தனித்துவமான தன்மைக்கு ஏற்ற பயிற்சி வழிமுறைகளை உருவாக்கியுள்ளனர்.
பொதுவாக பயன்படுத்தப்படும் ஒரு அணுகுமுறை ‘நேரான-வழியாக மதிப்பீட்டாளர்’ (STE) எனப்படும் ஒரு நுட்பத்தைப் பயன்படுத்துவதாகும். STE அளவுருவாக்கல் செயல்பாட்டின் மூலம் நேரடியாக சாய்வைப் கடத்துவதன் மூலம் தனித்துவமான எடைகளின் சாய்வை தோராயமாக்குகிறது. இது பின்னோக்கி செல்லும் போது தனித்துவமான எடைகளை தொடர்ச்சியாக கருதுகிறது. இதன் விளைவாக, அளவுருவாக்கல் செயல்பாட்டின் வேறுபடுத்த முடியாத தன்மை இருந்தபோதிலும், நிலையான பின்னோக்கிபரப்பல் வழிமுறைகளைப் பயன்படுத்தி நெட்வொர்க்கைப் பயிற்றுவிக்க இது அனுமதிக்கிறது.
1-பிட் நெட்வொர்க்குகளைப் பயிற்றுவிப்பதில் மற்றொரு சவால் ஸ்திரத்தன்மைக்கான சாத்தியமாகும். எடைகளுக்கான மதிப்புகளின் வரையறுக்கப்பட்ட வரம்பு பயிற்சியின் போது அலைவுகள் மற்றும் வேறுபாடுகளுக்கு வழிவகுக்கும். இதைத் தணிக்க, ஆராய்ச்சியாளர்கள் பெரும்பாலும் எடை சாதாரணமயமாக்கல் மற்றும் சாய்வு கிளிப்பிங் போன்ற நுட்பங்களைப் பயன்படுத்துகின்றனர். இது பயிற்சி செயல்முறையை உறுதிப்படுத்த உதவுகிறது.
bitnet.cpp நூலகத்தின் பங்கு
பிட்நெட்டின் (BitNet) செயல்திறன் நன்மைகளை உணர்ந்து கொள்வதில் bitnet.cpp நூலகம் முக்கிய பங்கு வகிக்கிறது. இந்த நூலகம் CPU களில் 1-பிட் மாதிரிகள் மூலம் அனுமானம் செய்வதற்காக சிறப்பாக வடிவமைக்கப்பட்ட உகந்த கர்னல்களின் தொகுப்பை வழங்குகிறது. இந்த கர்னல்கள் நரம்பியல் நெட்வொர்க் கணக்கீடுகளின் இதயத்தில் இருக்கும் டாட் (dot) தயாரிப்புகளின் கணக்கீட்டை விரைவுபடுத்த பிட்வைஸ் செயல்பாடுகள் மற்றும் தேடல் அட்டவணைகள் போன்ற நுட்பங்களைப் பயன்படுத்துகின்றன.
bitnet.cpp நூலகம் அளவுருவாக்கம் மற்றும் டிகுவாண்ட்டிசைசேஷன் (quantization and dequantization) ஆகியவற்றுக்கான ஆதரவையும் உள்ளடக்கியது. இது 1-பிட் எடைகள் மற்றும் மிதக்கும் புள்ளி செயல்படுத்தல்களுக்கு இடையில் மாற்றுவதற்கான செயல்முறைகள் ஆகும். AI சுற்றுச்சூழல் அமைப்பின் மற்ற பகுதிகளுடன் இடைமுகப்படுத்த இந்த செயல்பாடுகள் அவசியம். அவை பொதுவாக மிதக்கும் புள்ளி பிரதிநிதித்துவங்களைப் பயன்படுத்துகின்றன.
1-பிட் அனுமானத்திற்கு தேவையான முக்கிய செயல்பாடுகளின் மிகவும் உகந்த செயலாக்கத்தை வழங்குவதன் மூலம், பிட்நெட் (BitNet) CPU களில் குறிப்பிடத்தக்க செயல்திறன் ஆதாயங்களை அடைய bitnet.cpp நூலகம் உதவுகிறது. இது வளங்களால் கட்டுப்படுத்தப்பட்ட சாதனங்களில் AI மாதிரிகளைப் பயன்படுத்த ஒரு நடைமுறை தீர்வாக அமைகிறது.
1-பிட் AI இன் பரந்த தாக்கம்
பிட்நெட்டின் (BitNet) வளர்ச்சி மிகவும் நிலையான மற்றும் அணுகக்கூடிய AI க்கான ஒரு குறிப்பிடத்தக்க படியாகும். AI மாதிரிகளின் நினைவகம் மற்றும் கணக்கீட்டு தேவைகளை குறைப்பதன் மூலம், பிட்நெட் (BitNet) மொபைல் போன்கள், உள்ளமைக்கப்பட்ட அமைப்புகள் மற்றும் IoT சாதனங்கள் உட்பட பரந்த அளவிலான சாதனங்களில் AI ஐப் பயன்படுத்துவதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.
AI இன் இந்த ஜனநாயகமயமாக்கல் பல்வேறு தொழில்களில் ஆழமான தாக்கத்தை ஏற்படுத்தும். உதாரணமாக, இது மொபைல் போன்களில் உள்ளூரில் இயங்கும் தனிப்பயனாக்கப்பட்ட AI உதவியாளர்களின் வளர்ச்சியை செயல்படுத்தக்கூடும். இது பயனர்களுக்கு மேம்பட்ட தனியுரிமை மற்றும் பாதுகாப்பை வழங்குகிறது. இது தொலைதூர இடங்களில் AI இயங்கும் சென்சார்களைப் பயன்படுத்த உதவுகிறது. இதன் மூலம் விலையுயர்ந்த கிளவுட் (cloud) உள்கட்டமைப்பு தேவையில்லாமல் நிகழ்நேர கண்காணிப்பு மற்றும் பகுப்பாய்வு சாத்தியமாகும்.
மேலும், பிட்நெட்டின் (BitNet) ஆற்றல் திறன் AI துறையின் கார்பன் தடம் குறைக்க உதவும். பெரிய AI மாதிரிகளின் பயிற்சி மற்றும் செயல்பாடு குறிப்பிடத்தக்க அளவு ஆற்றலைப் பயன்படுத்துகிறது. இது கிரீன்ஹவுஸ் வாயு வெளியேற்றத்திற்கு பங்களிக்கிறது. AI மாதிரிகளின் ஆற்றல் நுகர்வு குறைப்பதன் மூலம், பிட்நெட் (BitNet) AI ஐ சுற்றுச்சூழல் ரீதியாக நிலையானதாக மாற்ற உதவும்.
எதிர்கால திசைகள் மற்றும் சவால்கள்
பிட்நெட் (BitNet) AI தொழில்நுட்பத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தை பிரதிநிதித்துவப்படுத்தும் அதே வேளையில், எதிர்கால ஆராய்ச்சிக்கான பல சவால்கள் மற்றும் வாய்ப்புகள் உள்ளன. 1-பிட் மாதிரிகளின் துல்லியத்தை மேம்படுத்துவது ஒரு முக்கிய சவாலாகும். சில தரநிலைகளில் பிட்நெட் (BitNet) போட்டி செயல்திறனை நிரூபித்திருந்தாலும், ஒட்டுமொத்த துல்லியத்தைப் பொறுத்தவரை பெரிய, மிகவும் சிக்கலான மாதிரிகளை விட இது இன்னும் பின்தங்கியே உள்ளது.
இந்த சவாலைச் சமாளிக்க ஆராய்ச்சியாளர்கள் பல்வேறு நுட்பங்களை ஆராய்ந்து வருகின்றனர். அவற்றில் சில:
- மேலும் அதிநவீன பயிற்சி வழிமுறைகள்: 1-பிட் எடைகளின் தனித்துவமான தன்மைக்கு மிகவும் பொருத்தமான பயிற்சி வழிமுறைகளை உருவாக்குவது துல்லியத்தில் குறிப்பிடத்தக்க முன்னேற்றங்களுக்கு வழிவகுக்கும்.
- நாவல் நெட்வொர்க் கட்டமைப்புகள்: 1-பிட் மாதிரிகளுக்கு சிறப்பாக வடிவமைக்கப்பட்ட நெட்வொர்க் கட்டமைப்புகளை வடிவமைப்பதும் செயல்திறனை மேம்படுத்தும்.
- கலப்பின அணுகுமுறைகள்: அறிவு வடிகட்டுதல் போன்ற பிற நுட்பங்களுடன் 1-பிட் எடைகளை இணைப்பது, பெரிய, மிகவும் துல்லியமான மாதிரிகளிலிருந்து 1-பிட் மாதிரிகள் கற்றுக்கொள்ள உதவும்.
NPU கள் மற்றும் GPU க்கான ஆதரவை bitnet.cpp நூலகத்திற்கு விரிவுபடுத்துவது மற்றொரு முக்கியமான ஆராய்ச்சி பகுதியாகும். தற்போதைய செயல்படுத்தல் CPU களில் கவனம் செலுத்துகையில், சிறப்பு AI முடுக்கிகளுக்கான ஆதரவைச் சேர்ப்பது பிட்நெட்டின் (BitNet) செயல்திறனை மேலும் மேம்படுத்தும்.
இறுதியாக, 1-பிட் AI இன் நெறிமுறை தாக்கங்களை ஆராய்வது முக்கியம். AI அதிகமாகப் பரவலாகும்போது, அது பொறுப்புடனும் நெறிமுறையுடனும் பயன்படுத்தப்படுவதை உறுதி செய்வது அவசியம். இது சார்பு, நியாயம் மற்றும் வெளிப்படைத்தன்மை போன்ற சிக்கல்களைத் தீர்ப்பதை உள்ளடக்கியது.
முடிவுரை: AI வளர்ச்சியில் ஒரு முன்னுதாரண மாற்றம்
மைக்ரோசாஃப்டின் பிட்நெட் பி1.58 2பி4டி (Microsoft’s BitNet b1.58 2B4T) AI வளர்ச்சியில் ஒரு முன்னுதாரண மாற்றத்தை பிரதிபலிக்கிறது. இது குறைந்தபட்ச நினைவகம் மற்றும் கணக்கீட்டு வளங்களுடன் சக்திவாய்ந்த மற்றும் திறமையான AI மாதிரிகளை உருவாக்க முடியும் என்பதைக் காட்டுகிறது. இந்த முன்னேற்றம் AI க்கான அணுகலை ஜனநாயகப்படுத்தவும், AI துறையின் கார்பன் தடத்தைக் குறைக்கவும், புதிய மற்றும் புதுமையான AI பயன்பாடுகளின் வளர்ச்சியை செயல்படுத்தவும் சாத்தியக்கூறுகளைக் கொண்டுள்ளது. இந்தத் துறையில் ஆராய்ச்சி தொடர்ந்து முன்னேறி வருவதால், எதிர்காலத்தில் இன்னும் அதிகமான ஈர்க்கக்கூடிய முன்னேற்றங்களை நாம் எதிர்பார்க்கலாம். 1-பிட் AI க்கான நகர்வு ஒரு தொழில்நுட்ப முன்னேற்றம் மட்டுமல்ல, செயற்கை நுண்ணறிவுக்கு மிகவும் நிலையான மற்றும் அணுகக்கூடிய எதிர்காலத்திற்கான ஒரு படியாகும். AI ஐ மிகவும் திறமையானதாகவும் பரந்த அளவிலான சாதனங்களில் பயன்படுத்தக்கூடியதாகவும் மாற்றுவதன் மூலம், காலநிலை மாற்றம் முதல் சுகாதாரம் வரை உலகின் மிக அவசரமான சில சவால்களைத் தீர்க்கும் திறனை நாம் திறக்க முடியும். AI இன் எதிர்காலம் பெரிய மற்றும் சிக்கலான மாதிரிகளை உருவாக்குவது மட்டுமல்ல, புத்திசாலித்தனமான மற்றும் திறமையான மாதிரிகளை உருவாக்குவதாகும். பிட்நெட் (BitNet) இந்த பார்வைக்கான சான்றாகும். இது AI கண்டுபிடிப்புகளின் ஒரு புதிய யுகத்திற்கு வழி வகுக்கிறது.