செயற்கை நுண்ணறிவில் புரட்சி: பிட்நெட்

செயற்கை நுண்ணறிவின் (AI) வளர்ந்து வரும் உலகில், மைக்ரோசாஃப்டின் பொது செயற்கை நுண்ணறிவு குழுவிலிருந்து ஒரு அற்புதமான கண்டுபிடிப்பு வெளிவந்துள்ளது. இது பெரிய மொழி மாதிரிகளின் (LLM) திறன் மற்றும் அணுகல் எல்லைகளை மறுவரையறை செய்ய உறுதியளிக்கிறது. பிட்நெட் b1.58 2B4T எனப்படும் இந்த கண்டுபிடிப்பு, AI மாதிரிகள் எவ்வாறு வடிவமைக்கப்படுகின்றன, பயிற்சி அளிக்கப்படுகின்றன மற்றும் பயன்படுத்தப்படுகின்றன என்பதில் ஒரு மாற்றத்தை பிரதிபலிக்கிறது. மேலும் மேம்பட்ட AI-ஐ அன்றாட சாதனங்களில் இயக்குவதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.

பிட்நெட்டின் சாராம்சம்: டெர்னரி குவாண்டைசேஷன்

பிட்நெட்டின் இதயத்தில் டெர்னரி குவாண்டைசேஷன் எனப்படும் ஒரு புரட்சிகரமான கருத்து உள்ளது. பாரம்பரிய AI மாதிரிகள் எடைகளைக் குறிக்க 16- அல்லது 32-பிட் மிதக்கும் புள்ளி எண்களை நம்பியுள்ளன. இவை மாதிரியின் மொழி புரிந்துணர்வு மற்றும் உருவாக்கும் திறனை நிர்வகிக்கும் உள் மதிப்புகளாகும். இதற்கு மாறாக, பிட்நெட் ஒரு தீவிரமான மாறுபட்ட அணுகுமுறையைப் பயன்படுத்துகிறது. இது மூன்று தனித்துவமான மதிப்புகளை மட்டுமே பயன்படுத்துகிறது: -1, 0, மற்றும் +1. இதன் பொருள் ஒவ்வொரு எடையையும் வெறும் 1.58 பிட்களில் சேமிக்க முடியும், இது வழக்கமான மாதிரிகள் தேவைப்படும் 16 அல்லது 32 பிட்களுடன் ஒப்பிடும்போது குறிப்பிடத்தக்க குறைப்பாகும்.

இந்த எளிய மாற்றம் நினைவக பயன்பாடு மற்றும் கணக்கீட்டுத் திறன் ஆகியவற்றில் ஆழமான தாக்கங்களை ஏற்படுத்துகிறது. ஒவ்வொரு எடையையும் சேமிக்கத் தேவையான பிட்களின் எண்ணிக்கையை வெகுவாகக் குறைப்பதன் மூலம், பிட்நெட் மாதிரியின் நினைவகத் தேவையை கணிசமாகக் குறைக்கிறது, இதனால் வரையறுக்கப்பட்ட ஆதாரங்களைக் கொண்ட சாதனங்களில் இயக்க முடியும். மேலும், டெர்னரி மதிப்புகளைப் பயன்படுத்துவது ஊகத்தின்போது தேவையான கணித செயல்பாடுகளை எளிதாக்குகிறது, இது வேகமான செயலாக்க நேரம் மற்றும் குறைந்த ஆற்றல் நுகர்வுக்கு வழிவகுக்கிறது.

இலகுரக மாபெரும் பயிற்சி

பிட்நெட் b1.58 2B4T மாதிரி இரண்டு பில்லியன் அளவுருக்களைக் கொண்டுள்ளது. இது சிக்கலான மொழி புரிதல் மற்றும் உருவாக்கத்திற்கான அதன் திறனுக்கு ஒரு சான்றாகும். இருப்பினும், குறைந்த துல்லியமான எடைகளைப் பயன்படுத்துவது ஒரு தனித்துவமான சவாலை முன்வைக்கிறது: ஒவ்வொரு எடையில் சேமிக்கப்படும் தகவல்களின் அளவைக் குறைக்கும்போது எவ்வாறு செயல்திறனைப் பராமரிப்பது?

மைக்ரோசாஃப்டின் தீர்வு என்னவென்றால், முப்பத்து மூன்று மில்லியன் புத்தகங்களின் உள்ளடக்கத்திற்கு சமமான நான்கு டிரில்லியன் டோக்கன்களின் மிகப்பெரிய தரவுத்தொகுப்பில் மாதிரியைப் பயிற்றுவிப்பதாகும். இந்த விரிவான பயிற்சி மொழியின் நுணுக்கங்களைக் கற்றுக்கொள்ளவும், அதன் எடைகளின் வரையறுக்கப்பட்ட துல்லியத்திற்கு ஈடுசெய்யவும் பிட்நெட்டை அனுமதிக்கிறது. இதன் விளைவாக, பிட்நெட் மெட்டாவின் லாமா 3.2 1B, கூகிளின் ஜெம்மா 3 1B மற்றும் அலிபாபாவின் கியூவன் 2.5 1.5B போன்ற இதே அளவிலான மற்ற முன்னணி மாதிரிகளை விடவும் சிறப்பாக செயல்படுகிறது அல்லது அதற்கு சமமாக செயல்படுகிறது.

பயிற்சி தரவுத்தொகுப்பின் அளவே பிட்நெட்டின் வெற்றிக்கு முக்கியமானது. ஒரு பெரிய அளவிலான உரைக்கு மாதிரியை வெளிப்படுத்துவதன் மூலம், ஆராய்ச்சியாளர்கள் அதை கண்ணுக்குத் தெரியாத தரவுகளுக்கு நன்கு பொதுமைப்படுத்த முடியும் என்பதையும், குறைந்த துல்லியமான எடைகள் இருந்தபோதிலும் அதன் துல்லியத்தைப் பராமரிக்க முடியும் என்பதையும் உறுதிப்படுத்த முடிந்தது. இது நவீன AI-இல் தரவின் முக்கியத்துவத்தை எடுத்துக்காட்டுகிறது, அங்கு பெரிய தரவுத்தொகுப்புகள் பெரும்பாலும் மாதிரி கட்டமைப்பு அல்லது கணக்கீட்டு ஆதாரங்களில் உள்ள வரம்புகளை ஈடுசெய்ய முடியும்.

தரப்படுத்தல் சிறப்பம்சம்

அதன் செயல்திறனை சரிபார்க்க, பிட்நெட் b1.58 2B4T தரம் பள்ளி கணித சிக்கல்கள் மற்றும் பொது அறிவு பகுத்தறிவு தேவைப்படும் கேள்விகள் உட்பட பல்வேறு பணிகளில் கடுமையான தரப்படுத்தல் சோதனைக்கு உட்படுத்தப்பட்டது. பிட்நெட் வலுவான செயல்திறனைக் காட்டுகிறது, மேலும் சில மதிப்பீடுகளில் அதன் போட்டியாளர்களை விட சிறப்பாக செயல்படுகிறது.

இந்த தரநிலைகள் பிட்நெட்டின் திறன்களுக்கு உறுதியான ஆதாரங்களை வழங்குகின்றன மற்றும் மாதிரி வெறும் ஒரு கருத்தியல் ஆர்வம் மட்டுமல்ல என்பதை நிரூபிக்கின்றன. உண்மை அறிவு மற்றும் பகுத்தறிவு திறன்கள் இரண்டையும் தேவைப்படும் பணிகளில் சிறந்து விளங்குவதன் மூலம், அதன் வழக்கத்திற்கு மாறான கட்டமைப்பு இருந்தபோதிலும், பிட்நெட் மொழியை திறம்பட புரிந்து கொள்ளவும் உருவாக்கவும் முடியும் என்பதை நிரூபிக்கிறது.

மேலும், தரப்படுத்தல் முடிவுகள் சாட்போட்கள் மற்றும் மெய்நிகர் உதவியாளர்கள் முதல் உள்ளடக்கம் உருவாக்கம் மற்றும் தரவு பகுப்பாய்வு வரை பரந்த அளவிலான பயன்பாடுகளில் பயன்படுத்த பிட்நெட்டின் திறனை எடுத்துக்காட்டுகின்றன. மாறுபட்ட பணிகளில் சிறப்பாக செயல்படுவதற்கான அதன் திறன் டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்கள் இருவருக்கும் பல்துறை கருவியாக இருக்கும் என்று தெரிவிக்கிறது.

நினைவக திறன்: ஒரு விளையாட்டு மாற்றும் கருவி

பிட்நெட்டின் மிக முக்கியமான அம்சங்களில் ஒன்று அதன் நினைவக திறன். மாதிரிக்கு வெறும் 400MB நினைவகம் மட்டுமே தேவைப்படுகிறது, இது ஒப்பிடக்கூடிய மாதிரிகள் பொதுவாக தேவைப்படுவதில் மூன்றில் ஒரு பங்கிற்கும் குறைவானது. நினைவக தேவையில் இந்த வியத்தகு குறைப்பு ஸ்மார்ட்போன்கள், லேப்டாப்கள் மற்றும் உட்பொதிக்கப்பட்ட அமைப்புகள் போன்ற வரையறுக்கப்பட்ட ஆதாரங்களைக் கொண்ட சாதனங்களில் மேம்பட்ட AI ஐ இயக்குவதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.

உயர்நிலை ஜிபியுக்கள் அல்லது சிறப்பு AI ஹார்ட்வேரை நம்பாமல், ஆப்பிளின் எம் 2 சிப் உட்பட நிலையான சிபியுக்களில் பிட்நெட்டை இயக்கும் திறன் ஒரு குறிப்பிடத்தக்க முன்னேற்றமாகும். இது AI-க்கான அணுகலை ஜனநாயகப்படுத்துகிறது, டெவலப்பர்கள் மேம்பட்ட மொழி மாதிரிகளை பரந்த அளவிலான சாதனங்களில் பயன்படுத்தவும், அதிக பார்வையாளர்களை அடையவும் அனுமதிக்கிறது.

இந்த நினைவக திறன் வசதிக்கான விஷயம் மட்டுமல்ல; இது ஆற்றல் நுகர்வு மற்றும் செலவு ஆகியவற்றிலும் முக்கியமான தாக்கங்களைக் கொண்டுள்ளது. மாதிரியை இயக்கத் தேவையான நினைவகத்தின் அளவைக் குறைப்பதன் மூலம், பிட்நெட் அது நுகரும் ஆற்றலின் அளவையும் குறைக்கிறது, இது AI தீர்வை மிகவும் நிலையானதாகவும் சுற்றுச்சூழலுக்கு உகந்ததாகவும் ஆக்குகிறது. மேலும், நிலையான வன்பொருளில் பிட்நெட்டை இயக்கும் திறன் விலையுயர்ந்த ஜிபியுக்களின் தேவையை நீக்குகிறது, மாதிரியை பயன்படுத்துவதற்கான செலவையும் குறைக்கிறது.

bitnet.cpp இன் சக்தி

பிட்நெட்டின் விதிவிலக்கான நினைவக திறன் மற்றும் செயல்திறன் பிட்நெட்.சிபிபி எனப்படும் தனிப்பயன் மென்பொருள் கட்டமைப்பால் சாத்தியமாகிறது. இந்த கட்டமைப்பு குறிப்பாக மாதிரியின் டெர்னரி எடைகளின் முழு நன்மையையும் பெற உகந்ததாக உள்ளது, இது அன்றாட கணினி சாதனங்களில் வேகமான மற்றும் இலகுரக செயல்திறனை உறுதி செய்கிறது.

ஹக்கிங் ஃபேஸின் டிரான்ஸ்ஃபார்மர்கள் போன்ற நிலையான AI லைப்ரரிகள் பிட்நெட் b1.58 2B4T போன்ற செயல்திறன் நன்மைகளை வழங்காது, இது தனிப்பயன் பிட்நெட்.சிபிபி கட்டமைப்பைப் பயன்படுத்துவதை இன்றியமையாததாக்குகிறது. கிட்ஹப்பில் கிடைக்கும் இந்த கட்டமைப்பு தற்போது சிபியுக்களுக்கு உகந்ததாக உள்ளது, ஆனால் எதிர்கால புதுப்பிப்புகளில் மற்ற செயலி வகைகளுக்கான ஆதரவு திட்டமிடப்பட்டுள்ளது.

பிட்நெட்.சிபிபியின் வளர்ச்சி AI இல் மென்பொருள் மேம்படுத்தலின் முக்கியத்துவத்திற்கு ஒரு சான்றாகும். வன்பொருள் மற்றும் மாதிரியின் குறிப்பிட்ட பண்புகளுக்கு மென்பொருளை வடிவமைப்பதன் மூலம், டெவலப்பர்கள் செயல்திறன் மற்றும் திறனில் குறிப்பிடத்தக்க ஆதாயங்களை அடைய முடியும். வன்பொருள், மென்பொருள் மற்றும் மாதிரி கட்டமைப்பு அனைத்தும் கவனமாக கருத்தில் கொள்ளப்பட்டு ஒன்றிணைக்கப்படும் AI மேம்பாட்டிற்கு ஒரு முழுமையான அணுகுமுறையின் அவசியத்தை இது எடுத்துக்காட்டுகிறது.

மாதிரி சுருக்கத்திற்கான ஒரு புதிய அணுகுமுறை

நினைவகத்தை சேமிக்க மாதிரி துல்லியத்தைக் குறைக்கும் யோசனை புதிதல்ல, ஆராய்ச்சியாளர்கள் நீண்ட காலமாக மாதிரி சுருக்க நுட்பங்களை ஆராய்ந்து வருகின்றனர். இருப்பினும், கடந்தகால முயற்சிகள் பலவும் பயிற்சிக்குப் பிறகு முழு துல்லியமான மாதிரிகளை மாற்றுவதை உள்ளடக்கியது, பெரும்பாலும் துல்லியத்தின் செலவில். பிட்நெட் b1.58 2B4T ஒரு வித்தியாசமான அணுகுமுறையை எடுத்துக்கொள்கிறது: இது மூன்று எடை மதிப்புகளை மட்டுமே (-1, 0, மற்றும் +1) பயன்படுத்தி தரையில் இருந்து பயிற்றுவிக்கப்படுகிறது. இது முந்தைய முறைகளில் காணப்படும் செயல்திறன் இழப்புகளில் பலவற்றைத் தவிர்க்க அனுமதிக்கிறது.

இந்த ‘பூஜ்ஜியத்திலிருந்து பயிற்சி’ அணுகுமுறை பிட்நெட்டுக்கான முக்கிய வேறுபடுத்தியாகும். குறைந்த துல்லியமான எடைகளைக் கருத்தில் கொண்டு மாதிரியைத் தொடக்கத்திலிருந்தே வடிவமைப்பதன் மூலம், ஆராய்ச்சியாளர்கள் பயிற்சி செயல்முறையை மேம்படுத்தவும், வரையறுக்கப்பட்ட துல்லியம் இருந்தபோதிலும் மாதிரியை திறம்பட கற்றுக்கொள்ளவும் பொதுமைப்படுத்தவும் முடியும் என்பதை உறுதிப்படுத்த முடிந்தது. பாரம்பரிய AI முன்னுதாரணங்களை மறுபரிசீலனை செய்து மாதிரி வடிவமைப்பு மற்றும் பயிற்சிக்கு புதிய அணுகுமுறைகளை ஆராய்வதன் முக்கியத்துவத்தை இது எடுத்துக்காட்டுகிறது.

நிலைத்தன்மை மற்றும் அணுகலுக்கான தாக்கங்கள்

பிட்நெட் போன்ற குறைந்த துல்லியமான AI மாதிரிகளை நோக்கி மாறுவது நிலைத்தன்மை மற்றும் அணுகலுக்கு குறிப்பிடத்தக்க தாக்கங்களை ஏற்படுத்துகிறது. பெரிய AI மாதிரிகளை இயக்குவதற்கு பொதுவாக சக்திவாய்ந்த வன்பொருள் மற்றும் கணிசமான ஆற்றல் தேவைப்படுகிறது, இது செலவுகளை அதிகரிக்கும் மற்றும் சுற்றுச்சூழல் தாக்கத்தை ஏற்படுத்தும் காரணிகளாகும். பிட்நெட் மிகவும் எளிமையான கணக்கீடுகளை நம்பியிருப்பதால் - பெருக்கல்களுக்கு பதிலாக பெரும்பாலும் கூட்டல்கள் - இது மிகக் குறைவான ஆற்றலைப் பயன்படுத்துகிறது.

ஒப்பிடக்கூடிய முழு துல்லியமான மாதிரிகளை விட 85 முதல் 96 சதவீதம் குறைவான ஆற்றலை இது பயன்படுத்துகிறது என்று மைக்ரோசாஃப்ட் ஆராய்ச்சியாளர்கள் மதிப்பிடுகின்றனர். இது மேகக்கணி அடிப்படையிலான சூப்பர் கம்ப்யூட்டர்களின் தேவை இல்லாமல், மேம்பட்ட AI-ஐ நேரடியாக தனிப்பட்ட சாதனங்களில் இயக்குவதற்கான கதவைத் திறக்கக்கூடும். ஆற்றல் நுகர்வு குறைப்பு AI ஐ மிகவும் நிலையானதாக மாற்றுவதற்கும் அதன் கார்பன் தடயத்தைக் குறைப்பதற்கும் ஒரு முக்கிய படியாகும்.

மேலும், தனிப்பட்ட சாதனங்களில் பிட்நெட்டை இயக்கும் திறன் AI-க்கான அணுகலை ஜனநாயகப்படுத்தக்கூடும், பயனர்கள் விலையுயர்ந்த கிளவுட் சேவைகளை நம்பாமல் மேம்பட்ட மொழி மாதிரிகளிலிருந்து பயனடைய அனுமதிக்கிறது. இது கல்வி, சுகாதாரம் மற்றும் பிற துறைகளில் ஆழமான தாக்கத்தை ஏற்படுத்தக்கூடும், அங்கு AI தனிப்பயனாக்கப்பட்ட கற்றலை வழங்கவும், நோய்களைக் கண்டறியவும் மற்றும் தகவல்களுக்கான அணுகலை மேம்படுத்தவும் பயன்படுத்தப்படலாம்.

வரம்புகள் மற்றும் எதிர்கால திசைகள்

பிட்நெட் b1.58 2B4T AI செயல்திறனில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கும் அதே வேளையில், சில வரம்புகள் உள்ளன. இது தற்போது குறிப்பிட்ட வன்பொருளை மட்டுமே ஆதரிக்கிறது மற்றும் தனிப்பயன் பிட்நெட்.சிபிபி கட்டமைப்பைக் கோருகிறது. அதன் சூழல் சாளரம் - அது ஒரு நேரத்தில் செயலாக்கக்கூடிய உரையின் அளவு - மிகவும் மேம்பட்ட மாதிரிகளை விட சிறியது.

இத்தகைய எளிமைப்படுத்தப்பட்ட கட்டிடக்கலையில் மாதிரி ஏன் இவ்வளவு சிறப்பாக செயல்படுகிறது என்பதை ஆராய்ச்சியாளர்கள் இன்னும் விசாரித்து வருகின்றனர். எதிர்கால வேலை அதன் திறன்களை விரிவுபடுத்துவதை நோக்கமாகக் கொண்டுள்ளது, இதில் அதிகமான மொழிகள் மற்றும் நீண்ட உரை உள்ளீடுகளுக்கான ஆதரவு அடங்கும். இந்த தொடர்ச்சியான முயற்சிகள் பிட்நெட்டை மேலும் செம்மைப்படுத்தி மேம்படுத்தும், AI நிலப்பரப்பில் முன்னணி தொழில்நுட்பமாக அதன் இடத்தை உறுதிப்படுத்தும்.

மாதிரியின் கட்டிடக்கலை மற்றும் அதன் திறனை எளிமைப்படுத்தப்பட்ட கட்டமைப்போடு செயல்படுத்துவது எதிர்கால முன்னேற்றங்களுக்கு முக்கியமானது. பிட்நெட் திறமையாக செயல்பட அனுமதிக்கும் அடிப்படைக் வழிமுறைகளைப் புரிந்துகொள்வது இன்னும் மேம்பட்ட மற்றும் சக்திவாய்ந்த AI மாதிரிகளை உருவாக்க வழி வகுக்கும்.

மேலும் மேம்பாடு மாதிரியின் திறன்களை விரிவுபடுத்துவதில் கவனம் செலுத்தும், உலகெங்கிலும் உள்ள தகவல்தொடர்பு தடைகளை உடைக்க பரந்த அளவிலான மொழிகளுக்கான ஆதரவு உட்பட. கூடுதலாக, மாதிரி ஒரு நேரத்தில் செயலாக்கக்கூடிய உரையின் நீளத்தை அதிகரிப்பது இன்னும் சிக்கலான மற்றும் நுணுக்கமான பணிகளைக் கையாள உதவும்.

பிட்நெட்டின் எதிர்காலம் மிகப்பெரிய சாத்தியங்களைக் கொண்டுள்ளது, பல்வேறு தொழில்கள் மற்றும் பயன்பாடுகளில் புரட்சியை உறுதியளிக்கிறது. மாதிரி தொடர்ந்து வளர்ச்சியடைந்து மேம்படும்போது, அது AI இன் எதிர்காலத்தையும் சமூகத்தில் அதன் பங்கையும் சந்தேகத்திற்கு இடமின்றி வடிவமைக்கும்.

பிட்நெட்டின் வளர்ச்சி செயற்கை நுண்ணறிவு துறையில் புதுமைகளை தொடர்ந்து தேடுவதை காட்டுகிறது. வழக்கமான அணுகுமுறைகளுக்கு சவால் விடுப்பதன் மூலமும், சாத்தியமான வரம்புகளைத் தள்ளுவதன் மூலமும், ஆராய்ச்சியாளர்கள் AI மிகவும் அணுகக்கூடிய, நிலையான மற்றும் தாக்கத்தை ஏற்படுத்தும் எதிர்காலத்திற்கு வழி வகுக்கிறார்கள்.