AIயில் ஒரு பாய்ச்சல்: மைக்ரோசாஃப்டின் 1-பிட் மாதிரி

மைக்ரோசாஃப்ட் ஆராய்ச்சியாளர்கள் செயற்கை நுண்ணறிவுத் துறையில் ஒரு அற்புதமான முன்னேற்றத்தை அறிமுகப்படுத்தியுள்ளனர் - ஒரு 1-பிட் AI மாதிரி, இது அதன் வகைகளில் மிகப்பெரியது. இந்த கண்டுபிடிப்பு அதன் செயல்திறனை மேம்படுத்துவதன் மூலமும் அதன் அணுகலை விரிவுபடுத்துவதன் மூலமும் AI உலகில் புரட்சியை ஏற்படுத்தும் என்று உறுதியளிக்கிறது. BitNet b1.58 2B4T என்று பெயரிடப்பட்ட இந்த மாதிரி, MIT உரிமத்தின் கீழ் இலவசமாகக் கிடைக்கிறது மற்றும் சக்திவாய்ந்த GPUs தேவையின்றி ஆப்பிளின் M2 சிப் உட்பட CPUs இல் திறமையாக செயல்படும் வகையில் வடிவமைக்கப்பட்டுள்ளது.

பிட்நெட்களைப் புரிந்துகொள்வது

பிட்நெட்கள், ‘பிட் நெட்வொர்க்குகள்’ என்பதன் சுருக்கம், AI மாதிரியின் உள் எடைகளை -1, 0 மற்றும் 1 ஆகிய மூன்று சாத்தியமான மதிப்புகளாக சுருக்குவதன் மூலம் செயல்படுகின்றன. குவாண்டைசேஷன் எனப்படும் இந்த செயல்முறை, மாதிரிகளை இயக்க தேவையான கணக்கீட்டு சக்தி மற்றும் நினைவகத்தை வியத்தகு முறையில் குறைக்கிறது. இது வளங்கள் குறைவாக உள்ள சூழல்களுக்கு மிகவும் பொருத்தமானதாக ஆக்குகிறது, பல்வேறு அமைப்புகளில் AI பயன்பாட்டிற்கான புதிய சாத்தியங்களைத் திறக்கிறது.

செயல்திறன் மற்றும் திறன்கள்

மைக்ரோசாஃப்ட் ஆராய்ச்சி குழு பிட்நெட் பி1.58 2பி4டி 2 பில்லியன் அளவுருக்களை உள்ளடக்கியது என்று தெரிவித்துள்ளது. இது 4 டிரில்லியன் டோக்கன்களைக் கொண்ட ஒரு பெரிய தரவுத்தொகுப்பைப் பயன்படுத்தி பயிற்சி அளிக்கப்பட்டது, இது தோராயமாக 33 மில்லியன் புத்தகங்களின் உரை உள்ளடக்கத்திற்கு சமம். அதன் சுருக்கப்பட்ட அமைப்பு இருந்தபோதிலும், மாதிரி தரமான AI அளவுகோல்களின் வரிசையில் ஈர்க்கக்கூடிய செயல்திறனை நிரூபித்துள்ளது. மெட்டாவின் லாமா 3.2 1பி, கூகிளின் ஜெம்மா 3 1பி மற்றும் அலிபாபாவின் கியூவென் 2.5 1.5பி உள்ளிட்ட ஒப்பீட்டளவில் அளவிலான பிற முக்கிய மாதிரிகளை பிட்நெட் பி1.58 2பி4டி மிஞ்சியது என்று சோதனை காட்டுகிறது. இது கணித சிக்கல் தீர்க்கும் (GSM8K) மற்றும் பொது அறிவு பகுத்தறிவு (PIQA) போன்ற பகுதிகளில் சிறந்த வலிமையைக் காட்டியுள்ளது.

வேகம் மற்றும் திறன்

ஒருவேளை இன்னும் குறிப்பிடத்தக்கது என்னவென்றால், மாதிரியின் வேகம் மற்றும் திறன். மைக்ரோசாஃப்ட் ஆராய்ச்சியாளர்கள் பிட்நெட் பி1.58 2பி4டி பாரம்பரிய 2 பில்லியன்-அளவுரு மாதிரிகளை விட இரண்டு மடங்கு வேகத்தில் செயல்பட முடியும் என்று கூறுகின்றனர். வழக்கமாகத் தேவைப்படும் நினைவகத்தின் ஒரு பகுதியை மட்டுமே பயன்படுத்தும் போது இவை அனைத்தும் சாத்தியமாகிறது. இது முன்னர் தேவைப்படும் பணிகளுக்கு தகுதியற்றதாகக் கருதப்பட்ட சாதனங்களில் அதிநவீன AI கருவிகளை இயக்குவதற்கான திறனைத் திறக்கிறது. இந்த முன்னேற்றத்தின் தாக்கங்கள் தொலைநோக்குடையவை, AI ஆனது அன்றாட சாதனங்களில் மிகவும் அணுகக்கூடியதாகவும் ஒருங்கிணைக்கப்பட்டதாகவும் இருக்கும் எதிர்காலத்தை பரிந்துரைக்கிறது.

உருவாக்குநர்களிடமிருந்து ஒரு வார்த்தை

‘இது ஒரு அற்புதமான முன்னெடுப்பு’ என்று மைக்ரோசாஃப்ட் குழு அதிகாரப்பூர்வ அறிவிப்பில் தெரிவித்துள்ளது. ‘செயல்திறனை வியத்தகு முறையில் தியாகம் செய்யாமல் மாதிரி எடைகளை 1 பிட்டாக சுருக்குவதன் மூலம், பெரிய அளவிலான AI திறன்களை இன்னும் பல வகையான வன்பொருள்களுக்கு கொண்டு வருவதைப் பற்றி சிந்திக்க ஆரம்பிக்கலாம்.’ பிட்நெட்டின் பின்னணியில் உள்ள முக்கிய தொலைநோக்கு இந்த அறிக்கை கூறுகிறது: AI ஐ பரவலாகப் பயன்படுத்துவதன் மூலம் அதை பரந்த அளவிலான பயனர்கள் மற்றும் சாதனங்களுக்கு அணுகக்கூடியதாக மாற்றுவதாகும்.

தற்போதைய வரம்புகள்

இருப்பினும், இந்த முன்னேற்றம் அதன் வரம்புகள் இல்லாமல் இல்லை. பிட்நெட் பி1.58 2பி4டி மாதிரி தற்போது அதன் விளம்பரப்படுத்தப்பட்ட செயல்திறன் அளவை அடைய மைக்ரோசாஃப்ட்டின் தனிப்பயனாக்கப்பட்ட கட்டமைப்பு, பிட்நெட்.சிபிபியைப் பயன்படுத்துகிறது. இந்த கட்டமைப்பு, அதன் தற்போதைய வளர்ச்சியில், குறிப்பிட்ட CPU வன்பொருள் உள்ளமைவுகளை மட்டுமே ஆதரிக்கிறது மற்றும் GPUs உடன் வேலை செய்யாது, இது AI உள்கட்டமைப்பு நிலப்பரப்பில் ஆதிக்கம் செலுத்தும் சக்தியாக உள்ளது. ஒரு குறிப்பிட்ட கட்டமைப்பைச் சார்ந்திருப்பது மற்றும் GPU ஆதரவு இல்லாமை ஆகியவை குறுகிய காலத்தில் பிட்நெட்டின் பரவலான பயன்பாட்டைக் கட்டுப்படுத்தக்கூடும்.

GPU ஆதரவின் சவால்

GPU ஆதரவு இல்லாதது பரவலான பயன்பாட்டிற்கு ஒரு குறிப்பிடத்தக்க தடையாக இருக்கலாம். தற்போதைய AI பணிப்பாய்வுகளில், குறிப்பாக கிளவுட் கம்ப்யூட்டிங் மற்றும் பெரிய அளவிலான மாதிரி பயன்பாட்டில் GPU முடுக்கம் பெரிதும் நம்பப்படுகிறது. பரந்த வன்பொருள் பொருந்தக்கூடிய தன்மை இல்லாமல், பிட்நெட்கள் இப்போதைக்கு முக்கிய பயன்பாடுகளுக்கு மட்டுப்படுத்தப்படலாம். இந்த வரம்புகளை சமாளிப்பது பிட்நெட் அதன் முழு திறனையும் உணர்ந்து ஒரு முக்கிய AI தீர்வாக மாற முக்கியமானது.

AI இன் எதிர்காலத்திற்கான தாக்கங்கள்

பிட்நெட் பி1.58 2பி4டி மாதிரியின் மைக்ரோசாஃப்ட் வளர்ச்சி AI ஐ மிகவும் அணுகக்கூடியதாகவும் திறமையானதாகவும் மாற்றுவதற்கான ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது. மாதிரி எடைகளை 1-பிட் வடிவமாக சுருக்குவதன் மூலம், மாதிரி குறிப்பிடத்தக்க வேகம் மற்றும் நினைவக திறனை அடைகிறது, இது சக்திவாய்ந்த GPUs தேவையின்றி CPUs இல் இயக்க உதவுகிறது. இந்த கண்டுபிடிப்பு AI உலகில் புரட்சியை ஏற்படுத்தும் திறனைக் கொண்டுள்ளது, இது பெரிய அளவிலான AI திறன்களை பரந்த அளவிலான சாதனங்கள் மற்றும் பயனர்களுக்கு கொண்டு வருகிறது. இருப்பினும், மாதிரியின் தற்போதைய வரம்புகள், குறிப்பாக GPU ஆதரவு இல்லாமை, அதன் பரவலான பயன்பாட்டை உறுதிப்படுத்த சரிசெய்யப்பட வேண்டும்.

பிட்நெட்டின் தொழில்நுட்ப அம்சங்களை ஆழமாக ஆராய்தல்

AI மாதிரிகள் வடிவமைக்கப்பட்டு செயல்படுத்தப்படும் விதத்தில் பிட்நெட்டின் கட்டமைப்பு ஒரு ஆழமான மாற்றத்தைக் குறிக்கிறது. மிதக்கும் புள்ளி எண்களை எடைகள் மற்றும் செயல்பாடுகளைக் குறிக்க நம்பியிருக்கும் பாரம்பரிய நரம்பியல் நெட்வொர்க்குகளைப் போலன்றி, பிட்நெட் ஒரு பைனரி பிரதிநிதித்துவத்தைப் பயன்படுத்துகிறது. இந்த எளிமைப்படுத்தல் மாதிரியின் நினைவக தடயத்தை மற்றும் கணக்கீட்டு சிக்கலை வியத்தகு முறையில் குறைக்கிறது, இது குறைந்த வளம் கொண்ட சாதனங்களில் இயக்க உதவுகிறது. ஒவ்வொரு எடையும் ஒரு பிட் மூலம் மட்டுமே குறிக்கப்படுவதே முக்கிய யோசனை, இது மூன்று சாத்தியமான மதிப்புகளை அனுமதிக்கிறது: -1, 0 மற்றும் 1. இது வழக்கமான நரம்பியல் நெட்வொர்க்குகளில் பொதுவாகப் பயன்படுத்தப்படும் 32-பிட் அல்லது 64-பிட் மிதக்கும் புள்ளி எண்களுடன் கூர்மையாக வேறுபடுகிறது.

இந்த அணுகுமுறையின் நன்மைகள் பல உள்ளன. முதலாவதாக, நினைவக தேவைகள் கணிசமாகக் குறைக்கப்படுகின்றன, இது ஸ்மார்ட்போன்கள், உட்பொதிக்கப்பட்ட அமைப்புகள் மற்றும் IoT சாதனங்கள் போன்ற வரையறுக்கப்பட்ட நினைவக திறன் கொண்ட சாதனங்களில் AI மாதிரிகளைப் பயன்படுத்துவதற்கு முக்கியமானது. இரண்டாவதாக, பைனரி செயல்பாடுகள் மிதக்கும் புள்ளி செயல்பாடுகளை விட மிக வேகமாகவும் அதிக ஆற்றல் திறமையுடனும் இருப்பதால், கணக்கீட்டு சிக்கலும் குறைக்கப்படுகிறது. இது வேகமான அனுமான வேகங்கள் மற்றும் குறைந்த மின் நுகர்வு ஆகியவற்றிற்கு வழிவகுக்கிறது.

இருப்பினும், பைனரி பிரதிநிதித்துவத்தைப் பயன்படுத்துவதில் தொடர்புடைய சவால்களும் உள்ளன. குறைந்த துல்லியம் துல்லியத்தன்மையின் இழப்புக்கு வழிவகுக்கும், ஏனெனில் மாதிரிக்கு வேலை செய்ய குறைந்த தகவல் உள்ளது. இந்த சிக்கலைக் குறைக்க, பைனரி பிரதிநிதித்துவத்தின் செயல்திறனிலிருந்து பயனடையும் போது செயல்திறனைப் பராமரிக்க பிட்நெட் பல நுட்பங்களைப் பயன்படுத்துகிறது. இந்த நுட்பங்களில் பின்வருவன அடங்கும்:

  • குவாண்டைசேஷன்-விழிப்பு பயிற்சி: மாதிரி பைனரி தடைகளைக் கருத்தில் கொண்டு பயிற்சி அளிப்பதை இது உள்ளடக்குகிறது, இதனால் அது குறைந்த துல்லியத்திற்கு ஏற்றவாறு கற்றுக்கொள்கிறது.
  • ஸ்டோகாஸ்டிக் குவாண்டைசேஷன்: பயிற்சியின் போது எடைகளை தோராயமாக குவாண்டைஸ் செய்வதை இது உள்ளடக்குகிறது, இது பைனரி பிரதிநிதித்துவத்திற்கு மாதிரி அதிகப்படியாகப் பொருந்துவதைத் தடுக்க உதவுகிறது.
  • கலப்பு-துல்லிய பயிற்சி: பயிற்சியின் போது பைனரி மற்றும் மிதக்கும் புள்ளி பிரதிநிதித்துவங்களின் கலவையைப் பயன்படுத்துவதை இது உள்ளடக்குகிறது, இது மிதக்கும் புள்ளி பிரதிநிதித்துவத்தின் துல்லியத்தைப் பராமரிக்கும் போது பைனரி பிரதிநிதித்துவத்தின் செயல்திறனைப் பயன்படுத்த மாதிரியை அனுமதிக்கிறது.

CPU செயல்பாட்டின் முக்கியத்துவம்

CPU களில் பிட்நெட்டை இயக்க முடியும் என்பது ஒரு பெரிய முன்னேற்றம், ஏனெனில் இது AI பயன்பாட்டிற்கான புதிய சாத்தியங்களைத் திறக்கிறது. பாரம்பரியமாக, AI மாதிரிகள் GPUs ஐ பெரிதும் நம்பியுள்ளன, அவை இணையான செயலாக்கத்திற்காக வடிவமைக்கப்பட்ட சிறப்பு வன்பொருள் முடுக்கிகள். GPUs சிறந்த செயல்திறனை வழங்கினாலும், அவை விலை உயர்ந்தவை மற்றும் அதிக ஆற்றல் நுகர்வு கொண்டவை, இது பல பயன்பாடுகளுக்கு பொருத்தமற்றதாக அமைகிறது.

CPU கள், மறுபுறம், எங்கும் காணப்படுகின்றன மற்றும் ஒப்பீட்டளவில் மலிவானவை. அவை ஸ்மார்ட்போன்கள் முதல் மடிக்கணினிகள் வரை சேவையகங்கள் வரை கிட்டத்தட்ட ஒவ்வொரு எலக்ட்ரானிக் சாதனத்திலும் காணப்படுகின்றன. CPU களில் திறமையாக இயக்க AI மாதிரிகளை இயக்குவதன் மூலம், AI ஐ பரந்த அளவிலான அமைப்புகளில் பயன்படுத்த பிட்நெட் உதவுகிறது. இது AI இன் ஜனநாயகமயமாக்கலுக்கு வழிவகுக்கும், ஏனெனில் இது விலையுயர்ந்த GPU வன்பொருளை அணுகக்கூடியவர்களுக்கு மட்டுப்படுத்தப்படாது.

CPU களில் பிட்நெட்டின் திறன் பல காரணிகளால் ஏற்படுகிறது. முதலாவதாக, மாதிரியின் பைனரி பிரதிநிதித்துவம் செயலாக்கப்பட வேண்டிய தரவுகளின் அளவைக் குறைக்கிறது. இரண்டாவதாக, கணக்கீட்டு செயல்பாடுகள் எளிமைப்படுத்தப்படுகின்றன, இது அவற்றை வேகமாகவும் அதிக ஆற்றல் திறமையுடனும் ஆக்குகிறது. மூன்றாவதாக, மாதிரி மிகவும் இணையானதாக வடிவமைக்கப்பட்டுள்ளது, இது நவீன CPU களில் காணப்படும் பல கோர்களைப் பயன்படுத்த அனுமதிக்கிறது.

பயன்பாடுகள் மற்றும் பயன்பாட்டு வழக்குகள்

பிட்நெட்டின் சாத்தியமான பயன்பாடுகள் பரந்தவை மற்றும் பலதரப்பட்ட தொழில்களை உள்ளடக்கியது. மிகவும் நம்பிக்கைக்குரிய பயன்பாட்டு வழக்குகள் சில:

  • மொபைல் AI: படங்கள் மற்றும் மொழிகளைப் பகுப்பாய்வு செய்யவும், உங்களுக்கேற்ற பரிந்துரைகளை வழங்கவும் ஸ்மார்ட்போன்கள் மற்றும் இதர மொபைல் கருவிகளில் AI மாதிரிகளை இயக்க பிட்நெட் பயன்படுத்தப்படலாம்.
  • எட்ஜ் AI: தரவுகளை கிளவுட்க்கு அனுப்பாமல், உங்கள் அருகாமையிலேயே பணிகளைச் செய்ய கேமராக்கள் மற்றும் சென்சார்களில் இதை பயன்படுத்தலாம்.
  • IoT: அறிவார்ந்த வீடுகள், அணியக்கூடிய கருவிகள் மற்றும் தொழிற்சாலை உபகரணங்கள் போன்ற IoT சாதனங்களில் இதை பயன்படுத்த முடியும்.
  • அணுகல்தன்மை: பேச்சு அடையாளம், உரை-பேச்சு மற்றும் உதவி தொழில்நுட்பங்கள் மூலம் குறைபாடுகள் உள்ள நபர்களுக்கு AI ஐ பிட்நெட் அணுகச் செய்ய முடியும்.
  • கல்வி: தனிப்பயனாக்கப்பட்ட கற்றல் தளங்கள் மற்றும் அறிவார்ந்த கற்பித்தல் முறைமைகள் போன்ற AI-இயங்கும் கல்வி கருவிகளை உருவாக்க இதைப் பயன்படுத்தலாம்.
  • சுகாதாரம்: மருத்துவப் பட பகுப்பாய்வு, மருந்து கண்டுபிடிப்பு மற்றும் தனிப்பயனாக்கப்பட்ட மருத்துவம் போன்ற அம்சங்களை செயல்படுத்துவதன் மூலம் சுகாதார விளைவுகளை பிட்நெட் மேம்படுத்த முடியும்.
  • நிதி: மோசடி கண்டறிதல், இடர் மேலாண்மை மற்றும் அல்காரிதம் வர்த்தகம் போன்ற அம்சங்களை செயல்படுத்துவதன் மூலம் பிட்நெட் நிதி சேவைகளை மேம்படுத்த முடியும்.
  • உற்பத்தி: கணிப்பு பராமரிப்பு, தரக் கட்டுப்பாடு மற்றும் விநியோகச் சங்கிலி மேலாண்மை போன்ற அம்சங்களை செயல்படுத்துவதன் மூலம் உற்பத்தி செயல்முறைகளை பிட்நெட் மேம்படுத்த முடியும்.

வரம்புகளை நிவர்த்தி செய்தல்: முன்னோக்கி செல்லும் பாதை

AI தொழில்நுட்பத்தில் பிட்நெட் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கும் அதே வேளையில், அதன் வரம்புகளையும் எதிர்கொள்ளும் சவால்களையும் ஒப்புக்கொள்வது முக்கியம். மைக்ரோசாஃப்ட்டின் தனிப்பயனாக்கப்பட்ட கட்டமைப்பு, பிட்நெட்.சிபிபி மற்றும் GPU ஆதரவு இல்லாதது ஆகியவை அதன் பரவலான பயன்பாட்டை உறுதிப்படுத்தப்பட வேண்டிய குறிப்பிடத்தக்க தடைகள்.

இந்த வரம்புகளை சமாளிக்க, மைக்ரோசாஃப்ட் மற்றும் பரந்த AI சமூகம் பின்வரும் பகுதிகளில் கவனம் செலுத்த வேண்டும்:

  • தரநிலைப்படுத்தல்: 1-பிட் AI மாதிரிகளுக்கான திறந்த தரங்களை உருவாக்குவது பரவலான தத்தெடுப்பு மற்றும் ஒன்றோடொன்று செயல்படுவதை ஊக்குவிக்கும்.
  • வன்பொருள் பொருந்தக்கூடிய தன்மை: GPUs மற்றும் பிற சிறப்பு முடுக்கிகள் உட்பட வன்பொருள் பொருந்தக்கூடிய தன்மையை விரிவுபடுத்துவது பிட்நெட்டின் முழு திறனையும் திறக்கும் மற்றும் பரந்த அளவிலான சூழல்களில் அதன் பயன்பாட்டை இயக்கும்.
  • கட்டமைப்பு ஒருங்கிணைப்பு: TensorFlow மற்றும் PyTorch போன்ற பிரபலமான AI கட்டமைப்புகளில் பிட்நெட்டை ஒருங்கிணைப்பது டெவலப்பர்கள் தொழில்நுட்பத்தைப் பயன்படுத்தவும் பரிசோதிக்கவும் எளிதாக்கும்.
  • சமூக ஆதரவு: பிட்நெட்டைச் சுற்றி ஒரு வலுவான சமூகத்தை உருவாக்குவது ஒத்துழைப்பை ஊக்குவிக்கும் மற்றும் புதுமையை துரிதப்படுத்தும்.

இந்த வரம்புகளை நிவர்த்தி செய்வதன் மூலம், பிட்நெட் AI உலகில் உண்மையான புரட்சியை ஏற்படுத்தவும் அதை அனைவருக்கும் மிகவும் அணுகக்கூடியதாகவும் திறமையானதாகவும் மாற்ற முடியும். AI ஆனது நமது அன்றாட வாழ்க்கையில் தடையின்றி ஒருங்கிணைக்கப்படும் ஒரு எதிர்காலத்திற்கான பயணம் நடந்து கொண்டிருக்கிறது, மேலும் அந்த எதிர்காலத்தை வடிவமைப்பதில் பிட்நெட் ஒரு முக்கிய பங்காற்றுகிறது.