பிக்சல்களின் விலை: OpenAI GPU நெருக்கடியை எதிர்கொள்கிறது

வெளிப்படையான ஒப்புதல்: புதுமை உள்கட்டமைப்பை மிஞ்சும்போது

செயற்கை நுண்ணறிவின் வேகமான உலகில், வெற்றி சில சமயங்களில் அதிக வெப்பமடையும் ஒரு server rack போலத் தோன்றலாம். OpenAI CEO Sam Altman சமீபத்தில் இந்த சித்திரத்தை வரைந்து காட்டினார். நிறுவனத்தின் சமீபத்திய முதன்மை மாடல் GPT-4o இல் ஒருங்கிணைக்கப்பட்ட பட உருவாக்கத் திறன்களுக்கான பயனர் உற்சாகத்தின் வெடிப்பை எதிர்கொண்ட Altman, ஒரு கடுமையான செய்தியை வழங்கினார்: தேவை அவர்களின் வன்பொருளை அதன் வரம்புகளுக்குத் தள்ளியது. சமூக ஊடக தளமான X இல் அவர் தேர்ந்தெடுத்த வார்த்தைகள் ஒரு தொழில்நுட்ப நிர்வாகிக்கு அசாதாரணமாக அப்பட்டமாக இருந்தன, நிறுவனத்தின் GPU-க்கள் - AI கணக்கீட்டிற்கு அத்தியாவசியமான சக்திவாய்ந்த கிராபிக்ஸ் செயலாக்க அலகுகள் - ‘உருகுகின்றன’ என்று சந்தேகத்திற்கு இடமின்றி கூறினார். இது நிச்சயமாக ஒரு நேரடி உருகுதல் அல்ல, ஆனால் மில்லியன் கணக்கான பயனர்கள் ஒரே நேரத்தில் புதிய படங்களை உருவாக்க AI-க்கு பணிபுரியும் போது ஏற்படும் தீவிர கணக்கீட்டு அழுத்தத்திற்கான ஒரு தெளிவான உருவகம். இந்த அறிவிப்பு உடனடி, தற்காலிக செயல்பாட்டு சரிசெய்தலைக் குறித்தது: OpenAI சுமையை நிர்வகிக்க பட உருவாக்க கோரிக்கைகளில் விகித வரம்புகளை செயல்படுத்தும்.

இந்த நிலைமை AI துறையில் ஒரு அடிப்படை பதற்றத்தை அடிக்கோடிட்டுக் காட்டுகிறது: அதிக திறன் வாய்ந்த, மேலும் அணுகக்கூடிய மாடல்களுக்கான நிலையான உந்துதல் மற்றும் அவற்றை இயக்கத் தேவையான உண்மையான, மிகவும் விலையுயர்ந்த பௌதீக உள்கட்டமைப்பு. Altman-இன் ஒப்புதல், நேர்த்தியான பயனர் இடைமுகங்கள் மற்றும் மாயாஜாலமாகத் தோன்றும் AI திறன்களுக்குப் பின்னால் பெரும்பாலும் மறைந்திருக்கும் செயல்பாட்டு யதார்த்தங்களை வெளிச்சத்திற்குக் கொண்டுவருகிறது. ‘உருகும்’ GPU-க்கள், சமீப காலம் வரை பெரும்பாலும் ஆராய்ச்சி ஆய்வகங்கள் அல்லது முக்கிய பயன்பாடுகளுக்குள் மட்டுப்படுத்தப்பட்டிருந்த ஒரு தொழில்நுட்பத்தை ஜனநாயகப்படுத்துவதன் உறுதியான விளைவாகும். GPT-4o-இன் பட அம்சத்தின் பெரும் புகழ், குறிப்பாக Studio Ghibli போன்ற குறிப்பிட்ட பாணிகளை உருவாக்கும் அதன் திறன், அதன் சொந்த வெற்றியின் பலியாக மாறியது, அடிப்படை வளக் கட்டுப்பாடுகளைப் பற்றிய பொது ஒப்புதலுக்கு கட்டாயப்படுத்தியது.

திரைக்குப் பின்னால்: ஏன் கிராபிக்ஸ் செயலிகள் AI-இன் ஆற்றல் மையமாக உள்ளன

டிஜிட்டல் படங்களை உருவாக்குவதில் பயனர் உற்சாகம் ஏன் இத்தகைய இடையூறை ஏற்படுத்தும் என்பதைப் புரிந்து கொள்ள, Graphics Processing Units (GPU)-களின் பங்கை மதிப்பிடுவது முக்கியம். முதலில் வீடியோ கேம்களுக்கான சிக்கலான கிராபிக்ஸ்களை வழங்க வடிவமைக்கப்பட்ட GPU-க்கள், ஒரே நேரத்தில் பல கணக்கீடுகளைச் செய்வதற்கு உகந்ததாக ஒரு தனித்துவமான கட்டமைப்பைக் கொண்டுள்ளன. இந்த இணை செயலாக்கத் திறன், பெரிய AI மாடல்களைப் பயிற்றுவிப்பதற்கும் இயக்குவதற்கும் சம்பந்தப்பட்ட கணித ரீதியான கடின உழைப்புக்கு விதிவிலக்காகப் பொருத்தமானதாக ஆக்குகிறது. இயந்திர கற்றல் போன்ற பணிகள், குறிப்பாக GPT-4o போன்ற மாடல்களை இயக்கும் ஆழமான கற்றல், அணி பெருக்கங்கள் மற்றும் பல சிறிய, சுயாதீனமான கணக்கீடுகளாகப் பிரிக்கக்கூடிய பிற செயல்பாடுகளை பெரிதும் நம்பியுள்ளன - இதுதான் GPU-க்கள் சிறந்து விளங்குகின்றன.

ஒரு உரை தூண்டுதலிலிருந்து ஒரு படத்தை உருவாக்குவது, பயனருக்கு உடனடியாகத் தோன்றினாலும், ஒரு சிக்கலான கணக்கீட்டு நடனத்தை உள்ளடக்கியது. AI மாதிரி மொழியின் நுணுக்கங்களை விளக்க வேண்டும், அதன் பரந்த உள் அறிவுத் தளத்தை அணுக வேண்டும், காட்சியை கருத்தியல் செய்ய வேண்டும், பின்னர் அந்த கருத்தை பிக்சல்களின் கட்டமாக மொழிபெயர்க்க வேண்டும், கலவை, நிறம், விளக்கு மற்றும் பாணி போன்ற கூறுகளைக் கருத்தில் கொள்ள வேண்டும். ஒவ்வொரு படிக்கும் மகத்தான கணக்கீட்டு சக்தி தேவைப்படுகிறது. ஒரே நேரத்தில் கோரிக்கைகளை வைக்கும் மில்லியன் கணக்கான பயனர்களால் பெருக்கப்படும்போது, GPU தொகுதிகளின் தேவை வானியல் ரீதியாகிறது. பணிகளை வரிசையாகக் கையாளும் பொது நோக்கத்திற்கான Central Processing Units (CPU)-களைப் போலல்லாமல், GPU-க்கள் இந்த பாரிய இணை பணிச்சுமைகளைக் கையாளுகின்றன, AI புரட்சியை இயக்கும் சிறப்பு இயந்திரங்களாக செயல்படுகின்றன. இருப்பினும், இந்த சக்திவாய்ந்த செயலிகளுக்கும் வரையறுக்கப்பட்ட திறன் உள்ளது மற்றும் அதிக சுமையின் கீழ் குறிப்பிடத்தக்க வெப்பத்தை உருவாக்குகின்றன. Altman-இன் ‘உருகும்’ கருத்து, எனவே, அதிநவீன AI-ஐ அளவில் இயக்கும் உள்ளார்ந்த பௌதீக வரம்புகள் மற்றும் ஆற்றல் தேவைகளை நேரடியாக சுட்டிக்காட்டுகிறது. தேவையின் எழுச்சி OpenAI-இன் கணக்கீட்டு நெடுஞ்சாலையில் ஒரு போக்குவரத்து நெரிசலை திறம்பட உருவாக்கியது, ஓட்டத்தைக் கட்டுப்படுத்த நடவடிக்கைகளை அவசியமாக்கியது.

GPT-4o: படைப்புத் தீப்பொறியை (மற்றும் சேவையகங்களை) தூண்டும் வினையூக்கி

இந்த உள்கட்டமைப்பு அழுத்தத்திற்கான குறிப்பிட்ட தூண்டுதல் GPT-4o-இன் வெளியீடு ஆகும், இது OpenAI-இன் சமீபத்திய மற்றும் மிகவும் அதிநவீன பன்முக AI மாதிரி. நிறுவனத்தால் அவர்களின் ‘மிகவும் மேம்பட்ட பட ஜெனரேட்டர்’ என்று அறிவிக்கப்பட்ட GPT-4o, ஒரு அதிகரிக்கும் மேம்படுத்தல் மட்டுமல்ல; இது திறன் மற்றும் ஒருங்கிணைப்பில் ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறித்தது. முந்தைய மறு செய்கைகளில் பட உருவாக்கம் ஒரு தனி அல்லது குறைவான செம்மைப்படுத்தப்பட்ட அம்சமாக இருந்திருக்கலாம் போலல்லாமல், GPT-4o உரை, பார்வை மற்றும் ஆடியோ செயலாக்கத்தை தடையின்றி கலக்கிறது, அரட்டை இடைமுகத்திற்குள் நேரடியாக அதிநவீன பட உருவாக்கம் உட்பட மிகவும் உள்ளுணர்வு மற்றும் சக்திவாய்ந்த தொடர்புகளை அனுமதிக்கிறது.

OpenAI, GPT-4o-இன் பட உருவாக்கத் திறனில் பல முக்கிய முன்னேற்றங்களை முன்னிலைப்படுத்தியது:

  • Photorealism மற்றும் துல்லியம்: இந்த மாதிரி பார்வைக்கு ஈர்க்கக்கூடிய வெளியீடுகளை உருவாக்குவதோடு மட்டுமல்லாமல், பயனரின் தூண்டுதலுக்கு துல்லியமாகவும் உண்மையாகவும் வடிவமைக்கப்பட்டுள்ளது, மிகவும் யதார்த்தமான படங்களை உருவாக்கும் திறன் கொண்டது.
  • Text Rendering: AI பட ஜெனரேட்டர்களுக்கு ஒரு மோசமான சவால், படங்களுக்குள் உரையை துல்லியமாக வழங்குவதாகும். GPT-4o இந்த பகுதியில் குறிப்பிடத்தக்க முன்னேற்றங்களைக் காட்டியது, பயனர்கள் குறிப்பிட்ட சொற்கள் அல்லது சொற்றொடர்களை உள்ளடக்கிய படங்களை மிகவும் நம்பகத்தன்மையுடன் உருவாக்க அனுமதிக்கிறது.
  • Prompt Adherence: இந்த மாதிரி சிக்கலான மற்றும் நுணுக்கமான தூண்டுதல்களைப் பற்றிய சிறந்த புரிதலை வெளிப்படுத்தியது, சிக்கலான பயனர் கோரிக்கைகளை அதனுடன் தொடர்புடைய காட்சி கூறுகளாக அதிக நம்பகத்தன்மையுடன் மொழிபெயர்த்தது.
  • Contextual Awareness: GPT-4o-இன் அடிப்படை சக்தியைப் பயன்படுத்தி, பட ஜெனரேட்டர் நடந்துகொண்டிருக்கும் அரட்டை சூழலையும் அதன் பரந்த அறிவுத் தளத்தையும் பயன்படுத்த முடியும். இதன் பொருள், உரையாடலின் முந்தைய பகுதிகளைப் பிரதிபலிக்கும் அல்லது விவாதிக்கப்பட்ட சிக்கலான கருத்துக்களை உள்ளடக்கிய படங்களை இது உருவாக்கக்கூடும்.
  • Image Manipulation: பயனர்கள் ஏற்கனவே உள்ள படங்களை பதிவேற்றலாம் மற்றும் அவற்றை உத்வேகமாகப் பயன்படுத்தலாம் அல்லது அவற்றை மாற்றியமைக்க AI-க்கு அறிவுறுத்தலாம், இது படைப்புக் கட்டுப்பாடு மற்றும் கணக்கீட்டுத் தேவையின் மற்றொரு அடுக்கைச் சேர்க்கிறது.

அணுகல்தன்மை (பிரபலமான ChatGPT இடைமுகத்தில் நேரடியாக ஒருங்கிணைக்கப்பட்டது) மற்றும் மேம்பட்ட திறன் ஆகியவற்றின் இந்த சக்திவாய்ந்த கலவையே வைரல் தத்தெடுப்பைத் தூண்டியது. பயனர்கள் விரைவாக பரிசோதனை செய்யத் தொடங்கினர், தொழில்நுட்பத்தின் எல்லைகளைத் தள்ளி, தங்கள் படைப்புகளை ஆன்லைனில் பரவலாகப் பகிர்ந்து கொண்டனர். Studio Ghibli-இன் தனித்துவமான, விசித்திரமான பாணியில் படங்களை உருவாக்கும் போக்கு குறிப்பாக முக்கியத்துவம் பெற்றது, இது குறிப்பிட்ட கலை அழகியலைப் பிடிக்கும் மாதிரியின் திறனைக் காட்டியது. இந்த கரிம, பரவலான தத்தெடுப்பு, மாதிரியின் கவர்ச்சிக்கு ஒரு சான்றாக இருந்தாலும், OpenAI-இன் கிடைக்கக்கூடிய GPU வளங்களை விரைவாக உட்கொண்டது, இது நேரடியாக தலையீட்டின் தேவைக்கு வழிவகுத்தது. GPT-4o-இன் பட உருவாக்கத்தை மிகவும் கவர்ந்திழுக்கும் அம்சங்களே கணக்கீட்டு ரீதியாக தீவிரமானவை, பரவலான ஈர்ப்பை ஒரு குறிப்பிடத்தக்க செயல்பாட்டு சவாலாக மாற்றியது.

சிற்றலை விளைவு: விகித வரம்புகள் மற்றும் பயனர் எதிர்பார்ப்புகளை வழிநடத்துதல்

விகித வரம்புகளின் அமலாக்கம், Altman-ஆல் தற்காலிகமானது என்று அறிவிக்கப்பட்டாலும், தவிர்க்க முடியாமல் சேவை அடுக்குகளில் பயனர் அனுபவத்தைப் பாதிக்கிறது. Altman பொதுவான விகித வரம்புகளின் சரியான தன்மையைக் குறிப்பிடவில்லை, இது கட்டண அடுக்குகளின் பயனர்களுக்கு சில தெளிவின்மையை ஏற்படுத்தியது. இருப்பினும், அவர் இலவச அடுக்குக்கு ஒரு உறுதியான எண்ணை வழங்கினார்: சந்தா இல்லாத பயனர்கள் விரைவில் ஒரு நாளைக்கு மூன்று பட உருவாக்கங்களுக்கு மட்டுமே கட்டுப்படுத்தப்படுவார்கள். இது ஆரம்பத்தில் பரந்த அணுகலில் இருந்து ஒரு குறிப்பிடத்தக்க பின்வாங்கலைக் குறிக்கிறது மற்றும் இலவசமாக கணக்கீட்டு ரீதியாக விலையுயர்ந்த சேவைகளை வழங்குவதன் பொருளாதார யதார்த்தங்களை எடுத்துக்காட்டுகிறது.

இலவச அடுக்கை நம்பியிருக்கும் பயனர்களுக்கு, இந்த வரம்பு பரிசோதனை செய்வதற்கும் பட உருவாக்க அம்சத்தைப் பயன்படுத்துவதற்கும் அவர்களின் திறனைக் கடுமையாகக் குறைக்கிறது. ஒரு நாளைக்கு மூன்று தலைமுறைகள் சில அடிப்படை பயன்பாட்டை அனுமதிக்கும் அதே வேளையில், விரிவான படைப்பு ஆய்வு, தூண்டுதல்களின் மறு செய்கை சுத்திகரிப்பு அல்லது ஒரு கருத்துக்கு பல விருப்பங்களை உருவாக்குவதற்குத் தேவையான திறனைக் காட்டிலும் இது குறைவாக உள்ளது. இந்த முடிவு மேம்பட்ட பட உருவாக்கத் திறனை முதன்மையாக ஒரு பிரீமியம் அம்சமாக திறம்பட நிலைநிறுத்துகிறது, இது ChatGPT Plus, Pro, Team, அல்லது Select அடுக்குகளுக்கு சந்தா செலுத்தியவர்களுக்கு மட்டுமே வரம்பற்ற முறையில் அணுகக்கூடியது. இருப்பினும், இந்த பணம் செலுத்தும் வாடிக்கையாளர்களும் Altman குறிப்பிட்ட குறிப்பிடப்படாத ‘தற்காலிக விகித வரம்புகளுக்கு’ உட்பட்டவர்கள், இது உச்ச சுமையின் கீழ், சந்தாதாரர்கள் கூட த்ரோட்லிங் அல்லது தாமதங்களை அனுபவிக்கக்கூடும் என்று அறிவுறுத்துகிறது.

சிக்கலைச் சேர்ப்பது, Altman மற்றொரு தொடர்புடைய சிக்கலை ஒப்புக்கொண்டார்: கணினி சில நேரங்களில் ‘அனுமதிக்கப்பட வேண்டிய சில தலைமுறைகளை மறுக்கிறது’. இது சுமையை நிர்வகிக்க வைக்கப்பட்ட வழிமுறைகள், அல்லது ஒருவேளை அடிப்படை மாதிரியின் பாதுகாப்பு வடிப்பான்கள், எப்போதாவது அதிகமாகக் கட்டுப்படுத்தப்பட்டு, முறையான கோரிக்கைகளைத் தடுக்கின்றன என்பதைக் குறிக்கிறது. நிறுவனம் இதை ‘முடிந்தவரை வேகமாக’ சரிசெய்ய வேலை செய்வதாக அவர் பயனர்களுக்கு உறுதியளித்தார், ஆனால் இது அழுத்தத்தின் கீழ் அணுகல் கட்டுப்பாடுகள் மற்றும் பாதுகாப்பு நெறிமுறைகளைச் சரிசெய்வதில் உள்ள சவால்களைச் சுட்டிக்காட்டுகிறது, அவை பயனர்களைத் தேவையின்றித் தடுக்காமல் சரியாகச் செயல்படுவதை உறுதி செய்கிறது. முழு சூழ்நிலையும் பயனர்களை, குறிப்பாக இலவச அடுக்கில் உள்ளவர்களை, அவர்களின் பட உருவாக்கத் தூண்டுதல்களில் மிகவும் கவனமாகவும் சிக்கனமாகவும் இருக்க கட்டாயப்படுத்துகிறது, இது ஆரம்பத்தில் அம்சத்தை மிகவும் பிரபலமாக்கிய பரிசோதனையைத் தடுக்கக்கூடும்.

சமநிலைப்படுத்தும் செயல்: புதுமை, அணுகல் மற்றும் உள்கட்டமைப்பு செலவுகளைக் கையாளுதல்

OpenAI-இன் சங்கடம் முழு AI துறைக்கும் எதிர்கொள்ளும் ஒரு பெரிய சவாலின் ஒரு சிறிய உலகம்: தொழில்நுட்ப முன்னேற்றம் மற்றும் பரந்த பயனர் அணுகலுக்கான உந்துதலைத் தேவையான கணினி உள்கட்டமைப்பின் கணிசமான செலவுகள் மற்றும் பௌதீக வரம்புகளுக்கு எதிராக சமநிலைப்படுத்துதல். GPT-4o போன்ற அதிநவீன மாடல்களை உருவாக்குவதற்கு ஆராய்ச்சி மற்றும் மேம்பாட்டில் மகத்தான முதலீடு தேவைப்படுகிறது. இந்த மாடல்களை அளவில் வரிசைப்படுத்துவது, உலகளவில் மில்லியன் கணக்கான பயனர்களுக்குக் கிடைக்கச் செய்வது, வன்பொருளில் இன்னும் குறிப்பிடத்தக்க முதலீடு தேவைப்படுகிறது - குறிப்பாக, உயர் செயல்திறன் கொண்ட GPU-க்களின் பரந்த பண்ணைகள்.

இந்த GPU-க்கள் வாங்குவதற்கு விலை உயர்ந்தவை மட்டுமல்ல (பெரும்பாலும் ஒவ்வொன்றும் ஆயிரக்கணக்கான அல்லது பல்லாயிரக்கணக்கான டாலர்கள் செலவாகும்), ஆனால் அவை மகத்தான அளவு மின்சாரத்தையும் உட்கொள்கின்றன மற்றும் குறிப்பிடத்தக்க வெப்பத்தை உருவாக்குகின்றன, அதிநவீன குளிரூட்டும் அமைப்புகள் தேவைப்படுகின்றன மற்றும் அதிக செயல்பாட்டு செலவுகளை ஏற்படுத்துகின்றன. உயர் நம்பகத்தன்மை கொண்ட பட உருவாக்கம் போன்ற கணக்கீட்டு ரீதியாக தீவிரமான அம்சங்களுக்கு இலவச அணுகலை வழங்குவது, எனவே, வழங்குநருக்கு நேரடி மற்றும் கணிசமான செலவைக் குறிக்கிறது.

மென்பொருள் மற்றும் ஆன்லைன் சேவைகளில் பொதுவான ‘freemium’ மாதிரி, வளம்-பசித்த AI உடன் குறிப்பாக சவாலானது. இலவச அடுக்குகள் ஒரு பெரிய பயனர் தளத்தை ஈர்க்கவும் மதிப்புமிக்க கருத்துக்களை சேகரிக்கவும் முடியும் என்றாலும், பயன்பாட்டு முறைகள் கனமான கணக்கீட்டை உள்ளடக்கியிருந்தால், அந்த இலவச பயனர்களுக்கு சேவை செய்வதற்கான செலவு விரைவாக நீடிக்க முடியாததாகிவிடும். OpenAI-இன் இலவச பட உருவாக்கங்களை ஒரு நாளைக்கு மூன்று ஆகக் கட்டுப்படுத்தும் முடிவு, இந்த செலவுகளை நிர்வகிப்பதற்கும் சேவையின் நீண்டகால நம்பகத்தன்மையை உறுதி செய்வதற்கும் ஒரு தெளிவான நடவடிக்கையாகும். இது அம்சத்தில் குறிப்பிடத்தக்க மதிப்பைக் கண்டறியும் பயனர்களை கட்டண அடுக்குகளுக்கு மேம்படுத்த ஊக்குவிக்கிறது, இதன் மூலம் அடிப்படை உள்கட்டமைப்பைப் பராமரிக்கவும் விரிவாக்கவும் தேவையான வருவாய்க்கு பங்களிக்கிறது.

Altman-இன் ‘அதை மேலும் திறமையானதாக மாற்றுவதில் வேலை செய்வோம்’ என்ற வாக்குறுதி இந்த சமநிலைப்படுத்தும் செயலின் மற்றொரு முக்கிய அம்சத்தைச் சுட்டிக்காட்டுகிறது: உகப்பாக்கம். இது பட உருவாக்கத்தை கணக்கீட்டு ரீதியாகக் குறைவாகக் கோருவதற்கான வழிமுறை மேம்பாடுகள், சேவையக தொகுதிகளில் சிறந்த சுமை சமநிலைப்படுத்துதல் அல்லது இந்த பணிகளை பொது நோக்கத்திற்கான GPU-க்களை விட திறமையாகச் செய்யக்கூடிய மேலும் சிறப்பு வன்பொருளை (தனிப்பயன் AI முடுக்கி சில்லுகள் போன்றவை) உருவாக்குதல் ஆகியவற்றை உள்ளடக்கியிருக்கலாம். இருப்பினும், இத்தகைய உகப்பாக்க முயற்சிகள் நேரத்தையும் வளங்களையும் எடுக்கும், தற்காலிக விகித வரம்புகளை அவசியமான இடைநிறுத்த நடவடிக்கையாக மாற்றுகிறது. AI-இன் முன்னணியில் நன்கு நிதியளிக்கப்பட்ட நிறுவனங்களுக்கு கூட, கணினி சக்தியின் பௌதீக யதார்த்தங்கள் ஒரு முக்கியமான தடையாக இருக்கின்றன, புதுமை, அணுகல்தன்மை மற்றும் பொருளாதார நிலைத்தன்மைக்கு இடையில் கடினமான வர்த்தகங்களை கட்டாயப்படுத்துகின்றன என்பதை இந்த சம்பவம் நினைவூட்டுகிறது.

பரந்த நிலப்பரப்பு: AI கணக்கீட்டிற்கான உலகளாவிய போராட்டம்

OpenAI அனுபவித்த GPU இடையூறு ஒரு தனிமைப்படுத்தப்பட்ட சம்பவம் அல்ல, மாறாக ஒரு பெரிய போக்கின் அறிகுறியாகும்: செயற்கை நுண்ணறிவு கணினி சக்திக்கான உலகளாவிய போராட்டம். AI மாதிரிகள் பெரியதாகவும், சிக்கலானதாகவும், பல்வேறு பயன்பாடுகளில் மேலும் ஒருங்கிணைக்கப்பட்டதாகவும் மாறும்போது, அவற்றை பயிற்றுவிப்பதற்கும் இயக்குவதற்கும் தேவையான சிறப்பு வன்பொருளுக்கான தேவை விண்ணை முட்டியுள்ளது. AI-க்கு பயன்படுத்தப்படும் உயர்நிலை GPU-க்களின் ஆதிக்க உற்பத்தியாளரான Nvidia போன்ற நிறுவனங்கள், தொழில்நுட்ப ஜாம்பவான்கள், ஸ்டார்ட்அப்கள் மற்றும் உலகெங்கிலும் உள்ள ஆராய்ச்சி நிறுவனங்கள் தங்கள் தயாரிப்புகளுக்காக கடுமையாகப் போட்டியிடுவதால் அவற்றின் மதிப்பீடுகள் உயர்ந்துள்ளன.

இந்த தீவிர தேவை பல தாக்கங்களைக் கொண்டுள்ளது:

  1. வழங்கல் கட்டுப்பாடுகள்: சில சமயங்களில், அதிநவீன GPU-க்களுக்கான தேவை விநியோகத்தை விட அதிகமாக உள்ளது, இது முக்கிய வீரர்களுக்கு கூட நீண்ட காத்திருப்பு நேரங்கள் மற்றும் ஒதுக்கீடு சவால்களுக்கு வழிவகுக்கிறது.
  2. உயரும் செலவுகள்: அதிக தேவை மற்றும் வரையறுக்கப்பட்ட வழங்கல் ஆகியவை தேவையான வன்பொருளைப் பெறுவதற்கான ஏற்கனவே கணிசமான செலவுக்கு பங்களிக்கின்றன, இது சிறிய நிறுவனங்கள் மற்றும் ஆராய்ச்சியாளர்களுக்கு நுழைவதற்கு குறிப்பிடத்தக்க தடையாக அமைகிறது.
  3. உள்கட்டமைப்பு கட்டமைப்புகள்: முக்கிய தொழில்நுட்ப நிறுவனங்கள் தங்கள் AI லட்சியங்களுக்கு சக்தி அளிக்க GPU-க்களால் நிரப்பப்பட்ட பாரிய தரவு மையங்களை உருவாக்க பில்லியன் கணக்கான டாலர்களை முதலீடு செய்கின்றன, இது குறிப்பிடத்தக்க ஆற்றல் நுகர்வு மற்றும் சுற்றுச்சூழல் பரிசீலனைகளுக்கு வழிவகுக்கிறது.
  4. புவிசார் அரசியல் பரிமாணங்கள்: GPU-க்கள் உட்பட மேம்பட்ட குறைக்கடத்தி தொழில்நுட்பத்திற்கான அணுகல், மூலோபாய தேசிய நலனின் ஒரு விஷயமாக மாறியுள்ளது, இது வர்த்தகக் கொள்கைகள் மற்றும் சர்வதேச உறவுகளை பாதிக்கிறது.
  5. செயல்திறனில் புதுமை: அதிக செலவு மற்றும் ஆற்றல் தேவைகள், கணக்கீட்டு ரீதியாக திறமையான AI கட்டமைப்புகள், வழிமுறைகள் மற்றும் AI பணிச்சுமைகளுக்காக பிரத்யேகமாக வடிவமைக்கப்பட்ட சிறப்பு வன்பொருள் (Google-இன் TPU-க்கள் அல்லது பிற நிறுவனங்களின் தனிப்பயன் சில்லுகள் போன்றவை) பற்றிய ஆராய்ச்சியைத் தூண்டுகின்றன.

OpenAI, அதன் முக்கிய நிலை மற்றும் ஆழமான கூட்டாண்மை (குறிப்பாக Microsoft உடன், குறிப்பிடத்தக்க கிளவுட் கம்ப்யூட்டிங் வளங்களை வழங்கும் ஒரு முக்கிய முதலீட்டாளர்) இருந்தபோதிலும், இந்த பரந்த தொழில்துறை அழுத்தங்களுக்கு தெளிவாக நோய் எதிர்ப்பு சக்தி இல்லை. ‘உருகும் GPU-க்கள்’ சம்பவம், கணிசமான வளங்களைக் கொண்ட நிறுவனங்கள் கூட, ஒரு புதிய, மிகவும் விரும்பத்தக்க அம்சம் பொது கற்பனையை ஒரு பெரிய அளவில் கைப்பற்றும் போது திறன் சவால்களை எதிர்கொள்ளக்கூடும் என்பதை எடுத்துக்காட்டுகிறது. இது உள்கட்டமைப்பு திட்டமிடலின் முக்கிய முக்கியத்துவத்தையும், AI மேம்பாடு மற்றும் வரிசைப்படுத்தலின் விரைவான வேகத்தைத் தக்கவைக்க கணக்கீட்டுத் திறனில் திருப்புமுனைகளுக்கான தற்போதைய தேவையையும் அடிக்கோடிட்டுக் காட்டுகிறது.

முன்னோக்கிப் பார்த்தல்: செயல்திறன் மற்றும் நிலையான அளவிடுதலுக்கான தேடல்

GPT-4o-இன் பட உருவாக்கத்திற்கான பெரும் தேவைக்கான உடனடி பதில் விகித வரம்புகள் மூலம் பிரேக்குகளைப் பயன்படுத்துவதாக இருந்தபோதிலும், Sam Altman-இன் வர்ணனை ஒரு முன்னோக்கிய இலக்கை வலியுறுத்தியது: செயல்திறனை மேம்படுத்துதல். இந்தத் தேடல் பரந்த அணுகலை மீட்டெடுப்பதற்கு மட்டுமல்ல, நீண்ட காலத்திற்கு சக்திவாய்ந்த AI திறன்களின் நிலையான அளவிடுதலுக்கும் முக்கியமானது. வரம்புகள் ‘நீண்ட காலம் இருக்காது என்று நம்புகிறோம்’ என்ற அறிக்கை, செயல்முறையை மேம்படுத்துவதற்கான OpenAI-இன் திறனைப் பொறுத்தது, ஒவ்வொரு பட உருவாக்க கோரிக்கையையும் அவர்களின் GPU வளங்களில் குறைவாக வரி விதிக்கிறது.

‘அதை மேலும் திறமையானதாக மாற்றுவது’ எதைக் குறிக்கலாம்? பல வழிகள் சாத்தியம்:

  • வழிமுறை சுத்திகரிப்புகள்: ஆராய்ச்சியாளர்கள் புதிய நுட்பங்களை உருவாக்கலாம் அல்லது பட உருவாக்க மாதிரிக்குள் இருக்கும் வழிமுறைகளைச் செம்மைப்படுத்தலாம், இது குறைவான கணக்கீட்டு படிகள் அல்லது குறைவான நினைவகப் பயன்பாட்டுடன் உயர்தர முடிவுகளை உருவாக்க உதவுகிறது.
  • மாதிரி உகப்பாக்கம்: மாதிரி குவாண்டைசேஷன் (கணக்கீடுகளுக்கு குறைந்த துல்லிய எண்களைப் பயன்படுத்துதல்) அல்லது ப்ரூனிங் (மாதிரியின் முக்கியமற்ற பகுதிகளை அகற்றுதல்) போன்ற நுட்பங்கள் வெளியீட்டு தரத்தை கணிசமாக பாதிக்காமல் கணக்கீட்டு சுமையைக் குறைக்கும்.
  • உள்கட்டமைப்பு மேம்பாடுகள்: GPU தொகுதிகளில் பணிச்சுமைகளை நிர்வகிப்பதற்கான சிறந்த மென்பொருள், மிகவும் பயனுள்ள சுமை சமநிலைப்படுத்துதல் அல்லது தரவு மையங்களுக்குள் நெட்வொர்க்கிங் உள்கட்டமைப்பிற்கான மேம்படுத்தல்கள் பணிகளை மிகவும் சமமாக விநியோகிக்கவும் உள்ளூர் ‘உருகுதல்களை’ தடுக்கவும் உதவும்.
  • வன்பொருள் நிபுணத்துவம்: GPU-க்கள் தற்போது ஆதிக்கம் செலுத்தும் அதே வேளையில், தொழில் தொடர்ந்து AI பணிகளுக்காக பிரத்யேகமாக வடிவமைக்கப்பட்ட மேலும் சிறப்பு சில்லுகளை (ASICs அல்லது FPGAs) ஆராய்ந்து வருகிறது, இது பட உருவாக்கம் போன்ற சில செயல்பாடுகளுக்கு ஒரு வாட்டிற்கு சிறந்த செயல்திறனை வழங்கக்கூடும். OpenAI புதிய தலைமுறை GPU-க்களைப் பயன்படுத்தலாம் அல்லது எதிர்காலத்தில் தனிப்பயன் வன்பொருள் தீர்வுகளை ஆராயலாம்.
  • தற்காலிக சேமிப்பு மற்றும் மறுபயன்பாடு: புத்திசாலித்தனமான தற்காலிக சேமிப்பு வழிமுறைகளை செயல்படுத்துவது, கோரிக்கைகள் ஒத்ததாக இருக்கும்போது கணக்கீடுகளின் பகுதிகள் அல்லது முன்னர் உருவாக்கப்பட்ட கூறுகளை மீண்டும் பயன்படுத்த கணினியை அனுமதிக்கலாம், இது தேவையற்ற செயலாக்கத்தை சேமிக்கிறது.

செயல்திறனை மேம்படுத்துவதற்கான அர்ப்பணிப்பு, சிக்கலில் அதிக வன்பொருளை வீசுவது எப்போதும் ஒரு நிலையான அல்லது பொருளாதார ரீதியாக சாத்தியமான நீண்டகால தீர்வு அல்ல என்ற புரிதலைப் பிரதிபலிக்கிறது. மேம்பட்ட AI கருவிகளுக்கான அணுகலை பொறுப்புடன் ஜனநாயகப்படுத்துவதற்கு உகப்பாக்கம் முக்கியமானது. பயனர்கள் தற்போது தற்காலிக கட்டுப்பாடுகளை எதிர்கொள்ளும் அதே வேளையில், அடிப்படை செய்தி, தொழில்நுட்பத்தின் திறன்களை நம்பகத்தன்மையுடனும் பரவலாகவும் வழங்குவதற்கான நடைமுறைத்தன்மையுடன் சீரமைப்பதை நோக்கமாகக் கொண்ட செயலில் உள்ள சிக்கல் தீர்க்கும் ஒன்றாகும். OpenAI இந்த செயல்திறன்களை அடையக்கூடிய வேகம், GPT-4o-இன் பட உருவாக்கத்தின் முழு திறனையும் அதை இயக்கும் உள்கட்டமைப்பை மூழ்கடிக்காமல் எவ்வளவு விரைவாக கட்டவிழ்த்துவிட முடியும் என்பதை தீர்மானிக்கும்.