அறிவார்ந்த செயற்கையின் முழு ஆற்றலைத் திறத்தல்: ஊகத்தின் பொருளாதாரம்
செயற்கை நுண்ணறிவு (AI) தொடர்ந்து வேகமாக வளர்ந்து பல்வேறு தொழில்களில் ஒருங்கிணைக்கப்படுவதால், வணிகங்கள் ஒரு முக்கியமான சவாலை எதிர்கொள்கின்றன: இந்த சக்திவாய்ந்த தொழில்நுட்பங்களிலிருந்து பெறப்படும் மதிப்பை அதிகரிப்பது. இந்த சவாலின் முக்கிய அம்சம் ஊகத்தின் பொருளாதாரத்தைப் புரிந்துகொள்வது, பயிற்சி பெற்ற AI மாதிரியைப் பயன்படுத்தி புதிய தரவுகளிலிருந்து கணிப்புகள் அல்லது வெளியீடுகளை உருவாக்குதல்.
மாதிரி பயிற்சிக்கு ஒப்பிடும்போது ஊகம் ஒரு தனித்துவமான கணக்கீட்டு தேவையை முன்வைக்கிறது. பயிற்சியில் பரந்த தரவுத் தொகுப்புகளை செயலாக்குவதற்கும், வடிவங்களை அடையாளம் காண்பதற்கும் குறிப்பிடத்தக்க ஆரம்ப செலவு இருக்கும்போது, ஒவ்வொரு தொடர்புடனும் ஊகம் தொடர்ச்சியான செலவுகளைச் சந்திக்கிறது. மாதிரிக்கு சமர்ப்பிக்கப்படும் ஒவ்வொரு தூண்டுதலும் அல்லது உள்ளீடும் தரவின் அடிப்படை அலகுகளான டோக்கன்களை உருவாக்குகிறது, மேலும் ஒவ்வொரு டோக்கனும் ஒரு கணக்கீட்டு செலவைக் கொண்டுள்ளது.
எனவே, AI மாதிரிகள் மிகவும் அதிநவீனமாகவும் பரவலாகப் பயன்படுத்தப்படும்போதும், உருவாக்கப்பட்ட டோக்கன்களின் அளவு அதிகரிக்கிறது, இது அதிக கணக்கீட்டு செலவுகளுக்கு வழிவகுக்கிறது. AI ஐ திறம்பட பயன்படுத்த விரும்பும் நிறுவனங்களுக்கு, கணக்கீட்டு செலவுகளைக் கட்டுக்குள் வைத்திருக்கும்போது, உகந்த வேகம், துல்லியம் மற்றும் சேவை தரத்துடன் அதிக அளவு டோக்கன்களை உருவாக்குவதே குறிக்கோள்.
ஊகச் செலவுகளைக் குறைப்பதற்கும் செயல்திறனை மேம்படுத்துவதற்கும் AI சூழல் அமைப்பு தீவிரமாக உத்திகளைப் பின்பற்றி வருகிறது. மாதிரி மேம்பாட்டில் முன்னேற்றங்கள், ஆற்றல்-திறனுள்ள துரிதப்படுத்தப்பட்ட கணினி உள்கட்டமைப்பின் வளர்ச்சி மற்றும் விரிவான முழு- அடுக்கு தீர்வுகளுடன் இணைந்து கடந்த ஆண்டில் ஊகச் செலவுகளில் இறங்குமுகமான போக்கிற்கு பங்களித்துள்ளது.
ஸ்டான்போர்ட் பல்கலைக்கழக மனித-மைய AI நிறுவனத்தின் 2025 AI இன்டெக்ஸ் அறிக்கையின்படி, GPT-3.5-நிலை செயல்திறன் கொண்ட ஒரு அமைப்பின் ஊகச் செலவு நவம்பர் 2022 மற்றும் அக்டோபர் 2024 க்கு இடையில் வியத்தகு முறையில் குறைந்துள்ளது. வன்பொருள் செலவுகளும் குறைந்துள்ளன, ஆற்றல் திறன் ஆண்டுதோறும் மேம்படுகிறது. கூடுதலாக, திறந்த-எடை மாதிரிகள் மூடிய மாதிரிகளுடன் செயல்திறன் இடைவெளியைக் குறைத்து, மேம்பட்ட AI தத்தெடுப்பிற்கான தடைகளை மேலும் குறைக்கிறது.
மாதிரிகள் முன்னேறி அதிக தேவையையும் அதிக டோக்கன்களை உற்பத்தி செய்வதாலும், நிறுவனங்கள் அடுத்த தலைமுறை AI பகுத்தறிவு கருவிகளை வழங்க தங்கள் துரிதப்படுத்தப்பட்ட கணினி வளங்களை அளவிட வேண்டும். அவ்வாறு செய்யத் தவறினால், செலவுகள் மற்றும் எரிசக்தி நுகர்வு அதிகரிக்கும்.
இந்தக் கட்டுரை ஊகத்தின் பொருளாதாரம் குறித்த அடிப்பட புரிதலை வழங்குகிறது, இது திறமையான, செலவு குறைந்த மற்றும் அளவிடக்கூடிய AI தீர்வுகளை உருவாக்க நிறுவனங்களுக்கு அதிகாரம் அளிக்கிறது.
AI ஊக பொருளாதாரத்தில் முக்கிய கருத்துகள்
AI ஊக பொருளாதாரத்தின் முக்கியத்துவத்தைப் புரிந்துகொள்வதற்கு அதன் அத்தியாவசிய சொற்களஞ்சியத்தை நன்கு தெரிந்துகொள்வது அவசியம்.
டோக்கன்கள்: AI மாதிரியில் உள்ள தரவின் முக்கிய அலகுகள், பயிற்சி நேரத்தில் உரை, படங்கள், ஆடியோ மற்றும் வீடியோவிலிருந்து பெறப்படுகின்றன. டோக்கனைசேஷன் தரவை சிறிய, நிர்வகிக்கக்கூடிய அலகுகளாக உடைப்பதை உள்ளடக்குகிறது. பயிற்சியின் போது, மாதிரி டோக்கன்களுக்கு இடையிலான உறவுகளைக் கற்றுக்கொள்கிறது, இது ஊகம் செய்து துல்லியமான வெளியீடுகளை உருவாக்க உதவுகிறது.
உற்பத்தி திறன் (Throughput): ஒரு மாதிரி ஒரு குறிப்பிட்ட காலக்கெடுவிற்குள் செயலாக்கக்கூடிய மற்றும் வெளியீடு செய்யக்கூடிய தரவின் அளவு, பெரும்பாலும் வினாடிக்கு டோக்கன்களில் அளவிடப்படுகிறது. அதிக உற்பத்தி திறன் உள்கட்டமைப்பு வளங்களின் திறமையான பயன்பாட்டைக் குறிக்கிறது.
தாமதம் (Latency): ஒரு தூண்டுதலை உள்ளீடு செய்வதற்கும் மாதிரியின் பதிலை பெறுவதற்கும் இடையிலான நேர தாமதம். குறைந்த தாமதம் வேகமான பதில்களாகவும் சிறந்த பயனர் அனுபவமாகவும் மொழிபெயர்க்கப்படுகிறது. முக்கிய தாமத அளவீடுகளில் பின்வருவன அடங்கும்:
- முதல் டோக்கனுக்கான நேரம் (TTFT): பயனர் தூண்டுதலைப் பெற்ற பிறகு மாதிரி முதல் வெளியீட்டு டோக்கனை உருவாக்க தேவையான நேரம், இது ஆரம்ப செயலாக்க நேரத்தை பிரதிபலிக்கிறது.
- வெளியீட்டு டோக்கனுக்கான நேரம் (TPOT): அடுத்தடுத்த டோக்கன்களை உருவாக்க சராசரி நேரம், இது ‘இடை-டோக்கன் தாமதம்’ அல்லது ‘டோக்கன்-டு-டோக்கன் தாமதம்’ என்றும் அழைக்கப்படுகிறது.
TTFT மற்றும் TPOT பயனுள்ள அளவுகோல்களாக இருக்கும்போது, அவற்றின் மீது மட்டுமே கவனம் செலுத்துவது குறைவான உகந்த செயல்திறன் அல்லது அதிகரித்த செலவுகளுக்கு வழிவகுக்கும்.
நல்ல உற்பத்தி திறன் (Goodput): இலக்கு TTFT மற்றும் TPOT அளவுகளை பராமரிக்கும் போது அடையப்பட்ட உற்பத்தி திறனை அளவிடும் ஒரு முழுமையான அளவீடு. நல்ல உற்பத்தி திறன் கணினி செயல்திறனின் மிகவும் விரிவான பார்வையை வழங்குகிறது, இது செயல்பாட்டு திறன் மற்றும் நேர்மறையான பயனர் அனுபவத்தை ஆதரிக்க உற்பத்தி திறன், தாமதம் மற்றும் செலவு ஆகியவற்றுக்கு இடையேயான சீரமைப்பை உறுதி செய்கிறது.
ஆற்றல் திறன்: ஒரு AI அமைப்பு சக்தியை கணக்கீட்டு வெளியீடாக எவ்வளவு திறம்பட மாற்றுகிறது என்பதற்கான அளவீடு, வாட்டுக்கு செயல்திறனாக வெளிப்படுத்தப்படுகிறது. துரிதப்படுத்தப்பட்ட கணினி தளங்கள் வாட்டுக்கு டோக்கன்களை அதிகரிக்கவும், ஆற்றல் நுகர்வுகளைக் குறைக்கவும் நிறுவனங்களுக்கு உதவும்.
அளவிடுதல் விதிகள் மற்றும் ஊகச் செலவு
மூன்று AI அளவிடுதல் விதிகள் ஊகத்தின் பொருளாதாரம் குறித்த மேலும் நுண்ணறிவை வழங்குகின்றன:
முன் பயிற்சி அளவிடுதல் (Pretraining Scaling): அசல் அளவிடுதல் விதி, இது பயிற்சி தரவுத் தொகுப்பின் அளவு, மாதிரி அளவுரு எண்ணிக்கை மற்றும் கணக்கீட்டு வளங்களை அதிகரிப்பது மாதிரி நுண்ணறிவு மற்றும் துல்லியத்தில் கணிக்கக்கூடிய முன்னேற்றங்களுக்கு வழிவகுக்கிறது என்பதை நிரூபிக்கிறது.
பயிற்சிக்குப் பிந்தையது: மாதிரிகள் குறிப்பிட்ட பணிகள் மற்றும் பயன்பாடுகளுக்கு நன்றாக இசைக்கப்படும் ஒரு செயல்முறை. மீட்டெடுப்பு-மேம்படுத்தப்பட்ட உருவாக்கம் (RAG) போன்ற நுட்பங்கள் நிறுவன தரவுத்தளங்களிலிருந்து தொடர்புடைய தகவல்களை மீட்டெடுப்பதன் மூலம் துல்லியத்தை மேம்படுத்தலாம்.
சோதனை நேர அளவிடுதல் (Test-time Scaling): “நீண்ட சிந்தனை” அல்லது “பகுத்தறிவு” என்றும் அழைக்கப்படும் இந்த நுட்பத்தில் சிறந்த பதிலை தேர்ந்தெடுப்பதற்கு முன்பு பல சாத்தியமான விளைவுகளை மதிப்பிடுவதற்கு ஊகத்தின் போது கூடுதல் கணக்கீட்டு வளங்களை ஒதுக்குவது அடங்கும்.
பயிற்சிக்குப் பிந்தைய மற்றும் சோதனை நேர அளவிடுதல் நுட்பங்கள் பெருகிய முறையில் அதிநவீனமாகி வரும் நிலையில், முன் பயிற்சி மாதிரிகளை அளவிடுவதற்கும் இந்த மேம்பட்ட நுட்பங்களை ஆதரிப்பதற்கும் ஒரு முக்கியமான அம்சமாக உள்ளது.
முழு-அடுக்கு அணுகுமுறையுடன் லாபகரமான AI ஐ அடைதல்
சோதனை நேர அளவிடுதலைப் பயன்படுத்தும் மாதிரிகள் சிக்கலான சிக்கல்களைத் தீர்க்க பல டோக்கன்களை உருவாக்குகின்றன, இதன் விளைவாக முன் பயிற்சி மற்றும் பயிற்சிக்குப் பிந்தைய மட்டுமே செய்யும் மாதிரிகளுடன் ஒப்பிடும்போது அதிக கணக்கீட்டு செலவுகள் ஏற்படுகின்றன.
புத்திசாலித்தனமான AI தீர்வுகள் சிக்கலான பணிகளைத் தீர்க்க அதிக டோக்கன்களை உருவாக்க வேண்டிய அவசியத்தை ஏற்படுத்துகின்றன, அதே நேரத்தில் உயர்தர பயனர் அனுபவம் இந்த டோக்கன்களை கூடிய விரைவில் உருவாக்க வேண்டும். AI மாதிரி எவ்வளவு புத்திசாலித்தனமாகவும் வேகமாகவும் இருக்கிறதோ, அவ்வளவு மதிப்பு அது வணிகங்களுக்கும் வாடிக்கையாளர்களுக்கும் வழங்குகிறது.
சிக்கலான சிக்கலைத் தீர்ப்பது, குறியீடாக்கம் மற்றும் பல படி திட்டமிடல் ஆகியவற்றை அதிக செலவுகள் இல்லாமல் கையாளக்கூடிய AI பகுத்தறிவு கருவிகளை வழங்க நிறுவனங்கள் தங்கள் துரிதப்படுத்தப்பட்ட கணினி வளங்களை அளவிட வேண்டும்.
இதற்கு மேம்பட்ட வன்பொருள் மற்றும் முழுமையாக மேம்படுத்தப்பட்ட மென்பொருள் அடுக்கு இரண்டும் தேவை. NVIDIA இன் AI தொழிற்சாலை தயாரிப்பு சாலை வரைபடம் இந்த கணக்கீட்டு தேவைகளை பூர்த்தி செய்யவும், செயல்திறனை மேம்படுத்தும் அதே நேரத்தில் ஊகத்தின் சிக்கல்களை தீர்க்கவும் வடிவமைக்கப்பட்டுள்ளது.
AI தொழிற்சாலைகள் உயர்-செயல்திறன் AI உள்கட்டமைப்பு, அதிவேக நெட்வொர்க்கிங் மற்றும் உகந்த மென்பொருளை ஒருங்கிணைத்து பெரிய அளவில் நுண்ணறிவை இயக்க உதவுகின்றன. இந்த கூறுகள் நெகிழ்வானதாகவும் நிரல்படுத்தக்கூடியதாகவும் வடிவமைக்கப்பட்டுள்ளன, இது வணிகங்கள் தங்கள் மாதிரிகள் அல்லது ஊகத் தேவைகளுக்கு முக்கியமான பகுதிகளை முன்னுரிமைப்படுத்த அனுமதிக்கிறது.
பாரிய AI பகுத்தறிவு மாதிரிகளை வரிசைப்படுத்தும் போது செயல்பாடுகளை ஒழுங்குபடுத்த, AI தொழிற்சாலைகள் உயர்-செயல்திறன், குறைந்த தாமத ஊக மேலாண்மை அமைப்பில் இயங்குகின்றன. இந்த அமைப்பு AI பகுத்தறிவுக்கு தேவையான வேகத்தையும் உற்பத்தித் திறனையும் மிகக் குறைந்த செலவில் பூர்த்தி செய்வதை உறுதி செய்கிறது, டோக்கன் வருவாய் உருவாக்கத்தை அதிகரிக்கிறது.
ஊகத்தின் பொருளாதாரத்தைப் புரிந்துகொள்வதன் மூலமும், அதை நிவர்த்தி செய்வதன் மூலமும், நிறுவனங்கள் AI இன் முழு ஆற்றலையும் திறக்க முடியும் மற்றும் அவர்களின் முதலீடுகளில் குறிப்பிடத்தக்க வருவாயை அடைய முடியும். முக்கிய அளவீடுகள், அளவிடுதல் விதிகள் மற்றும் முழு-அடுக்கு தீர்வின் முக்கியத்துவத்தை கருத்தில் கொள்ளும் ஒரு மூலோபாய அணுகுமுறை திறமையான, செலவு குறைந்த மற்றும் லாபகரமான AI பயன்பாடுகளை உருவாக்குவதற்கு அவசியம்.