அனுமானத்தின் எழுச்சி: என்விடியாவின் AI சிப் மேலாதிக்கத்திற்கு சவால்

பயிற்சி vs. அனுமானம்: AI நாணயத்தின் இரு பக்கங்கள்

அனுமானத்தின் முக்கியத்துவத்தைப் புரிந்து கொள்ள, அதை அதன் எதிரணியான பயிற்சியிலிருந்து வேறுபடுத்துவது அவசியம். அறிவார்ந்த பயன்பாடுகளை இயக்கும் இயந்திரங்களான AI மாதிரிகள், இரண்டு தனித்துவமான கட்டங்களைக் கடந்து செல்கின்றன.

  • பயிற்சி (Training): இது AI மாதிரி மிகப்பெரிய தரவுத்தொகுப்புகளிலிருந்து கற்றுக்கொள்ளும் கணக்கீட்டு ரீதியாக தீவிரமான கட்டமாகும். ஒரு மாதிரி பள்ளியில் பயில்வது போலவும், அதன் புத்திசாலித்தனத்தை வளர்ப்பதற்கு பரந்த அளவிலான தகவல்களை உள்வாங்கிக்கொள்வது போலவும் நினைத்துப் பாருங்கள். இந்தக் கட்டத்திற்கு மகத்தான செயலாக்க சக்தி தேவைப்படுகிறது, மேலும் Nvidia’வின் GPUகள் (கிராபிக்ஸ் செயலாக்க அலகுகள்) வரலாற்று ரீதியாக இங்கே சிறந்து விளங்குகின்றன, பயிற்சியில் உள்ள சிக்கலான கணக்கீடுகளைக் கையாளத் தேவையான இணையான செயலாக்க திறன்களை வழங்குகின்றன.

  • அனுமானம் (Inference): மாதிரி பயிற்சி பெற்றவுடன், அது பயன்படுத்தப்படுவதற்குத் தயாராக உள்ளது. இங்கேதான் அனுமானம் வருகிறது. அனுமானம் என்பது புதிய தரவுகளின் அடிப்படையில் கணிப்புகள் அல்லது முடிவுகளை எடுக்க பயிற்சி பெற்ற மாதிரியைப் பயன்படுத்தும் செயல்முறையாகும். மாதிரி பட்டம் பெற்று, நிஜ உலகில் தனது அறிவைப் பயன்படுத்துவது போன்றது. பயிற்சியை விட கணக்கீட்டு ரீதியாக குறைவான தேவையே இருந்தாலும், அனுமானத்திற்கு வேகம், செயல்திறன் மற்றும் பெரும்பாலும் குறைந்த மின் நுகர்வு தேவைப்படுகிறது.

பயிற்சி மற்றும் அனுமானத்திற்கான வன்பொருள் தேவைகள் கணிசமாக வேறுபடுவதால் இந்த வேறுபாடு முக்கியமானது. Nvidia’வின் GPUகள் பயிற்சி சந்தையில் ஆதிக்கம் செலுத்தியுள்ள நிலையில், அனுமான சந்தை மிகவும் மாறுபட்ட மற்றும் போட்டித்தன்மை வாய்ந்த நிலப்பரப்பை வழங்குகிறது.

அனுமானம் ஏன் வேகமெடுக்கிறது

AI சிப் சந்தையில் அனுமானத்தின் முக்கியத்துவம் அதிகரித்து வருவதற்கு பல காரணிகள் பங்களிக்கின்றன:

  1. AI பயன்பாடுகளின் பெருக்கம்: AI இனி ஆராய்ச்சி ஆய்வகங்கள் மற்றும் தொழில்நுட்ப ஜாம்பவான்களுக்கு மட்டும் கட்டுப்படுத்தப்படவில்லை. இது ஸ்மார்ட்போன்கள் மற்றும் ஸ்மார்ட் ஹோம்கள் முதல் தன்னாட்சி வாகனங்கள் மற்றும் மருத்துவ கண்டறிதல் வரை நம் வாழ்வின் ஒவ்வொரு அம்சத்திலும் வேகமாக ஊடுருவி வருகிறது. இந்த பரவலான வரிசைப்படுத்தல், AI மாதிரிகளை உண்மையில் பயன்படுத்தும் செயல்முறையான அனுமானம், முன்னோடியில்லாத அளவில் நடைபெறுகிறது என்பதாகும்.

  2. எட்ஜ் கம்ப்யூட்டிங் (Edge Computing): எட்ஜ் கம்ப்யூட்டிங்கின் எழுச்சி மற்றொரு முக்கிய இயக்கியாகும். எட்ஜ் கம்ப்யூட்டிங் என்பது தரவை மையப்படுத்தப்பட்ட கிளவுட் சேவையகங்களுக்கு அனுப்புவதற்குப் பதிலாக, மூலத்திற்கு அருகிலேயே செயலாக்குவதை உள்ளடக்குகிறது. சுய-ஓட்டுநர் கார்கள் அல்லது தொழில்துறை ஆட்டோமேஷன் போன்ற நிகழ்நேர பதில்கள் தேவைப்படும் பயன்பாடுகளுக்கு இது முக்கியமானது. எட்ஜ் சாதனங்கள், பெரும்பாலும் மின்சாரம் குறைந்த சூழலில் இயங்குகின்றன, குறைந்த சக்தி, திறமையான அனுமானத்திற்கு உகந்த சில்லுகள் தேவை.

  3. செலவு உகப்பாக்கம் (Cost Optimization): AI மாதிரியைப் பயிற்றுவிப்பது ஒரு முறை (அல்லது அவ்வப்போது) செலவாகும் அதே வேளையில், அனுமானம் என்பது தொடர்ச்சியான செயல்பாட்டுச் செலவாகும். AI வரிசைப்படுத்தல்கள் அதிகரிக்கும் போது, அனுமானத்தின் விலை கணிசமாக அதிகரிக்கும். இது அனுமானத்தை மிகவும் திறமையாகச் செய்யக்கூடிய சில்லுகளுக்கான தேவையை இயக்குகிறது, ஆற்றல் நுகர்வு மற்றும் ஒட்டுமொத்த செயல்பாட்டுச் செலவுகளைக் குறைக்கிறது.

  4. தாமதத் தேவைகள் (Latency Requirements): பல AI பயன்பாடுகள், குறிப்பாக நிகழ்நேர தொடர்புகளை உள்ளடக்கியவை, குறைந்த தாமதத்தைக் கோருகின்றன. இதன் பொருள் AI மாதிரி தரவைச் செயலாக்கி பதிலை உருவாக்க எடுக்கும் நேரம் குறைவாக இருக்க வேண்டும். அனுமான-உகந்த சில்லுகள் இந்த தாமதத்தைக் குறைக்க வடிவமைக்கப்பட்டுள்ளன, இது வேகமான மற்றும் பதிலளிக்கக்கூடிய AI அனுபவங்களை செயல்படுத்துகிறது.

  5. AI மாடல்களின் முதிர்ச்சி: AI மாதிரிகள் மிகவும் நுட்பமானதாகவும், சிறப்பு வாய்ந்ததாகவும் மாறும்போது, உகந்த அனுமான வன்பொருளுக்கான தேவை அதிகரிக்கிறது. பொது-நோக்கு GPUகள், பயிற்சிக்காக சிறப்பாக இருந்தாலும், குறிப்பிட்ட, அதிகளவில் டியூன் செய்யப்பட்ட AI மாடல்களை இயக்குவதற்கான மிகவும் திறமையான தீர்வாக இருக்காது.

சவாலாளர்கள் வெளிப்படுகிறார்கள்: ஒரு பன்முகப்படுத்தப்பட்ட நிலப்பரப்பு

அனுமானத்தின் முக்கியத்துவம் அதிகரித்து வருவது, Nvidia’வின் ஆதிக்கத்தை சவால் செய்ய ஆர்வமுள்ள போட்டியாளர்களின் அலையை ஈர்க்கிறது. இந்த நிறுவனங்கள் இந்த வளர்ந்து வரும் சந்தையில் காலூன்றுவதற்கு பல்வேறு உத்திகளையும் தொழில்நுட்பங்களையும் பயன்படுத்துகின்றன:

  1. சிறப்பு கட்டமைப்புகளுடன் கூடிய ஸ்டார்ட்அப்கள்: பல ஸ்டார்ட்அப்கள் அனுமானத்திற்காக குறிப்பாக வடிவமைக்கப்பட்ட சில்லுகளை உருவாக்குகின்றன. இந்த சில்லுகள் பெரும்பாலும் இயற்கை மொழி செயலாக்கம் அல்லது கணினி பார்வை போன்ற குறிப்பிட்ட AI பணிச்சுமைகளுக்கு உகந்த நாவல் கட்டமைப்புகளைக் கொண்டுள்ளன. Graphcore, Cerebras Systems மற்றும் SambaNova Systems போன்ற நிறுவனங்கள் இதற்கு எடுத்துக்காட்டுகள். இந்த நிறுவனங்கள் சிறப்பு வன்பொருள் குறிப்பிட்ட அனுமான பணிகளில் பொது-நோக்கு GPUகளை விட சிறப்பாக செயல்பட முடியும் என்ற கருத்தின் மீது பந்தயம் கட்டுகின்றன.

  2. FPGA-அடிப்படையிலான தீர்வுகள்: Field-Programmable Gate Arrays (FPGAs) பாரம்பரிய GPUகள் மற்றும் ASICகளுக்கு (Application-Specific Integrated Circuits) ஒரு நெகிழ்வான மாற்றீட்டை வழங்குகின்றன. FPGAகள் உற்பத்திக்குப் பிறகு மறுபிரசுரம் செய்யப்படலாம், இது வெவ்வேறு AI மாதிரிகள் மற்றும் வழிமுறைகளுக்கு ஏற்ப மாற்ற அனுமதிக்கிறது. Xilinx (இப்போது AMD’யின் ஒரு பகுதி) மற்றும் Intel போன்ற நிறுவனங்கள் FPGAகளைப் பயன்படுத்தி மாற்றியமைக்கக்கூடிய மற்றும் திறமையான அனுமான தீர்வுகளை வழங்குகின்றன.

  3. ASIC மேம்பாடு: ASICகள் ஒரு குறிப்பிட்ட நோக்கத்திற்காக உருவாக்கப்பட்ட தனிப்பயன்-வடிவமைக்கப்பட்ட சில்லுகள். AI’யின் சூழலில், குறிப்பிட்ட அனுமான பணிச்சுமைகளுக்கு அதிகபட்ச செயல்திறன் மற்றும் செயல்திறனை வழங்க ASICகள் வடிவமைக்கப்படலாம். Google’ளின் Tensor Processing Unit (TPU), அதன் சொந்த தரவு மையங்களில் விரிவாகப் பயன்படுத்தப்படுகிறது, இது பயிற்சி மற்றும் அனுமானம் ஆகிய இரண்டிற்கும் வடிவமைக்கப்பட்ட ASICக்கு ஒரு சிறந்த எடுத்துக்காட்டு. மற்ற நிறுவனங்களும் அனுமான சந்தையில் ஒரு போட்டி விளிம்பைப் பெற ASIC மேம்பாட்டைப் பின்பற்றுகின்றன.

  4. நிறுவப்பட்ட சிப்மேக்கர்கள் தங்கள் AI சலுகைகளை விரிவுபடுத்துகின்றனர்: Intel, AMD மற்றும் Qualcomm போன்ற பாரம்பரிய சிப்மேக்கர்கள் சும்மா உட்காரவில்லை. AI அனுமானத்திற்கு உகந்த சில்லுகளை உள்ளடக்குவதற்காக அவர்கள் தங்கள் தயாரிப்பு இலாகாக்களை தீவிரமாக விரிவுபடுத்துகின்றனர். உதாரணமாக, Intel அதன் CPU நிபுணத்துவத்தைப் பயன்படுத்துகிறது மற்றும் AI முடுக்கிகளில் நிபுணத்துவம் பெற்ற நிறுவனங்களை கையகப்படுத்துகிறது. AMD’யின் Xilinx கையகப்படுத்தல் அனுமானத்திற்கான வலுவான FPGA-அடிப்படையிலான தளத்தை வழங்குகிறது. மொபைல் செயலிகளில் முன்னணியில் இருக்கும் Qualcomm, ஸ்மார்ட்போன்கள் மற்றும் பிற எட்ஜ் சாதனங்களில் AI பயன்பாடுகளை இயக்குவதற்கு அதன் சில்லுகளில் AI முடுக்கம் திறன்களை ஒருங்கிணைத்து வருகிறது.

  5. கிளவுட் வழங்குநர்கள் தங்கள் சொந்த சில்லுகளை வடிவமைக்கின்றனர்: Amazon Web Services (AWS) மற்றும் Google Cloud போன்ற முக்கிய கிளவுட் வழங்குநர்கள், அனுமானம் உள்ளிட்ட AI பணிச்சுமைகளுக்காக தங்கள் சொந்த தனிப்பயன் சில்லுகளை அதிகளவில் வடிவமைத்து வருகின்றனர். உதாரணமாக, AWS’ன் Inferentia சிப், கிளவுட்டில் அனுமானத்தை துரிதப்படுத்த குறிப்பாக வடிவமைக்கப்பட்டுள்ளது. இந்த போக்கு கிளவுட் வழங்குநர்கள் தங்கள் குறிப்பிட்ட தேவைகளுக்கு ஏற்ப தங்கள் உள்கட்டமைப்பை மேம்படுத்தவும், வெளிப்புற சிப் விற்பனையாளர்களைச் சார்ந்திருப்பதைக் குறைக்கவும் அனுமதிக்கிறது.

அனுமான ஆதிக்கத்திற்கான போர்: முக்கிய பரிசீலனைகள்

AI அனுமான சந்தையில் போட்டி என்பது மூல செயலாக்க சக்தியைப் பற்றியது மட்டுமல்ல. வெற்றியைத் தீர்மானிப்பதில் பல காரணிகள் முக்கியமானவை:

  1. மென்பொருள் சுற்றுச்சூழல் அமைப்பு (Software Ecosystem): டெவலப்பர்களை ஈர்ப்பதற்கும், ஒரு குறிப்பிட்ட சிப்பில் AI மாடல்களை வரிசைப்படுத்துவதை எளிதாக்குவதற்கும் ஒரு வலுவான மென்பொருள் சுற்றுச்சூழல் அமைப்பு அவசியம். Nvidia’வின் CUDA தளம், ஒரு இணையான கணினி தளம் மற்றும் நிரலாக்க மாதிரி, பயிற்சி சந்தையில் ஒரு பெரிய நன்மையாக இருந்து வருகிறது. போட்டியாளர்கள் தங்கள் வன்பொருளை ஆதரிக்க வலுவான மென்பொருள் கருவிகள் மற்றும் நூலகங்களை உருவாக்க கடுமையாக உழைத்து வருகின்றனர்.

  2. சக்தி திறன் (Power Efficiency): முன்பே குறிப்பிட்டது போல, பல அனுமான பயன்பாடுகளுக்கு, குறிப்பாக எட்ஜில் உள்ளவைகளுக்கு சக்தி திறன் முக்கியமானது. ஒரு வாட்டுக்கு அதிக செயல்திறனை வழங்கக்கூடிய சில்லுகள் ஒரு குறிப்பிடத்தக்க நன்மையைக் கொண்டிருக்கும்.

  3. விலை (Cost): அனுமான சில்லுகளின் விலை ஒரு முக்கிய பரிசீலனையாகும், குறிப்பாக பெரிய அளவிலான வரிசைப்படுத்தல்களுக்கு. செயல்திறனைப் பராமரிக்கும் அதே வேளையில் போட்டி விலையை வழங்கக்கூடிய நிறுவனங்கள் நல்ல நிலையில் இருக்கும்.

  4. அளவிடுதல் (Scalability): அனுமான வரிசைப்படுத்தல்களை திறமையாக அளவிடும் திறன் முக்கியமானது. இது தனிப்பட்ட சில்லுகளின் செயல்திறனை மட்டுமல்லாமல், ஒரு கிளஸ்டரில் பல சில்லுகளை இணைத்து நிர்வகிக்கும் திறனையும் உள்ளடக்கியது.

  5. நெகிழ்வுத்தன்மை மற்றும் நிரலாக்கத்திறன் (Flexibility and Programmability): ASICகள் குறிப்பிட்ட பணிச்சுமைகளுக்கு அதிக செயல்திறனை வழங்கினாலும், அவை GPUகள் மற்றும் FPGAகளின் நெகிழ்வுத்தன்மையைக் கொண்டிருக்கவில்லை. AI மாதிரிகள் மற்றும் வழிமுறைகளுக்கு ஏற்ப மாறும் திறன் பல பயனர்களுக்கு ஒரு முக்கிய பரிசீலனையாகும்.

  6. பாதுகாப்பு (Security): சுகாதாரம் மற்றும் நிதி போன்ற முக்கியமான பயன்பாடுகளில் AI’யின் பயன்பாடு அதிகரித்து வருவதால், பாதுகாப்பு மிக முக்கியமானதாகி வருகிறது.

அனுமானத்தின் எதிர்காலம்: ஒரு பன்முகத்தன்மை கொண்ட நிலப்பரப்பு

அனுமான சந்தை குறிப்பிடத்தக்க வளர்ச்சி மற்றும் பன்முகத்தன்மைக்கு தயாராக உள்ளது. Nvidia பயிற்சி இடத்தில் ஆதிக்கம் செலுத்தியது போல் ஒரு நிறுவனம் ஆதிக்கம் செலுத்துவது சாத்தியமில்லை. அதற்கு பதிலாக, குறிப்பிட்ட தேவைகள் மற்றும் பயன்பாடுகளுக்கு ஏற்ப வெவ்வேறு சிப் கட்டமைப்புகள் மற்றும் விற்பனையாளர்களுடன் ஒரு பன்முகத்தன்மை கொண்ட நிலப்பரப்பைக் காண்போம்.

போட்டி கடுமையாக இருக்கும், புதுமைகளை இயக்கும் மற்றும் AI மூலம் சாத்தியமானவற்றின் எல்லைகளைத் தள்ளும். இது இறுதியில் பயனர்களுக்கு பயனளிக்கும், இது வேகமான, திறமையான மற்றும் மலிவான AI தீர்வுகளுக்கு வழிவகுக்கும். அனுமானத்தின் எழுச்சி என்பது Nvidia’வின் ஆதிக்கத்தை சவால் செய்வது மட்டுமல்ல; இது AI’யின் முழு திறனையும் வெளிக்கொணர்வதற்கும், பரந்த அளவிலான பயன்பாடுகள் மற்றும் தொழில்களுக்கு அணுகக்கூடியதாக மாற்றுவதற்கும் ஆகும். வரவிருக்கும் ஆண்டுகள் AI சிப் சந்தையின் இந்த முக்கியமான பிரிவுக்கு ஒரு வரையறுக்கும் காலமாக இருக்கும், இது AI உலகம் முழுவதும் எவ்வாறு பயன்படுத்தப்படுகிறது மற்றும் பயன்படுத்தப்படுகிறது என்பதன் எதிர்காலத்தை வடிவமைக்கும்.