AI மாதிரி நிலப்பரப்பை வழிநடத்துதல்: ஒரு நடைமுறை வழிகாட்டி

செயற்கை நுண்ணறிவு மாதிரிகளின் பரப்பளவை ஆராய்தல்: ஒரு நடைமுறை வழிகாட்டி

செயற்கை நுண்ணறிவு (Artificial intelligence) மாதிரிகள் மிக வேகமாக பெருகி வருகின்றன. அவை பிரபலமான செய்தி தலைப்புகள் மற்றும் சமூக ஊடகங்களில் ஆதிக்கம் செலுத்தும் நன்கு அறியப்பட்ட பெயர்களைத் தாண்டி விரிவடைகின்றன. AI துறையானது இப்போது நூற்றுக்கணக்கான மாதிரிகளைக் கொண்டுள்ளது. அவை திறந்த மூல முயற்சிகள், தனியுரிம அமைப்புகள் மற்றும் ஜெமினி (Gemini), கிளவுட் (Claude), ஓபன்ஏஐ (OpenAI), க்ரோக் (Grok), மற்றும் டீப் சீக் (Deepseek) போன்ற தொழில்நுட்ப நிறுவனங்களின் சலுகைகளை உள்ளடக்கியது. இந்த மாதிரிகள், அவற்றின் மையத்தில், பரந்த தரவுத்தொகுப்புகளில் கவனமாக பயிற்சி பெற்ற நரம்பியல் நெட்வொர்க்குகள் ஆகும். அவை சிக்கலான வடிவங்களை அடையாளம் காண உதவுகின்றன. தற்போதைய சகாப்தம், வணிக பயன்பாடுகள் முதல் தனிப்பட்ட உதவி மற்றும் ஆக்கபூர்வமான விரிவாக்கம் வரை பல்வேறு நோக்கங்களுக்காக இந்த முன்னேற்றங்களைப் பயன்படுத்த ஒரு தனித்துவமான வாய்ப்பை வழங்குகிறது. இந்த வழிகாட்டி AI துறையில் புதிதாக வருபவர்களுக்கு ஒரு அடிப்படை புரிதலை வழங்குவதை நோக்கமாகக் கொண்டுள்ளது. இது இந்த தொழில்நுட்பத்தை திறம்பட பயன்படுத்த அவர்களுக்கு அதிகாரம் அளிக்கிறது. அடிப்படைக் கருத்துக்கள், நடைமுறை பயன்பாடுகள் மற்றும் துல்லியத்தை மதிப்பிடுவதற்கான முறைகளைப் புரிந்துகொள்வதில் கவனம் செலுத்தி, பயனர்கள் AI உடன் இணைந்து உருவாக்க உதவுவதே இதன் நோக்கமாகும்.

இந்த வழிகாட்டி பின்வரும் முக்கிய அம்சங்களை உள்ளடக்கும்:

  • AI மாதிரிகளின் வகைப்பாடு
  • குறிப்பிட்ட பணிகளுக்கான பொருத்தமான மாதிரிகள்
  • மாதிரி பெயரிடல் மரபுகளைப் புரிந்துகொள்வது
  • மாதிரி துல்லியமான செயல்திறனை மதிப்பிடுதல்
  • தரக்குறியீட்டு குறிப்புகளைப் பயன்படுத்துதல்

ஒவ்வொரு சாத்தியமான பணியையும் கையாளக்கூடிய ஒரு தனித்துவமான, உலகளாவிய AI மாதிரி எதுவும் இல்லை என்பதை அங்கீகரிப்பது மிக முக்கியமானது. அதற்கு பதிலாக, வெவ்வேறு மாதிரிகள் குறிப்பிட்ட பயன்பாடுகளுக்கு ஏற்றவாறு வடிவமைக்கப்படுகின்றன.

AI மாதிரிகளின் வகைகள்

AI மாதிரிகளை பரவலாக நான்கு முதன்மை வகைகளாகப் பிரிக்கலாம்:

  • தூய மொழி செயலாக்கம் (பொதுவானது)
  • உருவாக்கும் (படம், வீடியோ, ஆடியோ, உரை, குறியீடு)
  • வேறுபடுத்தும் (கணினி பார்வை, உரை பகுப்பாய்வு)
  • வலுவூட்டல் கற்றல்

பல மாதிரிகள் ஒரு பிரிவில் நிபுணத்துவம் பெற்றிருந்தாலும், மற்றவை மாறுபட்ட அளவிலான துல்லியத்துடன் பல மாதிரி திறன்களை வெளிப்படுத்துகின்றன. ஒவ்வொரு மாதிரியும் குறிப்பிட்ட தரவுத்தொகுப்புகளில் பயிற்சி அளிக்கப்படுகிறது. இது வெளிப்படுத்தப்பட்ட தரவுகளுடன் தொடர்புடைய பணிகளைச் செய்ய உதவுகிறது. பின்வரும் பட்டியல் ஒவ்வொரு வகையுடனும் தொடர்புடைய பொதுவான பணிகளை கோடிட்டுக் காட்டுகிறது.

தூய மொழி செயலாக்கம்

இந்த வகை கணினிகள் மனித மொழியை டோக்கனைசேஷன் (tokenization) மற்றும் புள்ளிவிவர மாதிரிகளைப் பயன்படுத்தி விளக்கவும், புரிந்து கொள்ளவும், உருவாக்கவும் உதவுகிறது. சாட்-பாட்கள் ஒரு சிறந்த எடுத்துக்காட்டு. ‘ஜெனரேட்டிவ் ப்ரீ-ட்ரெய்ன்டு டிரான்ஸ்ஃபார்மர்’ (Generative Pre-trained Transformer) என்பதன் சுருக்கமான சாட்ஜிபிடி (ChatGPT) ஒரு குறிப்பிடத்தக்க விளக்கமாகும். இந்த மாதிரிகள் பெரும்பாலானவை முன் பயிற்சி பெற்ற டிரான்ஸ்ஃபார்மர் கட்டமைப்புகளை அடிப்படையாகக் கொண்டவை. இந்த மாதிரிகள் மனித மொழியில் உள்ள சூழல், நுணுக்கங்கள் மற்றும் சூட்சுமங்களைப் புரிந்துகொள்வதில் சிறந்து விளங்குகின்றன. அவை இயற்கையான மொழி தொடர்பு தேவைப்படும் பயன்பாடுகளுக்கு ஏற்றதாக இருக்கும். அவற்றை பின்வரும் பணிகளுக்கு பயன்படுத்தலாம்:

  • உணர்ச்சி பகுப்பாய்வு: உரையின் ஒரு பகுதியின் உணர்ச்சி தொனியை தீர்மானித்தல், இது வாடிக்கையாளர் கருத்துக்களைப் புரிந்து கொள்ள அல்லது பொதுவான கருத்தை அளவிடுவதற்கு பயனுள்ளதாக இருக்கும்.
  • உரை சுருக்கம்: பெரிய அளவிலான உரையை சிறிய, மிகவும் நிர்வகிக்கக்கூடிய சுருக்கங்களாக சுருக்குதல், தகவல் செயலாக்கத்தில் நேரத்தையும் முயற்சியையும் மிச்சப்படுத்துகிறது.
  • இயந்திர மொழிபெயர்ப்பு: உரையை ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு தானாக மொழிபெயர்த்தல், மொழி தடைகளைத் தாண்டி தொடர்புகொள்ள உதவுகிறது.
  • கேள்வி பதில்: இயல்பான மொழியில் கேட்கப்படும் கேள்விகளுக்கு பதில்களை வழங்குதல், பயனர்கள் தகவல்களை விரைவாகவும் எளிதாகவும் அணுக உதவுகிறது.
  • உள்ளடக்க உருவாக்கம்: கட்டுரைகள், வலைப்பதிவு இடுகைகள் அல்லது சமூக ஊடக புதுப்பிப்புகள் போன்ற அசல் உரை உள்ளடக்கத்தை உருவாக்குதல்.

தூய மொழி செயலாக்க மாதிரிகளுக்குப் பின்னால் உள்ள தொழில்நுட்பம் மொழியின் கட்டமைப்பு மற்றும் பொருளைப் பகுப்பாய்வு செய்யும் சிக்கலான வழிமுறைகளை உள்ளடக்கியது. இந்த வழிமுறைகள் உரை மற்றும் குறியீட்டின் பெரிய தரவுத்தொகுப்பிலிருந்து கற்றுக்கொள்கின்றன. இது சொற்களுக்கும் சொற்றொடர்களுக்கும் இடையிலான வடிவங்களையும் உறவுகளையும் அடையாளம் காண அனுமதிக்கிறது. பின்னர் மாதிரிகள் புதிய உரையை உருவாக்க அல்லது ஏற்கனவே உள்ள உரையின் அர்த்தத்தைப் புரிந்துகொள்ள இந்த அறிவைப் பயன்படுத்துகின்றன.

உருவாக்கும் மாதிரிகள்

படங்கள், வீடியோ, ஆடியோ, உரை மற்றும் குறியீட்டை உருவாக்கும் மாதிரிகள் உட்பட உருவாக்கும் மாதிரிகள் பெரும்பாலும் ஜெனரேட்டிவ் அட்வர்சேரியல் நெட்வொர்க்குகளை (GANs) பயன்படுத்துகின்றன. GAN கள் இரண்டு துணை மாதிரிகளைக் கொண்டுள்ளது: ஒரு ஜெனரேட்டர் (generator) மற்றும் ஒரு டிஸ்கிரிமினேட்டர் (discriminator). இந்த மாதிரிகள் பயிற்சி பெற்ற விரிவான தரவுகளின் அடிப்படையில் யதார்த்தமான படங்கள், ஆடியோ, உரை மற்றும் குறியீட்டை உருவாக்க முடியும். ஸ்டேபிள் டிஃப்யூஷன் (Stable diffusion) என்பது படங்கள் மற்றும் வீடியோக்களை உருவாக்குவதற்கான ஒரு பொதுவான நுட்பமாகும். இந்த மாதிரிகளைப் பயன்படுத்தலாம்:

  • பட உருவாக்கம்: உரை விளக்கங்கள் அல்லது பிற உள்ளீடுகளிலிருந்து யதார்த்தமான அல்லது கலை படங்கள் உருவாக்குதல்.
  • வீடியோ உருவாக்கம்: உரை தூண்டுதல்கள் அல்லது பிற உள்ளீடுகளிலிருந்து குறுகிய வீடியோக்களை உருவாக்குதல்.
  • ஆடியோ உருவாக்கம்: இசை, பேச்சு அல்லது பிற ஆடியோ வகைகளை உரை விளக்கங்கள் அல்லது பிற உள்ளீடுகளிலிருந்து உருவாக்குதல்.
  • உரை உருவாக்கம்: கவிதைகள், ஸ்கிரிப்டுகள் அல்லது குறியீடு போன்ற அசல் உரை உள்ளடக்கத்தை உருவாக்குதல்.
  • குறியீடு உருவாக்கம்: விரும்பிய செயல்பாட்டின் இயற்கையான மொழி விளக்கங்களிலிருந்து குறியீட்டை தானாக உருவாக்குதல்.

GAN இல் உள்ள ஜெனரேட்டர் துணை மாதிரி புதிய தரவு மாதிரிகளை உருவாக்குவதற்கு பொறுப்பாகும், அதே நேரத்தில் டிஸ்கிரிமினேட்டர் துணை மாதிரி உண்மையான தரவு மாதிரிகளுக்கும் ஜெனரேட்டரால் உருவாக்கப்பட்டவற்றுக்கும் இடையே வேறுபடுத்த முயற்சிக்கிறது. இரண்டு துணை மாதிரிகளும் ஒரு விரோதமான முறையில் பயிற்சி அளிக்கப்படுகின்றன. ஜெனரேட்டர் டிஸ்கிரிமினேட்டரை ஏமாற்ற முயற்சிக்கிறது மற்றும் டிஸ்கிரிமினேட்டர் உண்மையான தரவு மாதிரிகளை சரியாக அடையாளம் காண முயற்சிக்கிறது. இந்த செயல்முறை ஜெனரேட்டர் யதார்த்தமான தரவு மாதிரிகளை உருவாக்கும் திறனை படிப்படியாக அதிகரிக்கிறது.

வேறுபடுத்தும் மாதிரிகள்

வேறுபடுத்தும் மாதிரிகள், கணினி பார்வை மற்றும் உரை பகுப்பாய்வில் பயன்படுத்தப்படுகின்றன. அவை முடிவெடுப்பதற்காக தரவுத்தொகுப்புகளிலிருந்து தனித்துவமான வகுப்புகளைக் கற்றுக்கொள்ள வடிவமைக்கப்பட்ட வழிமுறைகளைப் பயன்படுத்துகின்றன. எடுத்துக்காட்டுகளில் உணர்ச்சி பகுப்பாய்வு, ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR) மற்றும் பட வகைப்பாடு ஆகியவை அடங்கும். இந்த மாதிரிகள் தரவின் வெவ்வேறு வகைகளுக்கு இடையே வேறுபடுத்துவதற்காக வடிவமைக்கப்பட்டுள்ளன. அவை பரவலான பயன்பாடுகளுக்கு பயனுள்ளதாக இருக்கும். அவற்றை பின்வரும் பணிகளுக்கு பயன்படுத்தலாம்:

  • பட வகைப்பாடு: ஒரு படத்தில் உள்ள பொருள்கள் அல்லது காட்சிகளை அடையாளம் காணுதல்.
  • பொருள் கண்டறிதல்: ஒரு படம் அல்லது வீடியோவில் குறிப்பிட்ட பொருள்களைக் கண்டுபிடித்து அடையாளம் காணுதல்.
  • உணர்ச்சி பகுப்பாய்வு: உரையின் ஒரு பகுதியின் உணர்ச்சி தொனியை தீர்மானித்தல்.
  • ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR): உரையின் படங்களை இயந்திரம் படிக்கக்கூடிய உரைக்கு மாற்றுதல்.
  • மோசடி கண்டறிதல்: மோசடியான பரிவர்த்தனைகள் அல்லது செயல்பாடுகளை அடையாளம் காணுதல்.

வேறுபடுத்தும் மாதிரிகளில் பயன்படுத்தப்படும் வழிமுறைகள் தரவின் வெவ்வேறு வகுப்புகளுக்கு இடையே வேறுபடுத்துவதற்கு மிகவும் முக்கியமான அம்சங்களை அடையாளம் காண கற்றுக்கொள்கின்றன. இந்த அம்சங்கள் புதிய தரவு மாதிரிகளை துல்லியமாக வகைப்படுத்தக்கூடிய ஒரு மாதிரியை உருவாக்க பயன்படுத்தப்படலாம்.

வலுவூட்டல் கற்றல்

வலுவூட்டல் கற்றல் மாதிரிகள் ரோபாட்டிக்ஸ், கேமிங் மற்றும் தன்னாட்சி ஓட்டுநர் போன்ற குறிக்கோள் சார்ந்த முடிவுகளை அடைய முயற்சி மற்றும் பிழை முறைகள் மற்றும் மனித உள்ளீட்டைப் பயன்படுத்துகின்றன. இந்த அணுகுமுறை ஒரு முகவர் ஒரு வெகுமதியை அதிகரிக்க ஒரு சூழலில் முடிவுகளை எடுக்க கற்றுக்கொள்வதை உள்ளடக்கியது. முகவர் வெகுமதிகள் அல்லது அபராதங்களின் வடிவத்தில் கருத்தைப் பெறுகிறார். அதை அதன் நடத்தையை சரிசெய்ய பயன்படுத்துகிறார். இந்த செயல்முறை முகவர் அதன் இலக்குகளை அடைவதற்கான உகந்த உத்திகளைக் கற்றுக்கொள்ள அனுமதிக்கிறது. வலுவூட்டல் கற்றலை பின்வரும் பணிகளுக்குப் பயன்படுத்தலாம்:

  • ரோபாட்டிக்ஸ்: நடப்பது, பொருள்களைப் பிடிப்பது அல்லது சூழல்களை வழிநடத்துவது போன்ற சிக்கலான பணிகளைச் செய்ய ரோபோக்களுக்கு பயிற்சி அளித்தல்.
  • கேமிங்: விளையாட்டுகளை உயர் மட்டத்தில் விளையாடக்கூடிய AI முகவர்களை உருவாக்குதல்.
  • தன்னாட்சி ஓட்டுநர்: சாலைகளை வழிநடத்தவும் தடைகளைத் தவிர்க்கவும் சுய-ஓட்டும் கார்களுக்கு பயிற்சி அளித்தல்.
  • வள மேலாண்மை: ஆற்றல் அல்லது அலைவரிசை போன்ற வளங்களின் ஒதுக்கீட்டை மேம்படுத்துதல்.
  • தனிப்பயனாக்கப்பட்ட பரிந்துரைகள்: பயனர்களின் கடந்த கால நடத்தையின் அடிப்படையில் அவர்களுக்கு தனிப்பயனாக்கப்பட்ட பரிந்துரைகளை வழங்குதல்.

முயற்சி மற்றும் பிழை செயல்முறை முகவரை வெவ்வேறு உத்திகளை ஆராயவும் அவற்றில் எது மிகவும் பயனுள்ளதாக இருக்கும் என்பதை அறியவும் அனுமதிக்கிறது. வெகுமதிகள் மற்றும் அபராதங்களின் பயன்பாடு உகந்த நடத்தையை நோக்கி முகவருக்கு வழிகாட்டும் கருத்தை வழங்குகிறது.

மாதிரி பெயரிடல் மரபுகளைப் புரிந்துகொள்ளுதல்

வெவ்வேறு வகையான AI மாதிரிகள் மற்றும் அவற்றின் அந்தந்த பணிகளைப் புரிந்துகொண்ட பிறகு, அடுத்த கட்டம் அவற்றின் தரம் மற்றும் செயல்திறனை மதிப்பிடுவது. இது மாதிரிகள் எவ்வாறு பெயரிடப்படுகின்றன என்பதைப் புரிந்துகொள்வதில் தொடங்குகிறது. AI மாதிரிகளை பெயரிடுவதற்கு அதிகாரப்பூர்வ மரபு எதுவும் இல்லை என்றாலும், பிரபலமான மாதிரிகள் பொதுவாக ஒரு எளிய பெயரைத் தொடர்ந்து பதிப்பு எண்ணைக் கொண்டுள்ளன (எ.கா., சாட்ஜிபிடி #, கிளவுட் #, க்ரோக் #, ஜெமினி #).

சிறிய, திறந்த மூல, பணி சார்ந்த மாதிரிகள் பெரும்பாலும் மேலும் விரிவான பெயர்களைக் கொண்டுள்ளன. ஹக்கிங்ஃபேஸ் (huggingface.co) போன்ற தளங்களில் காணப்படும் இந்த பெயர்களில் பொதுவாக நிறுவனத்தின் பெயர், மாதிரி பெயர், அளவுரு அளவு மற்றும் சூழல் அளவு ஆகியவை அடங்கும்.

இதை விளக்க சில எடுத்துக்காட்டுகள் இங்கே:

MISTRALAI/MISTRAL-SMALL-3.1-24B-INSTRUCT-2053

  • Mistralai: மாதிரியை உருவாக்குவதற்கு பொறுப்பான அமைப்பு.
  • Mistral-small: மாதிரி பெயரே இதுதான்.
  • 3.1: மாதிரியின் பதிப்பு எண்.
  • 24b-instruct: அளவுரு எண்ணிக்கை, மாதிரி 24 பில்லியன் தரவு புள்ளிகளில் பயிற்சி பெற்றது மற்றும் அறிவுறுத்தல்-பின்பற்றும் பணிகளுக்காக வடிவமைக்கப்பட்டுள்ளது என்பதைக் குறிக்கிறது.
  • 2053: சூழல் அளவு அல்லது டோக்கன் எண்ணிக்கை, மாதிரி ஒரே நேரத்தில் செயலாக்கக்கூடிய தகவல்களின் அளவைக் குறிக்கிறது.

Google/Gemma-3-27b

  • Google: மாதிரிக்கு பின்னால் உள்ள அமைப்பு.
  • Gemma: மாதிரியின் பெயர்.
  • 3: பதிப்பு எண்.
  • 27b: அளவுரு அளவு, மாதிரி 27 பில்லியன் தரவு புள்ளிகளில் பயிற்சி பெற்றது என்பதைக் குறிக்கிறது.

முக்கிய பரிசீலனைகள்

பெயரிடல் மரபுகளைப் புரிந்துகொள்வது ஒரு மாதிரியின் திறன்கள் மற்றும் நோக்கம் கொண்ட பயன்பாடு குறித்த மதிப்புமிக்க நுண்ணறிவுகளை வழங்குகிறது. நிறுவனத்தின் பெயர் மாதிரியின் ஆதாரம் மற்றும் நம்பகத்தன்மையைக் குறிக்கிறது. மாதிரி பெயர் ஒரே அமைப்பால் உருவாக்கப்பட்ட வெவ்வேறு மாதிரிகளுக்கு இடையே வேறுபடுத்த உதவுகிறது. பதிப்பு எண் வளர்ச்சி மற்றும் செம்மைப்படுத்துதலின் அளவைக் குறிக்கிறது. அளவுரு அளவு மாதிரியின் சிக்கலான தன்மை மற்றும் கற்றல் திறன் பற்றிய தோராயமான அறிகுறியை வழங்குகிறது. சூழல் அளவு மாதிரி திறம்பட செயலாக்கக்கூடிய உள்ளீட்டின் நீளத்தை தீர்மானிக்கிறது.

பிட்களில் குவாண்டிசேஷன் வடிவமைப்பும் நீங்கள் எதிர்கொள்ளும் கூடுதல் விவரங்களில் அடங்கும். அதிக குவாண்டிசேஷன் வடிவங்களுக்கு மாதிரியை இயக்க அதிக ரேம் (RAM) மற்றும் கணினி சேமிப்பு தேவை. குவாண்டிசேஷன் வடிவங்கள் பெரும்பாலும் 4, 6, 8 மற்றும் 16 போன்ற மிதக்கும் புள்ளி குறியீட்டில் குறிப்பிடப்படுகின்றன. ஜிபிடிக்யூ (GPTQ), என்எஃப்4 (NF4) மற்றும் ஜிஜிஎம்எல் (GGML) போன்ற பிற வடிவங்கள் குறிப்பிட்ட {hardware} உள்ளமைவுகளுக்கான பயன்பாட்டைக் குறிக்கின்றன.

  • குவாண்டிசேஷன்: இது மாதிரியின் அளவுருக்களைக் குறிக்கப் பயன்படும் எண்களின் துல்லியத்தைக் குறைக்கும் நுட்பத்தைக் குறிக்கிறது. இது மாதிரியின் அளவு மற்றும் நினைவக சுவடியை கணிசமாகக் குறைக்கும், இது வள-கட்டுப்படுத்தப்பட்ட சாதனங்களில் வரிசைப்படுத்துவதை எளிதாக்குகிறது. இருப்பினும், குவாண்டிசேஷன் துல்லியத்தில் சிறிது குறைவுக்கு வழிவகுக்கும்.

  • வன்பொருள் பரிசீலனைகள்: வெவ்வேறு வன்பொருள் உள்ளமைவுகள் வெவ்வேறு குவாண்டிசேஷன் வடிவங்களுக்கு மிகவும் பொருத்தமானதாக இருக்கலாம். எடுத்துக்காட்டாக, சில வன்பொருள்கள் 4-பிட் குவாண்டிசேஷனுக்காக மேம்படுத்தப்படலாம், மற்றவை 8-பிட் அல்லது 16-பிட் குவாண்டிசேஷனுக்கு மிகவும் பொருத்தமானதாக இருக்கலாம்.

மாதிரி துல்லியத்தை மதிப்பிடுதல்

புதிய மாதிரி வெளியீடுகள் பற்றிய செய்தி தலைப்புகள் உற்சாகமாக இருக்கும்போது, கூற்று செயல்திறன் முடிவுகளை எச்சரிக்கையுடன் அணுகுவது அவசியம். AI செயல்திறன் துறை மிகவும் போட்டித்தன்மை வாய்ந்தது, மேலும் நிறுவனங்கள் சில நேரங்களில் சந்தைப்படுத்தல் நோக்கங்களுக்காக செயல்திறன் புள்ளிவிவரங்களை ஊதிப் பெருக்குகின்றன. மாதிரி தரத்தை மதிப்பிடுவதற்கான மிகவும் நம்பகமான வழி தரப்படுத்தப்பட்ட சோதனைகளிலிருந்து மதிப்பெண்களையும் தரவரிசைப் பலகைகளையும் ஆராய்வது.

பல சோதனைகள் தரப்படுத்தப்பட்டவை என்று கூறினாலும், இந்த அமைப்புகளின் ‘பிளாக் பாக்ஸ்’ தன்மை மற்றும் சம்பந்தப்பட்ட பல மாறிகள் காரணமாக AI மாதிரிகளை மதிப்பிடுவது சவாலாக உள்ளது. AI இன் பதில்களையும் வெளியீடுகளையும் உண்மையான மற்றும் அறிவியல் ஆதாரங்களுக்கு எதிராக சரிபார்ப்பதே மிகவும் நம்பகமான அணுகுமுறை.

தரவரிசைப் பலகை இணையதளங்கள் வாக்குகளுடன் வரிசைப்படுத்தக்கூடிய தரவரிசைகளை வழங்குகின்றன, மேலும் நம்பிக்கை இடைவெளி மதிப்பெண்கள் பெரும்பாலும் சதவீதங்களாக வெளிப்படுத்தப்படுகின்றன. AI மாதிரிக்கு கேள்விகளைக் கொடுத்து அதன் பதில்களின் துல்லியத்தை அளவிடுவது பொதுவான தரக்குறியீடுகளை உள்ளடக்கியது. இந்த தரக்குறியீடுகளில் பின்வருவன அடங்கும்:

  • AI2 ரீசனிங் சேலஞ்ச் (ARC)
  • ஹெல்லாஸ்வாக் (HellaSwag)
  • எம்எம்எல்யூ (பாரிய பலபணி மொழி புரிதல்)
  • உண்மையானக்யூஏ (TruthfulQA)
  • வினோகிராண்ட் (Winogrande)
  • GSM8K
  • ஹியூமன்இவால் (HumanEval)

தரக்குறியீடு விளக்கங்கள்

  • AI2 ரீசனிங் சேலஞ்ச் (ARC): தொடக்கப் பள்ளி மாணவர்களுக்காக வடிவமைக்கப்பட்ட 7787 பல தேர்வு அறிவியல் கேள்விகளின் தொகுப்பு. இந்த தரக்குறியீடு அறிவியல் கருத்துக்களைப் பற்றி சிந்திக்கவும் சிக்கல்களைத் தீர்க்கவும் மாதிரியின் திறனை சோதிக்கிறது.

  • ஹெல்லாஸ்வாக் (HellaSwag): வாக்கியம் நிறைவு பயிற்சிகள் மூலம் பொது அறிவு காரணத்தை மதிப்பிடும் ஒரு தரக்குறியீடு. இந்த தரக்குறியீடு ஒரு வாக்கியத்தின் சூழலைப் புரிந்துகொண்டு மிகவும் தர்க்கரீதியான முடிவைத் தேர்வு செய்ய மாதிரியை சவால் செய்கிறது.

  • எம்எம்எல்யூ (பாரிய பலபணி மொழி புரிதல்): இந்த தரக்குறியீடு பரவலான பணிகளில் சிக்கல்களைத் தீர்க்கும் மாதிரியின் திறனை சோதிக்கிறது. இதற்கு விரிவான மொழி புரிதல் தேவைப்படுகிறது. பணிகள் கணிதம், வரலாறு, அறிவியல் மற்றும் சட்டம் உட்பட பல்வேறு தலைப்புகளை உள்ளடக்கியது.

  • உண்மையானக்யூஏ (TruthfulQA): இந்த தரக்குறியீடு மாதிரியின் உண்மையைப் பரிசோதிக்கிறது. தவறான கூற்றுகளுக்கு தண்டனை அளிக்கிறது மற்றும் ‘எனக்குத் தெரியாது’ போன்ற தட்டிக்கழிக்கும் பதில்களை ஊக்கப்படுத்துகிறது. இந்த தரக்குறியீடு துல்லியமான மற்றும் நேர்மையான பதில்களை வழங்க மாதிரியை ஊக்குவிக்கிறது.

  • வினோகிராண்ட் (Winogrande): வினோகிராடு திட்டத்தை அடிப்படையாகக் கொண்ட ஒரு சவால். இதில் தூண்டுதல் வார்த்தையின் அடிப்படையில் வேறுபடும் இரண்டு கிட்டத்தட்ட ஒரே மாதிரியான வாக்கியங்கள் உள்ளன. இந்த தரக்குறியீடு அர்த்தத்தில் உள்ள நுட்பமான வேறுபாடுகளைப் புரிந்துகொள்ளவும் தெளிவின்மையை தீர்க்கவும் மாதிரியின் திறனை சோதிக்கிறது.

  • GSM8K: 8,000 தொடக்கப் பள்ளி கணிதக் கேள்விகளின் தரவுத்தொகுப்பு. இந்த தரக்குறியீடு கணிதப் பிரச்சினைகளைத் தீர்க்கவும் கணக்கீடுகளைச் செய்யவும் மாதிரியின் திறனை சோதிக்கிறது.

  • ஹியூமன்இவால் (HumanEval): இந்த தரக்குறியீடு 164 சவால்களுக்கு பதிலளிக்கும் விதமாக சரியான பைதான் குறியீட்டை உருவாக்கும் மாதிரியின் திறனை அளவிடுகிறது. இந்த தரக்குறியீடு மாதிரியின் கோடிங் திறன்களையும் நிரலாக்கக் கருத்துக்களைப் புரிந்துகொண்டு செயல்படுத்தும் திறனையும் சோதிக்கிறது.

இந்த தரக்குறியீடுகளை கவனமாக ஆராய்வதன் மூலமும், AI இன் பதில்களை உண்மை மூலங்களுக்கு எதிராக சரிபார்ப்பதன் மூலமும், ஒரு மாதிரியின் திறன்களையும் வரம்புகளையும் நீங்கள் மிகவும் துல்லியமாகப் புரிந்துகொள்ள முடியும். இந்த தகவலை பின்னர் உங்கள் குறிப்பிட்ட தேவைகளுக்கு எந்த மாதிரிகள் மிகவும் பொருத்தமானவை என்பதைப் பற்றி தகவலறிந்த முடிவுகளை எடுக்க பயன்படுத்தலாம்.