நுட்பமான-சரிசெய்தலின் மாயை
ஃபைன்-ட்யூனிங் மற்றும் ரீட்ரைவல் ஆக்மென்டட் ஜெனரேஷன் (RAG) ஆகியவை பொதுவாக முன் பயிற்சி பெற்ற AI மாடல்களின் அறிவு மற்றும் திறன்களை மேம்படுத்துவதற்கான நன்கு நிறுவப்பட்ட முறைகளாகக் கருதப்படுகின்றன. இருப்பினும், Aleph Alpha CEO ஜோனாஸ் ஆண்ட்ருலிஸ், உண்மை மிகவும் சிக்கலானது என்று சுட்டிக்காட்டுகிறார்.
“ஒரு வருடத்திற்கு முன்பு, ஃபைன்-ட்யூனிங் ஒரு மாயாஜால தீர்வு என்ற பரவலான நம்பிக்கை இருந்தது. ஒரு AI சிஸ்டம் விரும்பியபடி செயல்படவில்லை என்றால், அதற்கான பதில் ஃபைன்-ட்யூனிங் மட்டுமே. அது அவ்வளவு எளிதல்ல,” என்று அவர் விளக்கினார்.
ஃபைன்-ட்யூனிங் ஒரு மாதிரியின் பாணி அல்லது நடத்தையை மாற்றியமைக்க முடியும் என்றாலும், புதிய தகவலைக் கற்பிப்பதற்கான மிகவும் பயனுள்ள அணுகுமுறை இதுவல்ல. ஃபைன்-ட்யூனிங் மட்டுமே அனைத்து AI பயன்பாட்டு சிக்கல்களையும் தீர்க்கும் என்ற எதிர்பார்ப்பு ஒரு தவறான கருத்து.
RAG: ஒரு மாற்று அணுகுமுறை
RAG ஒரு வெளிப்புற காப்பகத்திலிருந்து தகவலை மீட்டெடுக்கும் ஒரு நூலகரைப் போல செயல்படுவதன் மூலம் ஒரு மாற்றீட்டை வழங்குகிறது. இந்த அணுகுமுறை மாதிரியை மறுபயிற்சி செய்யவோ அல்லது ஃபைன்-ட்யூனிங் செய்யவோ தேவையில்லாமல் தரவுத்தளத்தில் உள்ள தகவல்களை புதுப்பிக்கவும் மாற்றவும் அனுமதிக்கிறது. கூடுதலாக, உருவாக்கப்பட்ட முடிவுகளை துல்லியத்திற்காக மேற்கோள் காட்டலாம் மற்றும் தணிக்கை செய்யலாம்.
“குறிப்பிட்ட அறிவு எப்பொழுதும் ஆவணப்படுத்தப்பட வேண்டும், LLM இன் அளவுருக்களுக்குள் சேமிக்கப்படக்கூடாது,” என்று ஆண்ட்ருலிஸ் வலியுறுத்தினார்.
RAG பல நன்மைகளை வழங்கினாலும், அதன் வெற்றி முக்கிய செயல்முறைகள், நடைமுறைகள் மற்றும் நிறுவன அறிவை மாதிரி புரிந்து கொள்ளக்கூடிய வடிவத்தில் சரியான முறையில் ஆவணப்படுத்துவதில் தங்கியுள்ளது. துரதிர்ஷ்டவசமாக, இது பெரும்பாலும் அப்படி இல்லை.
ஆவணங்கள் இருந்தாலும் கூட, ஆவணங்கள் அல்லது செயல்முறைகள் அவுட்-ஆஃப்-டிஸ்ட்ரிபியூஷன் தரவைச் சார்ந்திருந்தால் - அடிப்படை மாதிரியைப் பயிற்றுவிக்கப் பயன்படுத்தப்படும் தரவிலிருந்து கணிசமாக வேறுபட்ட தரவு - நிறுவனங்கள் சிக்கல்களை எதிர்கொள்ளலாம். உதாரணமாக, ஆங்கில தரவுத்தொகுப்புகளில் மட்டுமே பயிற்சி பெற்ற ஒரு மாதிரி, ஜெர்மன் ஆவணங்களுடன் போராடும், குறிப்பாக அதில் அறிவியல் சூத்திரங்கள் இருந்தால். பல சந்தர்ப்பங்களில், மாதிரி தரவை விளக்க முடியாமல் போகலாம்.
எனவே, அர்த்தமுள்ள முடிவுகளை அடைய ஃபைன்-ட்யூனிங் மற்றும் RAG ஆகியவற்றின் கலவை பொதுவாக அவசியம் என்று ஆண்ட்ருலிஸ் பரிந்துரைக்கிறார். இந்த கலப்பின அணுகுமுறை அவற்றின் தனிப்பட்ட வரம்புகளை சமாளிக்க இரு முறைகளின் பலங்களையும் பயன்படுத்துகிறது.
பிரிவினையை இணைத்தல்
நிறுவனங்கள் மற்றும் நாடுகள் தங்கள் சொந்த இறையாண்மை கொண்ட AIகளை உருவாக்குவதைத் தடுக்கும் சவால்களைச் சமாளிப்பதன் மூலம் ஐரோப்பிய டீப் மைண்டாக தன்னை வேறுபடுத்திக் கொள்ள Aleph Alpha நோக்கமாக கொண்டுள்ளது.
இறையாண்மை AI என்பது ஒரு நாட்டின் உள் தரவுத்தொகுப்புகளைப் பயன்படுத்தி அதன் எல்லைக்குள் கட்டப்பட்ட அல்லது பயன்படுத்தப்பட்ட வன்பொருளில் பயிற்சி செய்யப்பட்ட அல்லது ஃபைன்-ட்யூன் செய்யப்பட்ட மாதிரிகளைக் குறிக்கிறது. இந்த அணுகுமுறை தரவு தனியுரிமை, பாதுகாப்பு மற்றும் கட்டுப்பாட்டை உறுதி செய்கிறது, இது பல நிறுவனங்களுக்கும் அரசாங்கங்களுக்கும் முக்கியமானது.
“நாங்கள் இயக்க முறைமையாக இருக்க முயற்சி செய்கிறோம், நிறுவனங்கள் மற்றும் அரசாங்கங்கள் தங்கள் சொந்த இறையாண்மை AI உத்தியை உருவாக்குவதற்கான அடித்தளமாக இருக்கிறோம்,” என்று ஆண்ட்ருலிஸ் கூறினார். “தேவைப்படும் இடங்களில் புதுமைப்படுத்தவும், முடிந்தவரை திறந்த மூல மற்றும் அதிநவீன தொழில்நுட்பங்களைப் பயன்படுத்தவும் நாங்கள் நோக்கமாகக் கொண்டுள்ளோம்.”
இது எப்போதாவது Aleph இன் Pharia-1-LLM போன்ற மாடல்களுக்கு பயிற்சி அளிப்பதை உள்ளடக்கியிருந்தாலும், அவர்கள் லாமா அல்லது டீப் சீக் போன்ற ஏற்கனவே உள்ள மாடல்களை நகலெடுக்க முயற்சிக்கவில்லை என்று ஆண்ட்ருலிஸ் வலியுறுத்துகிறார். அவர்களின் கவனம் குறிப்பிட்ட சவால்களை எதிர்கொள்ளும் தனித்துவமான தீர்வுகளை உருவாக்குவதில் உள்ளது.
“எல்லோரும் செய்வதை நகலெடுப்பதற்குப் பதிலாக, அர்த்தமுள்ள வித்தியாசமான விஷயங்களில் கவனம் செலுத்துமாறு எங்கள் ஆராய்ச்சியை நான் எப்போதும் வழிநடத்துகிறேன், ஏனென்றால் அது ஏற்கனவே உள்ளது,” என்று ஆண்ட்ருலிஸ் கூறினார். “நாங்கள் மற்றொரு லாமா அல்லது டீப் சீக்கை உருவாக்க வேண்டிய அவசியமில்லை, ஏனென்றால் அவை ஏற்கனவே உள்ளன.”
அதற்கு பதிலாக, Aleph Alpha இந்த தொழில்நுட்பங்களை ஏற்றுக்கொள்வதை எளிதாக்கும் மற்றும் நெறிப்படுத்தும் கட்டமைப்புகளை உருவாக்குவதில் கவனம் செலுத்துகிறது. ஒரு சமீபத்திய உதாரணம் அவர்களின் புதிய டோக்கனைசர் இல்லாத அல்லது “T-Free,” பயிற்சி கட்டமைப்பாகும், இது அவுட்-ஆஃப்-டிஸ்ட்ரிபியூஷன் தரவை மிகவும் திறமையாக புரிந்து கொள்ளக்கூடிய மாடல்களை ஃபைன்-ட்யூன் செய்வதை நோக்கமாகக் கொண்டுள்ளது.
பாரம்பரிய டோக்கனைசர் அடிப்படையிலான அணுகுமுறைகள் ஒரு மாதிரியை திறம்பட ஃபைன்-ட்யூன் செய்ய அதிக அளவு அவுட்-ஆஃப்-டிஸ்ட்ரிபியூஷன் தரவு தேவைப்படுகிறது. இது கணக்கீட்டு ரீதியாக விலை உயர்ந்தது மற்றும் போதுமான தரவு கிடைக்கிறது என்று கருதுகிறது.
Aleph Alpha இன் T-Free கட்டமைப்பு டோக்கனைசரை நீக்குவதன் மூலம் இந்த சிக்கலைத் தவிர்க்கிறது. ஃபின்னிஷ் மொழியில் அவர்களின் Pharia LLM இல் ஆரம்ப சோதனை டோக்கனைசர் அடிப்படையிலான அணுகுமுறைகளுடன் ஒப்பிடும்போது பயிற்சி செலவு மற்றும் கார்பன் தடம் 70 சதவீதம் குறைவதைக் காட்டியது. இந்த புதுமையான அணுகுமுறை ஃபைன்-ட்யூனிங்கை மேலும் அணுகக்கூடியதாகவும் நிலையானதாகவும் ஆக்குகிறது.
துல்லியமற்ற அல்லது உதவாத முடிவுகளுக்கு வழிவகுக்கும் ஆவணப்படுத்தப்பட்ட அறிவில் உள்ள இடைவெளிகளை நிவர்த்தி செய்வதற்கான கருவிகளையும் Aleph Alpha உருவாக்கியுள்ளது.
உதாரணமாக, ஒரு இணக்க கேள்விக்கு தொடர்புடைய இரண்டு ஒப்பந்தங்கள் ஒன்றுக்கொன்று முரணாக இருந்தால், “சிஸ்டம் மனிதனை அணுகி, ‘நான் ஒரு முரண்பாட்டைக் கண்டேன்… இது ஒரு உண்மையான முரண்பாடா என்பது குறித்து நீங்கள் கருத்து தெரிவிக்க முடியுமா?’” என்று கேட்கலாம், என்று ஆண்ட்ருலிஸ் விளக்கினார்.
Pharia Catch எனப்படும் இந்த கட்டமைப்பின் மூலம் சேகரிக்கப்பட்ட தகவல்கள் பயன்பாட்டின் அறிவுத் தளத்திற்கு மீண்டும் அளிக்கப்படலாம் அல்லது மிகவும் பயனுள்ள மாடல்களை ஃபைன்-ட்யூன் செய்ய பயன்படுத்தப்படலாம். இந்த பின்னூட்ட வளையம் காலப்போக்கில் AI அமைப்பின் துல்லியம் மற்றும் நம்பகத்தன்மையை மேம்படுத்துகிறது.
ஆண்ட்ருலிஸின் கூற்றுப்படி, இந்த கருவிகள் PwC, Deloitte, Capgemini மற்றும் Supra போன்ற கூட்டாளர்களை ஈர்த்துள்ளன, அவர்கள் Aleph Alpha இன் தொழில்நுட்பத்தை செயல்படுத்த இறுதி வாடிக்கையாளர்களுடன் இணைந்து பணியாற்றுகிறார்கள். இந்த கூட்டாண்மைகள் உண்மையான உலக பயன்பாடுகளில் Aleph Alpha இன் தீர்வுகளின் மதிப்பு மற்றும் நடைமுறைத்தன்மையை நிரூபிக்கின்றன.
வன்பொருள் காரணி
இறையாண்மை AI ஐ ஏற்றுக்கொள்பவர்கள் எதிர்கொள்ளும் சவால்கள் மென்பொருள் மற்றும் தரவு மட்டுமல்ல. வன்பொருள் மற்றொரு முக்கியமான விஷயம்.
வெவ்வேறு நிறுவனங்கள் மற்றும் நாடுகளுக்கு உள்நாட்டில் உருவாக்கப்பட்ட வன்பொருளில் இயங்குவதற்கான குறிப்பிட்ட தேவைகள் இருக்கலாம் அல்லது பணிச்சுமைகள் எங்கு இயங்க முடியும் என்பதை ஆணையிடலாம். இந்த கட்டுப்பாடுகள் வன்பொருள் மற்றும் உள்கட்டமைப்பின் தேர்வை கணிசமாக பாதிக்கலாம்.
இதன் பொருள் ஆண்ட்ருலிஸ் மற்றும் அவரது குழுவினர் பரந்த அளவிலான வன்பொருள் விருப்பங்களை ஆதரிக்க வேண்டும். Aleph Alpha AMD, Graphcore மற்றும் Cerebras உள்ளிட்ட வன்பொருள் கூட்டாளர்களின் தேர்ந்தெடுக்கப்பட்ட குழுவை ஈர்த்துள்ளது.
கடந்த மாதம், Aleph Alpha அதன் MI300-தொடர் முடுக்கிகளைப் பயன்படுத்த AMD உடன் ஒரு கூட்டாண்மையை அறிவித்தது. இந்த ஒத்துழைப்பு AI பயிற்சி மற்றும் அனுமானத்தை துரிதப்படுத்த AMD இன் மேம்பட்ட வன்பொருளைப் பயன்படுத்தும்.
சாஃப்ட்பேங்க் வாங்கிய கிராஃப்கோர் மற்றும் ஜெர்மன் ஆயுதப் படைகளுக்கு AI மாடல்களைப் பயிற்றுவிக்கப் பயன்படும் CS-3 வேஃபர்-ஸ்கேல் முடுக்கிகளைக் கொண்ட செரிப்ராஸ் ஆகியவற்றுடனான ஒத்துழைப்பையும் ஆண்ட்ருலிஸ் எடுத்துரைத்தார். இந்த கூட்டாண்மைகள் Aleph Alpha தனது வாடிக்கையாளர்களின் குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்ய பல்வேறு வன்பொருள் வழங்குநர்களுடன் இணைந்து செயல்படுவதற்கான உறுதிப்பாட்டை நிரூபிக்கின்றன.
இந்த ஒத்துழைப்புகள் இருந்தபோதிலும், Aleph Alpha இன் குறிக்கோள் ஒரு நிர்வகிக்கப்பட்ட சேவை அல்லது கிளவுட் வழங்குநராக மாறுவது அல்ல என்று ஆண்ட்ருலிஸ் வலியுறுத்துகிறார். “நாங்கள் ஒருபோதும் கிளவுட் வழங்குநராக மாற மாட்டோம்,” என்று அவர் கூறினார். “எனது வாடிக்கையாளர்கள் சுதந்திரமாகவும் பூட்டப்படாமலும் இருக்க வேண்டும் என்று நான் விரும்புகிறேன்.” வாடிக்கையாளர் சுதந்திரம் மற்றும் நெகிழ்வுத்தன்மைக்கான இந்த அர்ப்பணிப்பு Aleph Alpha வை மற்ற பல AI நிறுவனங்களிலிருந்து வேறுபடுத்துகிறது.
வரவிருக்கும் பாதை: அதிகரிக்கும் சிக்கல்தன்மை
முன்னோக்கிப் பார்க்கும்போது, சாட்போட்களிலிருந்து அதிக சிக்கலான சிக்கலைத் தீர்க்கும் திறன் கொண்ட ஏஜென்டிக் AI அமைப்புகளுக்கு தொழில் மாறுவதால் AI பயன்பாடுகளை உருவாக்குவது மிகவும் சிக்கலானதாக மாறும் என்று ஆண்ட்ருலிஸ் எதிர்பார்க்கிறார்.
ஏஜென்டிக் AI கடந்த ஆண்டில் கணிசமான கவனத்தை ஈர்த்துள்ளது, மாதிரி உருவாக்குபவர்கள், மென்பொருள் உருவாக்குநர்கள் மற்றும் வன்பொருள் விற்பனையாளர்கள் ஒத்திசைவற்ற முறையில் பல-படி செயல்முறைகளை முடிக்கக்கூடிய அமைப்புகளை உறுதியளிக்கின்றனர். ஆரம்பகால எடுத்துக்காட்டுகளில் OpenAI இன் ஆபரேட்டர் மற்றும் ஆந்த்ரோபிக்கின் கணினி பயன்பாட்டு API ஆகியவை அடங்கும். இந்த ஏஜென்டிக் AI அமைப்புகள் AI திறன்களில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கின்றன.
“கடந்த ஆண்டு, நாங்கள் முக்கியமாக ஆவண சுருக்கம் அல்லது எழுத்து உதவி போன்ற நேரடியான பணிகளில் கவனம் செலுத்தினோம்,” என்று அவர் கூறினார். “இப்போது, முதல் பார்வையில் ஜெனரேட்டிவ் AI சிக்கல்களாகத் தெரியாத விஷயங்களுடன் இது மிகவும் உற்சாகமாக இருக்கிறது, அங்கு பயனர் அனுபவம் ஒரு சாட்பாட் அல்ல.” மிகவும் சிக்கலான மற்றும் ஒருங்கிணைந்த AI பயன்பாடுகளை நோக்கிய இந்த மாற்றம் தொழில்துறைக்கு புதிய சவால்களையும் வாய்ப்புகளையும் அளிக்கிறது.
நிறுவன AI பயன்பாடுகளை உருவாக்குவதில் முக்கிய சவால்கள்:
- மாதிரி பயிற்சி மற்றும் பயன்பாட்டு ஒருங்கிணைப்புக்கு இடையிலான இடைவெளியை இணைத்தல்: LLM களின் திறன்களை நடைமுறை பயன்பாடுகளாக திறம்பட மொழிபெயர்ப்பது ஒரு குறிப்பிடத்தக்க தடையாக உள்ளது.
- ஃபைன்-ட்யூனிங்கின் வரம்புகளை சமாளித்தல்: AI மாடல்களுக்கு புதிய தகவல்களைக் கற்பிப்பதற்கோ அல்லது குறிப்பிட்ட பணிகளுக்கு ஏற்றவாறு மாற்றுவதற்கோ ஃபைன்-ட்யூனிங் மட்டும் போதாது.
- தரவின் தரம் மற்றும் அணுகலை உறுதி செய்தல்: RAG நன்கு ஆவணப்படுத்தப்பட்ட மற்றும் உடனடியாக அணுகக்கூடிய தரவை நம்பியுள்ளது, இது பல நிறுவனங்களில் பெரும்பாலும் இல்லை.
- அவுட்-ஆஃப்-டிஸ்ட்ரிபியூஷன் தரவைக் கையாளுதல்: AI மாடல்கள் தாங்கள் பயிற்சி பெற்ற தரவிலிருந்து வேறுபட்ட தரவைக் கையாளக்கூடியதாக இருக்க வேண்டும், இதற்கு சிறப்பு நுட்பங்கள் தேவை.
- வன்பொருள் தடைகளை நிவர்த்தி செய்தல்: வெவ்வேறு நிறுவனங்கள் மற்றும் நாடுகளுக்கு மாறுபட்ட வன்பொருள் தேவைகள் உள்ளன, அவை கவனத்தில் கொள்ளப்பட வேண்டும்.
- தரவு தனியுரிமை மற்றும் பாதுகாப்பை பராமரித்தல்: இறையாண்மை AI தரவு ஒரு நாட்டின் எல்லைக்குள் பாதுகாப்பாக செயலாக்கப்பட்டு சேமிக்கப்படுவதை உறுதி செய்ய வேண்டும்.
- ஏஜென்டிக் AI அமைப்புகளை உருவாக்குதல்: ஒத்திசைவற்ற முறையில் சிக்கலான பல-படி செயல்முறைகளைச் செய்யக்கூடிய AI பயன்பாடுகளை உருவாக்குவது சவாலானது ஆனால் நம்பிக்கைக்குரிய ஆராய்ச்சி பகுதி.
நிறுவன AI பயன்பாடுகளை உருவாக்குவதில் முக்கிய வாய்ப்புகள்:
- புதுமையான AI தீர்வுகளை உருவாக்குதல்: நிறுவன AI பயன்பாடுகளை உருவாக்குவதில் உள்ள சவால்கள் குறிப்பிட்ட தேவைகளை நிவர்த்தி செய்யும் புதுமையான தீர்வுகளை உருவாக்குவதற்கான வாய்ப்புகளை உருவாக்குகின்றன.
- திறந்த மூல தொழில்நுட்பங்களைப் பயன்படுத்துதல்: திறந்த மூல தொழில்நுட்பங்கள் செலவுகளைக் குறைக்கவும் AI பயன்பாடுகளின் வளர்ச்சியை துரிதப்படுத்தவும் உதவும்.
- வன்பொருள் கூட்டாளர்களுடன் ஒத்துழைத்தல்: வன்பொருள் கூட்டாளர்களுடன் ஒத்துழைப்பது AI பயன்பாடுகள் குறிப்பிட்ட வன்பொருள் தளங்களுக்கு உகந்ததாக இருப்பதை உறுதிசெய்ய உதவும்.
- இறையாண்மை AI திறன்களை உருவாக்குதல்: இறையாண்மை AI நாடுகள் மற்றும் நிறுவனங்களுக்கு அவற்றின் தரவு மற்றும் AI உள்கட்டமைப்பின் மீது அதிக கட்டுப்பாட்டை வழங்க முடியும்.
- AI உடன் தொழில்களை மாற்றுதல்: AI பணிகளை தானியக்கமாக்குதல், முடிவெடுப்பதை மேம்படுத்துதல் மற்றும் புதிய தயாரிப்புகள் மற்றும் சேவைகளை உருவாக்குதல் மூலம் தொழில்களை மாற்றும் ஆற்றலைக் கொண்டுள்ளது.
நிறுவன AI பயன்பாடுகளின் எதிர்காலம்:
நிறுவன AI பயன்பாடுகளின் எதிர்காலம் பின்வருவனவற்றால் வகைப்படுத்தப்படும்:
- அதிகரித்த சிக்கல்தன்மை: AI பயன்பாடுகள் மிகவும் சிக்கலானதாகவும் ஒருங்கிணைந்ததாகவும் மாறும், இதற்கு சிறப்பு நிபுணத்துவம் மற்றும் கருவிகள் தேவைப்படும்.
- தரவின் தரத்தில் அதிக கவனம்: AI பயன்பாடுகள் துல்லியமான மற்றும் நம்பகமான தரவை நம்பியிருப்பதால் தரவின் தரம் முக்கியத்துவம் பெறும்.
- பாதுகாப்பு மற்றும் தனியுரிமைக்கு அதிக முக்கியத்துவம்: AI பயன்பாடுகள் முக்கியமான தரவைக் கையாளுவதால் பாதுகாப்பு மற்றும் தனியுரிமை மிக முக்கியமானது.
- ஏஜென்டிக் AI இன் பரந்த தத்தெடுப்பு: நிறுவனங்கள் சிக்கலான பணிகளை தானியக்கமாக்க முயற்சிப்பதால் ஏஜென்டிக் AI அமைப்புகள் மிகவும் பரவலாக மாறும்.
- தொடர்ச்சியான கண்டுபிடிப்பு: AI இன் புலம் வேகமாக தொடர்ந்து உருவாகும், இது புதிய முன்னேற்றங்கள் மற்றும் வாய்ப்புகளுக்கு வழிவகுக்கும்.
சவால்களை நிவர்த்தி செய்வதன் மூலமும், வாய்ப்புகளைத் தழுவுவதன் மூலமும், நிறுவனங்கள் தங்கள் வணிகங்களை மாற்றவும் சிறந்த எதிர்காலத்தை உருவாக்கவும் AI இன் சக்தியைப் பயன்படுத்தலாம்.