கூகிளின் திறமையான புதிய ரோபோ AI | ta

உள்ளடங்கிய AIக்கான தேடல்: ஒரு மூன்ஷாட் இலக்கு

பல ஆண்டுகளாக, ரோபாட்டிக்ஸ் தொழில் ‘உள்ளடங்கிய AI’ என்ற இலக்கை அடைய முயன்று வருகிறது - அதாவது, பல்வேறு புதிய மற்றும் கணிக்க முடியாத சூழ்நிலைகளில் ரோபோக்களை தன்னிச்சையாகக் கட்டுப்படுத்தும் திறன் கொண்ட செயற்கை நுண்ணறிவை உருவாக்குவது, அதே நேரத்தில் பாதுகாப்பு மற்றும் துல்லியத்தை பராமரிப்பது. Nvidia போன்ற நிறுவனங்களால் தீவிரமாகப் பின்தொடரப்படும் இந்த லட்சியம், ரோபோக்களை உண்மையான உலகில் பரந்த அளவிலான பணிகளைச் செய்யக்கூடிய பல்துறை தொழிலாளர்களாக மாற்றுவதற்கான திறனைக் கொண்ட ஒரு ‘புனித கிரெயில்’ ஆக உள்ளது.

ஜெமினி ரோபாட்டிக்ஸ்: மொழி மற்றும் பார்வையின் அடித்தளத்தை உருவாக்குதல்

கூகிளின் புதிய மாடல்கள் ஜெமினி 2.0 பெரிய மொழி மாதிரியின் சக்தியைப் பயன்படுத்துகின்றன, ரோபோ பயன்பாடுகளின் குறிப்பிட்ட கோரிக்கைகளை உள்ளடக்கும் வகையில் அதன் திறன்களை விரிவுபடுத்துகின்றன. ஜெமினி ரோபாட்டிக்ஸ் கூகிள் ‘பார்வை-மொழி-செயல்’ (VLA) திறன்கள் என்று கூறுவதை உள்ளடக்கியது. இது மாதிரி காட்சி உள்ளீட்டைச் செயலாக்கவும், இயற்கை மொழி கட்டளைகளை விளக்கவும், இந்த உள்ளீடுகளை துல்லியமான உடல் அசைவுகளாக மொழிபெயர்க்கவும் அனுமதிக்கிறது. இதற்கு நேர்மாறாக, ஜெமினி ரோபாட்டிக்ஸ்-ER ‘உள்ளடங்கிய பகுத்தறிவில்’ கவனம் செலுத்துகிறது, மேம்பட்ட இடஞ்சார்ந்த புரிதலைக் கொண்டுள்ளது, இது ஏற்கனவே உள்ள ரோபோ கட்டுப்பாட்டு அமைப்புகளுடன் தடையற்ற ஒருங்கிணைப்பை செயல்படுத்துகிறது.

புரிதலில் இருந்து செயலுக்கு: திறமையின் புதிய சகாப்தம்

இந்த முன்னேற்றங்களின் நடைமுறை தாக்கங்கள் ஆழமானவை. ஜெமினி ரோபாட்டிக்ஸ் பொருத்தப்பட்ட ஒரு ரோபோவுக்கு ‘வாழைப்பழத்தை எடுத்து கூடையில் போடு’ என்று அறிவுறுத்துவதை கற்பனை செய்து பாருங்கள். ரோபோ, அதன் கேமரா அடிப்படையிலான பார்வையைப் பயன்படுத்தி, வாழைப்பழத்தை அடையாளம் கண்டு, பணியைச் செயல்படுத்த அதன் ரோபோ கையை திறமையாக வழிநடத்தும். அல்லது, ‘ஒரு ஓரிகமி நரியை மடியுங்கள்’ என்ற கட்டளையைக் கவனியுங்கள். ரோபோ, ஓரிகமி பற்றிய அறிவையும், காகிதத்தை மடிக்கும் நுட்பமான கலையையும் பயன்படுத்தி, சிக்கலான பணியை கவனமாகச் செய்யும்.

2023 ஆம் ஆண்டில், கூகிளின் RT-2 மாதிரி பொதுவான ரோபோ திறன்களை நோக்கிய ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறித்தது. இணையத் தரவைப் பயன்படுத்துவதன் மூலம், RT-2 ரோபோக்களுக்கு மொழி கட்டளைகளைப் புரிந்துகொள்ளவும் புதிய சூழ்நிலைகளுக்கு ஏற்பவும் அதிகாரம் அளித்தது, அதன் முன்னோடியுடன் ஒப்பிடும்போது கண்ணுக்கு தெரியாத பணிகளில் செயல்திறனை இரட்டிப்பாக்கியது. இரண்டு ஆண்டுகளுக்குப் பிறகு, ஜெமினி ரோபாட்டிக்ஸ் மற்றொரு கணிசமான பாய்ச்சலை உருவாக்கியதாகத் தெரிகிறது, வெறும் புரிதலைத் தாண்டி, RT-2 இன் வரம்பிற்கு அப்பாற்பட்ட சிக்கலான உடல் கையாளுதல்களைச் செயல்படுத்துவதை உள்ளடக்கியது.

RT-2 முன்பே பயிற்சி பெற்ற உடல் அசைவுகளை மறுபயன்படுத்துவதற்கு மட்டுமே கட்டுப்படுத்தப்பட்டிருந்தாலும், ஜெமினி ரோபாட்டிக்ஸ் திறமையில் குறிப்பிடத்தக்க மேம்பாட்டைக் காட்டுகிறது. இந்த புதிய திறமை, ஓரிகமி மடிப்பு மற்றும் ஜிப்-லாக் பைகளில் தின்பண்டங்களை துல்லியமாக பேக் செய்வது போன்ற முன்பு அடைய முடியாத பணிகளைத் திறக்கிறது. இந்த மாற்றம் - கட்டளைகளைப் புரிந்துகொள்ளும் ரோபோக்களிலிருந்து நுட்பமான உடல் பணிகளைச் செய்யக்கூடிய ரோபோக்கள் வரை - டீப்மைண்ட் ரோபாட்டிக்ஸில் மிகவும் நிலையான சவால்களில் ஒன்றை தீர்க்கும் விளிம்பில் இருக்கலாம் என்பதைக் குறிக்கிறது: ரோபோக்கள் தங்கள் ‘அறிவை’ கவனமாக, துல்லியமான இயக்கங்களாக மொழிபெயர்க்க உதவுகிறது. உண்மையான உலகம்.

பொதுமைப்படுத்தல்: உண்மையான உலகத் தழுவலுக்கான திறவுகோல்

டீப்மைண்ட் புதிய ஜெமினி ரோபாட்டிக்ஸ் அமைப்பு கணிசமாக மேம்பட்ட பொதுமைப்படுத்தலைக் காட்டுகிறது என்பதை வலியுறுத்துகிறது - வெளிப்படையாக பயிற்சி அளிக்கப்படாத புதிய பணிகளைச் செய்யும் திறன். இது ஒரு முக்கியமான முன்னேற்றம். நிறுவனத்தின் அறிவிப்பின்படி, ஜெமினி ரோபாட்டிக்ஸ் ‘மற்ற அதிநவீன பார்வை-மொழி-செயல் மாடல்களுடன் ஒப்பிடும்போது ஒரு விரிவான பொதுமைப்படுத்தல் அளவுகோலில் செயல்திறனை இரட்டிப்பாக்குகிறது.’

பொதுமைப்படுத்தல் மிக முக்கியமானது, ஏனெனில் ஒவ்வொரு சூழ்நிலைக்கும் குறிப்பிட்ட பயிற்சி தேவைப்படாமல் புதிய காட்சிகளுக்கு ஏற்ப மாற்றியமைக்கும் திறன் கொண்ட ரோபோக்கள் கணிக்க முடியாத உண்மையான உலக சூழல்களில் திறம்பட செயல்படுவதற்கான திறவுகோலைக் கொண்டுள்ளன. இந்த தகவமைப்பு ஒரு சிறப்பு, பணி சார்ந்த ரோபோவை உண்மையிலேயே பல்துறை மற்றும் தகவமைப்பு இயந்திரத்திலிருந்து பிரிக்கிறது.

ஒரு பொதுவான ரோபோ மூளை: கூகிளின் லட்சிய பார்வை

கூகிளின் முயற்சிகள் ஒரு ‘பொதுவான ரோபோ மூளையை’ உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளன - இது பரந்த அளவிலான ரோபோ தளங்களைக் கட்டுப்படுத்தும் திறன் கொண்ட ஒரு பல்துறை AI ஆகும். இந்த தொலைநோக்குப் பார்வைக்கு ஏற்ப, நிறுவனம் அப்ரோனிக் என்ற முன்னணி ரோபாட்டிக்ஸ் நிறுவனத்துடன் ‘ஜெமினி 2.0 உடன் அடுத்த தலைமுறை மனித உருவ ரோபோக்களை உருவாக்க’ ஒரு கூட்டாண்மையை அறிவித்துள்ளது.

முதன்மையாக ALOHA 2 எனப்படும் இருமுனை ரோபோ தளத்தில் பயிற்சி பெற்றாலும், ஜெமினி ரோபாட்டிக்ஸ் பல்வேறு ரோபோ வகைகளைக் கட்டுப்படுத்தும் பல்துறைத்திறனைக் கொண்டுள்ளது என்று கூகிள் கூறுகிறது. இதில் ஆராய்ச்சி சார்ந்த ஃபிராங்கா ரோபோ கைகள் மற்றும் அப்ரோனிக்கின் அப்பல்லோ ரோபோ போன்ற அதிநவீன மனித உருவ அமைப்புகள் அடங்கும். இந்த தகவமைப்பு ஜெமினி ரோபாட்டிக்ஸ் பரந்த அளவிலான ரோபோ பயன்பாடுகளுக்கான உலகளாவிய ‘மூளை’ ஆக மாறுவதற்கான திறனை அடிக்கோடிட்டுக் காட்டுகிறது.

மனித உருவ ரோபாட்டிக்ஸ் நிலப்பரப்பு: வன்பொருள் மற்றும் மென்பொருள் ஒன்றிணைகின்றன

மனித உருவ ரோபாட்டிக்ஸின் நாட்டம் ஒரு கூட்டு முயற்சியாகும், பல நிறுவனங்கள் சவாலின் வெவ்வேறு அம்சங்களுக்கு பங்களிக்கின்றன. ஃபிகர் AI மற்றும் போஸ்டன் டைனமிக்ஸ் (முன்னர் ஆல்பாபெட் துணை நிறுவனம்) போன்ற நிறுவனங்கள் மேம்பட்ட மனித உருவ ரோபாட்டிக்ஸ் வன்பொருளை உருவாக்கி வருகின்றன. இருப்பினும், உண்மையிலேயே பயனுள்ள AI ‘டிரைவர்’ - இந்த ரோபோக்களுக்கு புத்திசாலித்தனம் மற்றும் சுயாட்சியை வழங்கும் மென்பொருள் கூறு - ஒரு முக்கியமான காணாமல் போன பகுதியாகவே உள்ளது.

இந்த பகுதியில் கூகிளின் முயற்சிகள் வேகமெடுத்து வருகின்றன. போஸ்டன் டைனமிக்ஸ், அஜிலிட்டி ரோபாட்டிக்ஸ் மற்றும் என்சாண்டட் டூல்ஸ் உள்ளிட்ட முன்னணி ரோபாட்டிக்ஸ் நிறுவனங்களுக்கு ‘நம்பகமான சோதனையாளர்’ திட்டத்தின் மூலம் ஜெமினி ரோபாட்டிக்ஸ்-ER க்கு வரையறுக்கப்பட்ட அணுகலை நிறுவனம் வழங்கியுள்ளது. இந்த கூட்டு அணுகுமுறை உண்மையிலேயே திறன் கொண்ட மனித உருவ ரோபோக்களின் வளர்ச்சி மற்றும் வரிசைப்படுத்தலை துரிதப்படுத்த ஒரு ஒருங்கிணைந்த முயற்சியை பரிந்துரைக்கிறது.

பாதுகாப்பு முதலில்: பொறுப்பான ரோபாட்டிக்ஸுக்கு ஒரு அடுக்கு அணுகுமுறை

ரோபாட்டிக்ஸில் பாதுகாப்பின் முக்கியத்துவத்தை உணர்ந்து, கூகிள் பாரம்பரிய ரோபோ பாதுகாப்பு நடவடிக்கைகளை உள்ளடக்கிய ஒரு ‘அடுக்கு, முழுமையான அணுகுமுறையை’ வலியுறுத்துகிறது. இந்த நடவடிக்கைகள் மோதல் தவிர்ப்பு மற்றும் விசை வரம்புகள் ஆகியவை அடங்கும், ரோபோக்கள் பாதுகாப்பான அளவுருக்களுக்குள் செயல்படுவதை உறுதி செய்கிறது.

மேலும், நிறுவனம் ஒரு ‘ரோபோ அரசியலமைப்பு’ கட்டமைப்பின் வளர்ச்சியை விவரிக்கிறது. இந்த கட்டமைப்பு, ஐசக் அசிமோவின் ரோபாட்டிக்ஸின் மூன்று விதிகளால் ஈர்க்கப்பட்டு, ரோபோக்களின் நெறிமுறை மற்றும் பாதுகாப்பான வளர்ச்சி மற்றும் வரிசைப்படுத்தலுக்கான வழிகாட்டும் கொள்கைகளின் தொகுப்பை வழங்குகிறது. இந்த கட்டமைப்போடு இணைந்து, கூகிள் ‘ASIMOV’ என்ற பெயரிடப்பட்ட ஒரு தரவுத்தொகுப்பை வெளியிட்டுள்ளது, இது ரோபோ செயல்களின் பாதுகாப்பு தாக்கங்களை மதிப்பிடுவதில் ஆராய்ச்சியாளர்களுக்கு உதவுவதற்காக வடிவமைக்கப்பட்டுள்ளது.

ASIMOV தரவுத்தொகுப்பு: பாதுகாப்பு மதிப்பீட்டை தரப்படுத்துதல்

ASIMOV தரவுத்தொகுப்பு கூகிளின் ரோபோ பாதுகாப்பை மதிப்பிடுவதற்கான தரப்படுத்தப்பட்ட முறைகளை நிறுவுவதற்கான முயற்சியைக் குறிக்கிறது, உடல் ரீதியான தீங்கைத் தடுப்பதற்கும் அப்பால் நீண்டுள்ளது. பல்வேறு சூழ்நிலைகளில் ஒரு ரோபோவின் செயல்களின் சாத்தியமான விளைவுகளை AI மாதிரிகள் எவ்வளவு நன்றாகப் புரிந்துகொள்கின்றன என்பதை மதிப்பிடுவதற்கு ஆராய்ச்சியாளர்களுக்கு உதவ இந்த தரவுத்தொகுப்பு வடிவமைக்கப்பட்டுள்ளது. கூகிளின் அறிவிப்பின்படி, இந்த தரவுத்தொகுப்பு ‘உண்மையான உலக சூழ்நிலைகளில் ரோபோ செயல்களின் பாதுகாப்பு தாக்கங்களை கடுமையாக அளவிட ஆராய்ச்சியாளர்களுக்கு உதவும்.’ ரோபாட்டிக்ஸ் துறையில் பொறுப்பான கண்டுபிடிப்புகளுக்கான கூகிளின் உறுதிப்பாட்டை இந்த முயற்சி அடிக்கோடிட்டுக் காட்டுகிறது.

ரோபாட்டிக்ஸின் எதிர்காலம்: சாத்தியக்கூறுகளின் ஒரு பார்வை

புதிய AI மாடல்களுக்கான குறிப்பிட்ட காலக்கெடு அல்லது வணிக பயன்பாடுகளை கூகிள் இன்னும் அறிவிக்கவில்லை என்றாலும், தற்போது ஆராய்ச்சி கட்டத்தில் இருக்கும், நிரூபிக்கப்பட்ட முன்னேற்றங்கள் மறுக்கமுடியாத அளவிற்கு குறிப்பிடத்தக்கவை. கூகிள் வெளியிட்ட டெமோ வீடியோக்கள் AI- உந்துதல் திறன்களில் குறிப்பிடத்தக்க முன்னேற்றத்தைக் காட்டுகின்றன. இருப்பினும், இந்த ஆர்ப்பாட்டங்கள் கட்டுப்படுத்தப்பட்ட ஆராய்ச்சி சூழல்களில் நடத்தப்பட்டுள்ளன என்பதை ஒப்புக்கொள்வது முக்கியம். இந்த அமைப்புகளின் உண்மையான சோதனை உண்மையான உலகின் கணிக்க முடியாத மற்றும் மாறும் அமைப்புகளில் நம்பகத்தன்மையுடனும் பாதுகாப்பாகவும் செயல்படும் திறனில் இருக்கும்.

ஜெமினி ரோபாட்டிக்ஸ் மற்றும் ஜெமினி ரோபாட்டிக்ஸ்-ER ஆகியவற்றின் வளர்ச்சி ரோபாட்டிக்ஸின் பரிணாம வளர்ச்சியில் ஒரு முக்கிய தருணத்தைக் குறிக்கிறது. இந்த மாதிரிகள் திறமை, தகவமைப்பு மற்றும் சுயாட்சியின் ஒரு புதிய சகாப்தத்தைத் திறப்பதற்கான திறனைக் கொண்டுள்ளன, ரோபோக்கள் நம் வாழ்வில் தடையின்றி ஒருங்கிணைந்து பரந்த அளவிலான பணிகளுக்கு பங்களிக்க வழி வகுக்கிறது. ஆராய்ச்சி முன்னேறும்போது மற்றும் இந்த தொழில்நுட்பங்கள் முதிர்ச்சியடையும் போது, ரோபோக்கள் நம் வீடுகள், பணியிடங்கள் மற்றும் சமூகங்களில் பெருகிய முறையில் முக்கிய பங்கு வகிக்கும் ஒரு எதிர்காலத்தை நாம் எதிர்பார்க்கலாம். உண்மையிலேயே உள்ளடங்கிய AI நோக்கிய பயணம் தொடர்கிறது, ஆனால் கூகிளின் சமீபத்திய முன்னேற்றங்கள் முன்னால் இருக்கும் அற்புதமான சாத்தியக்கூறுகளின் ஒரு கட்டாய பார்வையை வழங்குகின்றன. அதிநவீன வன்பொருள் மற்றும் பெருகிய முறையில் அறிவார்ந்த மென்பொருளின் இணைவு ரோபாட்டிக்ஸ் நிலப்பரப்பை மாற்றுவதற்கு தயாராக உள்ளது, ரோபோக்கள் வெறும் கருவிகள் மட்டுமல்ல, நம் அன்றாட வாழ்வில் பல்துறை பங்காளிகளாக இருக்கும் ஒரு எதிர்காலத்திற்கு நம்மை நெருக்கமாக கொண்டு வருகிறது.

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௩-௧௩

# Google # Gemini # AGI