Google Gemini: புதிய பார்வைத் திறனுடன் Apple AIக்கு சவால்

செயற்கை நுண்ணறிவில் (AI) புதுமைகளின் இடைவிடாத வேகம் தொழில்நுட்ப நிலப்பரப்பை, குறிப்பாக ஸ்மார்ட்போன் திறன்களின் தீவிர போட்டி அரங்கில் தொடர்ந்து மறுவடிவமைத்து வருகிறது. இந்த இயக்கவியலை அடிக்கோடிட்டுக் காட்டும் ஒரு நடவடிக்கையாக, Google தனது AI உதவியாளரான Gemini-ஐ சில Android சாதனங்களில் அதிநவீன காட்சி விளக்கம் (visual interpretation) அம்சங்களுடன் சித்தப்படுத்தத் தொடங்கியுள்ளது. இந்த வளர்ச்சி, Apple தனது சொந்த லட்சிய AI தொகுப்பான ‘Apple Intelligence’-ஐ வெளியிட்ட சிறிது நேரத்திலேயே வருகிறது, அதன் சில பகுதிகள் வெளியீட்டு தாமதங்களை எதிர்கொள்கின்றன, இது அடுத்த தலைமுறை, சூழல்-விழிப்புணர்வு AI-ஐ நேரடியாக பயனர்களின் கைகளில் நிலைநிறுத்துவதில் Google ஆரம்பகால முன்னணியைப் பெறக்கூடும் என்று பரிந்துரைக்கிறது.

Gemini பார்க்கவும் பகிரவும் கற்றுக்கொள்கிறது: புதிய திறன்களை ஒரு நெருக்கமான பார்வை

Google, Gemini-யின் மேம்பட்ட செயல்பாடுகளின் வெளியீடு தொடங்கியதை உறுதிப்படுத்தியது, குறிப்பாக கேமரா உள்ளீடு மற்றும் திரை பகிர்வு (screen-sharing) திறன்களை ஒருங்கிணைக்கிறது. இந்த மேம்பட்ட அம்சங்கள் ஆரம்பத்தில் Gemini Advanced மற்றும் Google One AI Premium திட்டத்தின் சந்தாதாரர்களுக்கு அணுகக்கூடியதாக உள்ளன, அவற்றை Google-இன் சுற்றுச்சூழல் அமைப்பில் பிரீமியம் சலுகைகளாக நிலைநிறுத்துகின்றன. முக்கிய கண்டுபிடிப்பு, சாதனத்தின் திரை அல்லது அதன் கேமரா லென்ஸ் மூலம் நிகழ்நேரத்தில் காட்சித் தகவலைச் செயலாக்கவும் புரிந்துகொள்ளவும் Gemini-க்கு அதிகாரம் அளிப்பதில் உள்ளது.

உங்கள் தொலைபேசியின் கேமராவை நிஜ உலகில் உள்ள ஒரு பொருளின் மீது சுட்டிக்காட்டுவதை கற்பனை செய்து பாருங்கள் - ஒருவேளை அறிமுகமில்லாத வன்பொருள், நீங்கள் அடையாளம் காண விரும்பும் ஒரு தாவரம் அல்லது ஒரு கட்டிடத்தின் கட்டடக்கலை விவரங்கள். புதிய புதுப்பித்தலுடன், Gemini எளிய அடையாளப்படுத்தலுக்கு அப்பால் செல்ல இலக்கு கொண்டுள்ளது, இது Google Lens போன்ற கருவிகளால் ஏற்கனவே திறமையாக கையாளப்படும் ஒரு பணியாகும். AI ‘பார்ப்பதை’ அடிப்படையாகக் கொண்ட உரையாடல் தொடர்புகளை செயல்படுத்துவதே குறிக்கோள். Google-இன் சொந்த விளம்பரப் பொருட்கள் இந்த திறனை ஒரு பயனர் குளியலறை டைல்ஸ்களை வாங்கும் சூழ்நிலையுடன் விளக்குகின்றன. Gemini, நேரடி கேமரா ஊட்டத்தை அணுகி, வண்ணத் தட்டுகள் பற்றி விவாதிக்கலாம், நிரப்பு பாணிகளைப் பரிந்துரைக்கலாம் அல்லது வடிவங்களை ஒப்பிடலாம், காட்சி சூழலில் அடித்தளமாக ஊடாடும் வழிகாட்டுதலை வழங்கலாம். இந்த தொடர்பு மாதிரி நிலையான பட பகுப்பாய்விலிருந்து கணிசமாக ஒரு மாறும், உதவியாளர் போன்ற பாத்திரத்தை நோக்கி நகர்கிறது.

இதேபோல், திரை பகிர்வு அம்சம் சூழல் சார்ந்த உதவியின் ஒரு புதிய அடுக்கை உறுதியளிக்கிறது. பயனர்கள் தங்கள் தொலைபேசித் திரையில் தற்போது காட்டப்படுவதை Gemini-க்கு திறம்பட ‘காட்ட’ முடியும். இது ஒரு சிக்கலான பயன்பாட்டு இடைமுகத்தில் செல்ல உதவி தேடுவது, திரையில் தெரியும் மின்னஞ்சலை வரைவதில் ஆலோசனை பெறுவது, அல்லது Gemini-ஐ நிலைமையை பார்வைக்கு மதிப்பிட அனுமதிப்பதன் மூலம் தொழில்நுட்ப சிக்கலை சரிசெய்வது வரை இருக்கலாம். வாய்மொழி விளக்கங்களை மட்டுமே நம்புவதற்குப் பதிலாக, பயனர்கள் நேரடி காட்சி உள்ளீட்டை வழங்க முடியும், இது AI-யிடமிருந்து மிகவும் துல்லியமான மற்றும் திறமையான ஆதரவுக்கு வழிவகுக்கும். இது AI-ஐ உரை அல்லது குரல் கட்டளைகளின் செயலற்ற பெறுநரிலிருந்து பயனரின் டிஜிட்டல் சூழலின் செயலில் உள்ளபார்வையாளராக மாற்றுகிறது.

இந்த திறன்கள் பன்முக AI (multimodal AI)-யின் சக்தியைப் பயன்படுத்துகின்றன, இது ஒரே நேரத்தில் பல உள்ளீட்டு வகைகளிலிருந்து - இந்த விஷயத்தில், உரை, குரல் மற்றும் முக்கியமாக, பார்வை - தகவல்களைச் செயலாக்கவும் புரிந்துகொள்ளவும் வடிவமைக்கப்பட்டுள்ளது. இந்த சிக்கலான தொழில்நுட்பத்தை நேரடியாக ஸ்மார்ட்போன் அனுபவத்திற்குள் கொண்டு வருவது ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது, AI உதவியை மிகவும் உள்ளுணர்வு மற்றும் அன்றாட பணிகளில் ஆழமாக ஒருங்கிணைப்பதை நோக்கமாகக் கொண்டுள்ளது. சாத்தியமான பயன்பாடுகள் பரந்தவை, ஒருவேளை AI-யின் வளர்ந்து வரும் புரிதல் மற்றும் பயனரின் கற்பனையால் மட்டுமே வரையறுக்கப்படுகின்றன. கல்வி உதவியிலிருந்து, Gemini திரையில் ஒரு வரைபடத்தை பகுப்பாய்வு செய்ய உதவக்கூடும், அணுகல் மேம்பாடுகள் வரை, ஒரு AI ‘பார்க்க’ மற்றும் எதிர்வினையாற்றும் திறன் எண்ணற்ற சாத்தியங்களைத் திறக்கிறது.

படிப்படியான வெளியீட்டை வழிநடத்துதல்: யாருக்கு எப்போது அணுகல் கிடைக்கும்?

வெளியீடு நடந்து கொண்டிருக்கிறது என்று Google-இடமிருந்து அதிகாரப்பூர்வ உறுதிப்படுத்தல் இருந்தபோதிலும், இந்த அதிநவீன அம்சங்களை அணுகுவது தகுதியான பிரீமியம் சந்தாதாரர்களுக்குக் கூட இன்னும் உலகளாவிய அனுபவமாக இல்லை. கேமரா மற்றும் திரை பகிர்வு செயல்பாடுகளை வெற்றிகரமாக செயல்படுத்திய பயனர்களிடமிருந்து வரும் அறிக்கைகள் அவ்வப்போது மட்டுமே உள்ளன, இது பரந்த அளவிலான, ஒரே நேரத்தில் வெளியீட்டைக் காட்டிலும் கவனமாக நிர்வகிக்கப்படும், கட்டம் கட்டமான வரிசைப்படுத்தலின் படத்தை வரைகிறது. இந்த அளவிடப்பட்ட அணுகுமுறை தொழில்நுட்பத் துறையில் பொதுவானது, குறிப்பாக சிக்கலான AI மாதிரிகளை உள்ளடக்கிய குறிப்பிடத்தக்க அம்சப் புதுப்பிப்புகளுக்கு.

சுவாரஸ்யமாக, அம்சங்கள் செயலில் இருப்பதற்கான சில ஆரம்ப உறுதிப்படுத்தல்கள் Google-இன் சொந்த Pixel சாதனங்களின் பயனர்களிடமிருந்து மட்டுமல்லாமல், Xiaomi போன்ற பிற உற்பத்தியாளர்களின் வன்பொருளைப் பயன்படுத்தும் நபர்களிடமிருந்தும் வந்துள்ளன. இது வெளியீடு ஆரம்பத்தில் சாதன பிராண்டால் கண்டிப்பாக வரையறுக்கப்படவில்லை என்று அறிவுறுத்துகிறது, இருப்பினும் நீண்ட கால கிடைக்கும் தன்மை மற்றும் தேர்வுமுறை Android சுற்றுச்சூழல் அமைப்பு முழுவதும் மாறுபடலாம். பிரீமியம் AI அடுக்குகளுக்கு வெளிப்படையாக பணம் செலுத்துபவர்கள் கூட மாறுபட்ட அணுகல் நேரங்களை அனுபவிக்கிறார்கள் என்பது உலகளவில் பல்வேறு வன்பொருள் மற்றும் மென்பொருள் உள்ளமைவுகளில் இத்தகைய புதுப்பிப்புகளை விநியோகிப்பதில் உள்ள சிக்கல்களை எடுத்துக்காட்டுகிறது.

பல காரணிகள் இந்த படிப்படியான வெளியீட்டு மூலோபாயத்திற்கு பங்களிக்கின்றன. முதலாவதாக, இது Google-ஐ நிகழ்நேரத்தில் சர்வர் சுமை மற்றும் செயல்திறன் தாக்கங்களைக் கண்காணிக்க அனுமதிக்கிறது. நேரடி வீடியோ ஊட்டங்கள் மற்றும் திரை உள்ளடக்கத்தை அதிநவீன AI மாதிரிகள் மூலம் செயலாக்குவது கணக்கீட்டு ரீதியாக தீவிரமானது மற்றும் குறிப்பிடத்தக்க பின்தள உள்கட்டமைப்பு தேவைப்படுகிறது. ஒரு தடுமாற்றமான வெளியீடு கணினி அதிக சுமைகளைத் தடுக்க உதவுகிறது மற்றும் ஆரம்பகால தத்தெடுப்பவர்களுக்கு ஒரு மென்மையான அனுபவத்தை உறுதி செய்கிறது. இரண்டாவதாக, அம்சங்களை பரவலாகக் கிடைக்கச் செய்வதற்கு முன்பு ஒரு சிறிய, கட்டுப்படுத்தப்பட்ட குழுவிலிருந்து முக்கியமான நிஜ உலக பயன்பாட்டுத் தரவு மற்றும் பயனர் கருத்துக்களைச் சேகரிக்க Google-க்கு இது ஒரு வாய்ப்பை வழங்குகிறது. இந்த பின்னூட்ட வளையம் பிழைகளைக் கண்டறிவதற்கும், பயனர் இடைமுகத்தை செம்மைப்படுத்துவதற்கும், உண்மையான தொடர்பு முறைகளின் அடிப்படையில் AI-யின் செயல்திறனை மேம்படுத்துவதற்கும் விலைமதிப்பற்றது. இறுதியாக, பிராந்திய கிடைக்கும் தன்மை, மொழி ஆதரவு மற்றும் ஒழுங்குமுறை பரிசீலனைகள் ஆகியவை வெவ்வேறு சந்தைகளில் வெளியீட்டு அட்டவணையை பாதிக்கலாம்.

அணுகலின் ஆரம்ப சொட்டு ஆர்வமுள்ள பயனர்களுக்கு மெதுவாக உணரக்கூடும் என்றாலும், இது சக்திவாய்ந்த புதிய தொழில்நுட்பத்தை நிலைநிறுத்துவதற்கான ஒரு நடைமுறை அணுகுமுறையை பிரதிபலிக்கிறது. வருங்கால பயனர்கள், குறிப்பாக Pixel அல்லது உயர்நிலை Samsung Galaxy சாதனங்களில் உள்ளவர்கள், வரும் வாரங்களில் தங்கள் Gemini பயன்பாட்டில் புதுப்பிப்புகளைக் கண்காணிக்க அறிவுறுத்தப்படுகிறார்கள், காட்சி அம்சங்கள் தங்கள் குறிப்பிட்ட சாதனத்தில் செயலில் வருவதற்கு முன்பு பொறுமை தேவைப்படலாம் என்பதைப் புரிந்துகொள்கிறார்கள். சரியான காலவரிசை மற்றும் ஆரம்பத்தில் ஆதரிக்கப்படும் சாதனங்களின் முழு பட்டியல் Google-ஆல் குறிப்பிடப்படவில்லை, இது செயல்முறைக்கு எதிர்பார்ப்பின் ஒரு கூறுகளைச் சேர்க்கிறது.

Apple பார்வை: காட்சி நுண்ணறிவு மற்றும் ஒரு தடுமாற்றமான காலவரிசை

Google, Gemini-யின் காட்சி மேம்பாடுகளை நிலைநிறுத்தும் பின்னணி, தவிர்க்க முடியாமல், நிறுவனத்தின் உலகளாவிய டெவலப்பர்கள் மாநாட்டில் (WWDC) Apple Intelligence-இன் சமீபத்திய வெளியீடு ஆகும். Apple-இன் விரிவான AI அம்சங்களின் தொகுப்பு iOS, iPadOS மற்றும் macOS முழுவதும் ஆழமான ஒருங்கிணைப்பை உறுதியளிக்கிறது, தனியுரிமை மற்றும் வேகத்திற்காக சாதனத்தில் செயலாக்கத்தை வலியுறுத்துகிறது, மேலும் சிக்கலான பணிகளுக்கு ‘Private Cloud Compute’ வழியாக தடையற்ற கிளவுட் ஆஃப்லோடிங் உடன். இந்த தொகுப்பின் ஒரு முக்கிய கூறு ‘Visual Intelligence’ ஆகும், இது புகைப்படங்கள் மற்றும் வீடியோக்களுக்குள் உள்ள உள்ளடக்கத்தைப் புரிந்துகொண்டு செயல்பட வடிவமைக்கப்பட்டுள்ளது.

இருப்பினும், Apple-இன் அணுகுமுறை Google-இன் தற்போதைய Gemini செயல்படுத்தலில் இருந்து வேறுபட்டதாகத் தோன்றுகிறது, திறன் மற்றும் வெளியீட்டு மூலோபாயம் இரண்டிலும். Visual Intelligence பயனர்களை படங்கள் மற்றும் வீடியோக்களுக்குள் உள்ள பொருள்கள் மற்றும் உரையை அடையாளம் காணவும், அந்தத் தகவலின் அடிப்படையில் செயல்களைச் செய்யவும் (புகைப்படத்தில் கைப்பற்றப்பட்ட தொலைபேசி எண்ணை அழைப்பது போன்றவை) அனுமதிக்கும் என்றாலும், ஆரம்ப விளக்கங்கள் நேரடி கேமரா ஊட்டங்கள் அல்லது திரை உள்ளடக்கத்தை அடிப்படையாகக் கொண்ட நிகழ்நேர, உரையாடல் தொடர்புகளில் குறைவாக கவனம் செலுத்தும் ஒரு அமைப்பைப் பரிந்துரைக்கின்றன, இது Gemini இப்போது வழங்குவதைப் போன்றது. Apple-இன் கவனம், பயனரின் இருக்கும் புகைப்பட நூலகம் மற்றும் சாதனத்தில் உள்ள உள்ளடக்கத்தைப் பயன்படுத்துவதில் அதிக கவனம் செலுத்துவதாகத் தெரிகிறது, அதே ஊடாடும் முறையில் வெளிப்புற உலகத்திற்கோ அல்லது தற்போதைய திரைச் சூழலுக்கோ நேரடி காட்சி உதவியாளராகச் செயல்படுவதை விட.

மேலும், அறிவிக்கப்பட்ட அனைத்து Apple Intelligence அம்சங்களும் இந்த இலையுதிர்காலத்தில் ஆரம்ப வெளியீட்டில் கிடைக்காது என்று Apple ஒப்புக்கொண்டது. மிகவும் லட்சியமான சில திறன்கள் பின்னர் வெளியிட திட்டமிடப்பட்டுள்ளன, இது 2025 வரை நீட்டிக்கப்படலாம். எந்த காட்சி கூறுகள் தாமதமாகலாம் என்பது பற்றிய குறிப்பிட்ட விவரங்கள் முழுமையாகத் தெளிவாக இல்லை என்றாலும், இந்த தடுமாற்றமான வெளியீடு Google தனது மேம்பட்ட காட்சி அம்சங்களை இப்போது வெளியிடுவதோடு முரண்படுகிறது, இருப்பினும் ஒரு தேர்ந்தெடுக்கப்பட்ட குழுவிற்கு. நேரத்தின் இந்த வேறுபாடு இரண்டு தொழில்நுட்ப ஜாம்பவான்களின் ஒப்பீட்டு தயார்நிலை மற்றும் மூலோபாய முன்னுரிமைகள் பற்றிய ஊகங்களைத் தூண்டியுள்ளது. Apple-இன் Siri மற்றும் AI பிரிவுகளுக்குள் நிர்வாக மாற்றங்கள் பற்றிய அறிக்கைகள், நிறுவனம் தனது AI பார்வையை நிலைநிறுத்துவதில் உள்ள சிக்கல்களை வழிநடத்தும் போது சாத்தியமான உள் சரிசெய்தல்களின் கதையை மேலும் சேர்க்கின்றன.

Apple-இன் பாரம்பரியமாக எச்சரிக்கையான அணுகுமுறை, பயனர் தனியுரிமை மற்றும் இறுக்கமான சுற்றுச்சூழல் ஒருங்கிணைப்பை பெரிதும் வலியுறுத்துகிறது, இது பெரும்பாலும் வேகமான மறு செய்கை மற்றும் கிளவுட் அடிப்படையிலான தீர்வுகளுக்கு முன்னுரிமை அளிக்கும் போட்டியாளர்களுடன் ஒப்பிடும்போது நீண்ட வளர்ச்சி சுழற்சிகளாக மொழிபெயர்க்கப்படுகிறது. பல Apple Intelligence அம்சங்களுக்கு சக்திவாய்ந்த சாதனத்தில் செயலாக்கத்தை நம்பியிருப்பது குறிப்பிடத்தக்க பொறியியல் சவால்களை முன்வைக்கிறது, இது மிகவும் உகந்த மாதிரிகள் மற்றும் திறமையான வன்பொருள் (ஆரம்பத்தில் A17 Pro சிப் மற்றும் M-சீரிஸ் சிப்களைக் கொண்ட சாதனங்களுக்கு மட்டுப்படுத்தப்பட்டது) தேவைப்படுகிறது. இந்த மூலோபாயம் கட்டாய தனியுரிமை நன்மைகளை வழங்கினாலும், இது Gemini Advanced உடன் Google-இன் அதிக கிளவுட்-மைய அணுகுமுறையுடன் ஒப்பிடும்போது மிகவும் அதிநவீன, கணக்கீட்டு ரீதியாக தேவைப்படும் AI அம்சங்களின் மெதுவான அறிமுகத்திற்கு இயல்பாகவே வழிவகுக்கும். போட்டி என்பது திறனைப் பற்றியது மட்டுமல்ல, வரிசைப்படுத்தலுக்குத் தேர்ந்தெடுக்கப்பட்ட பாதை மற்றும் தரவு செயலாக்கம் மற்றும் பயனர் தனியுரிமை தொடர்பான அடிப்படை தத்துவ வேறுபாடுகள் பற்றியதுமாகும்.

ஆய்வக செயல்விளக்கங்களிலிருந்து பாக்கெட் யதார்த்தம் வரை: காட்சி AI-யின் பயணம்

Gemini போன்ற பிரதான AI உதவியாளர்களில் காட்சிப் புரிதலை அறிமுகப்படுத்துவது ஒரே இரவில் நிகழ்ந்த நிகழ்வு அல்ல. இது கணினி பார்வை மற்றும் பன்முக AI ஆகியவற்றில் பல வருட ஆராய்ச்சி மற்றும் வளர்ச்சியின் உச்சக்கட்டத்தைக் குறிக்கிறது. Google-க்கு, இந்த திறன்களின் விதைகள் முந்தைய திட்டங்கள் மற்றும் தொழில்நுட்ப செயல்விளக்கங்களில் காணப்பட்டன. குறிப்பாக, முந்தைய Google I/O டெவலப்பர் மாநாட்டின் போது காட்சிப்படுத்தப்பட்ட ‘Project Astra’, ஊடாடும் AI-யின் எதிர்காலத்தைப் பற்றிய ஒரு கட்டாயமான பார்வையை வழங்கியது.

Project Astra, ஒரு கேமரா மூலம் அதன் சுற்றுப்புறங்களைப் புரிந்துகொள்ளவும், பொருட்களின் இருப்பிடத்தை நினைவில் கொள்ளவும், நிகழ்நேரத்தில் காட்சிச் சூழலைப் பற்றி பேசும் உரையாடலில் ஈடுபடவும் திறன் கொண்ட ஒரு AI உதவியாளரை நிரூபித்தது. இது ஒரு முன்னோக்குக் கருத்தாக முன்வைக்கப்பட்டாலும், முக்கிய தொழில்நுட்பங்கள் - நேரடி வீடியோ ஊட்டங்களைப் புரிந்துகொள்வது, பொருட்களைச் சூழல் ரீதியாக அடையாளம் காண்பது, மற்றும் அந்த காட்சித் தரவை ஒரு உரையாடல் AI கட்டமைப்பில் ஒருங்கிணைப்பது - ஆகியவைதான் Gemini-க்கு வெளிவரும் புதிய அம்சங்களுக்கு அடிப்படையாக அமைகின்றன. Astra-வைக் கண்ட ஆசிரியரின் நினைவு, டெமோ அந்த நேரத்தில் உடனடியாக புரட்சிகரமாகத் தோன்றவில்லை என்றாலும், அந்த சிக்கலான தொழில்நுட்பத்தை ஒப்பீட்டளவில் குறுகிய காலத்திற்குள் பயனர் எதிர்கொள்ளும் அம்சமாக மொழிபெயர்க்கும் Google-இன் திறன் குறிப்பிடத்தக்கது என்பதை எடுத்துக்காட்டுகிறது.

ஒரு கட்டுப்படுத்தப்பட்ட தொழில்நுட்ப டெமோவிலிருந்து நுகர்வோர் ஸ்மார்ட்போன்களில் (படிப்படியாக இருந்தாலும்) பயன்படுத்தப்படும் ஒரு அம்சத்திற்கான இந்த பயணம் பன்முக AI மாதிரிகளின் விரைவான முதிர்ச்சியை அடிக்கோடிட்டுக் காட்டுகிறது. காட்சி உள்ளீட்டை மொழிப் புரிதலுடன் தடையின்றி கலக்கக்கூடிய AI-ஐ உருவாக்குவது குறிப்பிடத்தக்க தொழில்நுட்ப தடைகளைத் தாண்டுவதைத் தேவைப்படுகிறது. AI துல்லியமாக பொருட்களை அடையாளம் காண்பது மட்டுமல்லாமல், அவற்றின் உறவுகள், சூழல் மற்றும் பயனரின் வினவல் அல்லது நடந்துகொண்டிருக்கும் உரையாடலுக்கான பொருத்தத்தையும் புரிந்து கொள்ள வேண்டும். இந்தத் தகவலை நிகழ்நேரத்தில், குறிப்பாக நேரடி வீடியோ ஸ்ட்ரீமிலிருந்து செயலாக்குவது, கணிசமான கணக்கீட்டு சக்தி மற்றும் மிகவும் உகந்த வழிமுறைகளைக் கோருகிறது.

Google Search, Google Photos (அதன் பொருள் அங்கீகாரத்துடன்), மற்றும் Google Lens போன்ற தயாரிப்புகளில் வெளிப்படையான AI ஆராய்ச்சியில் Google-இன் நீண்டகால முதலீடு ஒரு வலுவான அடித்தளத்தை வழங்கியது. Gemini இந்த வேறுபட்ட திறன்களின் ஒருங்கிணைப்பு மற்றும் பரிணாமத்தை மிகவும் ஒருங்கிணைந்த மற்றும் சக்திவாய்ந்த உரையாடல் AI-ஆகக் குறிக்கிறது. ‘பார்க்கும்’ திறனை Lens போன்ற ஒரு தனி பயன்பாட்டில் வைத்திருப்பதற்குப் பதிலாக, நேரடியாக பிரதான Gemini இடைமுகத்திற்குள் கொண்டு வருவது, காட்சிப் புரிதலை அதன் AI உதவியாளரின் அடையாளத்தின் முக்கிய பகுதியாக மாற்றும் Google-இன் நோக்கத்தைக் குறிக்கிறது. பயனர்கள் தங்கள் AI தோழர்கள் மனிதர்களைப் போலவே - பல புலன்கள் மூலம் - உலகைப் புரிந்துகொண்டு தொடர்பு கொள்ள cada vez más எதிர்பார்ப்பார்கள் என்ற மூலோபாய பந்தயத்தை இது பிரதிபலிக்கிறது. Project Astra-வின் கருத்தியல் வாக்குறுதியிலிருந்து Gemini-யின் உறுதியான அம்சங்களுக்கான மாற்றம் இந்த பரிணாம வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க மைல்கல்லைக் குறிக்கிறது.

முக்கியமான சோதனை: நிஜ உலகப் பயன்பாடு மற்றும் பிரீமியம் AI முன்மொழிவு

இறுதியில், Gemini-யின் புதிய காட்சித் திறன்களின் வெற்றி - உண்மையில், எந்தவொரு மேம்பட்ட AI அம்சமும் - ஒரு எளிய ஆனால் முக்கியமான காரணியைப் பொறுத்தது: நிஜ உலகப் பயன்பாடு. பயனர்கள் இந்த அம்சங்களை உண்மையாக உதவியாக, ஈடுபாட்டுடன் அல்லது பொழுதுபோக்காகக் கண்டறிந்து அவற்றை தங்கள் அன்றாட நடைமுறைகளில் ஒருங்கிணைப்பார்களா? ‘பார்க்க’க்கூடிய AI-யின் புதுமை ஆரம்பத்தில் கவனத்தை ஈர்க்கக்கூடும், ஆனால் நீடித்த பயன்பாடு அது உண்மையான சிக்கல்களைத் தீர்க்கிறதா அல்லது இருக்கும் முறைகளை விட திறம்பட உறுதியான நன்மைகளை வழங்குகிறதா என்பதைப் பொறுத்தது.

இந்த அம்சங்களை அதன் பிரீமியம் சந்தா அடுக்குகளுக்குள் (Gemini Advanced / Google One AI Premium) தொகுக்கும் Google-இன் முடிவு தத்தெடுப்பு சவாலுக்கு மற்றொரு அடுக்கைச் சேர்க்கிறது. பயனர்கள் இந்த மேம்பட்ட காட்சி மற்றும் பிற பிரீமியம் AI அம்சங்களில் தொடர்ச்சியான செலவை நியாயப்படுத்த போதுமான மதிப்பைப் உணர வேண்டும். இது இறுதியில் தரநிலையாக மாறக்கூடிய அல்லது அடிப்படை இயக்க முறைமை அனுபவத்தின் ஒரு பகுதியாக வழங்கப்படும் அம்சங்களுடன் முரண்படுகிறது, இது பெரும்பாலும் Apple-இன் மாதிரியாகும். சந்தா தடை என்பது Gemini-யின் காட்சித் திறமை இலவச மாற்றுகளை விட வெளிப்படையாக சிறப்பாக செயல்பட வேண்டும் அல்லது வேறு எங்கும் கிடைக்காத தனித்துவமான செயல்பாடுகளை வழங்க வேண்டும் என்பதாகும். Gemini-யின் டைல்-ஷாப்பிங் ஆலோசனை உண்மையிலேயே ஒரு அறிவுள்ள கடை ஊழியர் அல்லது விரைவான படத் தேடலை விட உதவியாக இருக்க முடியுமா? திரை பகிர்வு வழியாக சரிசெய்தல் தற்போதுள்ள தொலைநிலை உதவி கருவிகள் அல்லது சிக்கலை விவரிப்பதை விட கணிசமாக சிறந்ததாக இருக்குமா?

இந்த பயன்பாட்டை நிரூபிப்பது மிக முக்கியமானது. பயனர்கள் காட்சி தொடர்புகளை விகாரமாக, துல்லியமற்றதாக அல்லது விலைக்கு போதுமானதாக இல்லை என்று கண்டால், தத்தெடுப்பு தொழில்நுட்ப ஆர்வலர்கள் மற்றும் ஆரம்பகால தத்தெடுப்பவர்களுக்கு மட்டுப்படுத்தப்பட்டதாக இருக்கும். இருப்பினும், Gemini-யின் காட்சிப் புரிதல் நேரத்தைச் சேமிக்கும், சிக்கலான பணிகளை எளிதாக்கும் அல்லது தனித்துவமான நுண்ணறிவு உதவியை வழங்கும் தெளிவான பயன்பாட்டு நிகழ்வுகளை Google வெற்றிகரமாக நிரூபித்தால், அது ஒரு குறிப்பிடத்தக்க நன்மையைப் பெறக்கூடும். இது Google-இன் AI மூலோபாயத்தை சரிபார்ப்பது மட்டுமல்லாமல், Apple போன்ற போட்டியாளர்கள் தங்கள் சொந்த காட்சி AI சலுகைகளின் வரிசைப்படுத்தலை விரைவுபடுத்தவும் திறன்களை மேம்படுத்தவும் அழுத்தம் கொடுக்கும்.

போட்டி தாக்கங்கள் கணிசமானவை. காட்சி உள்ளீட்டை உரையாடலுடன் தடையின்றி கலக்கக்கூடிய ஒரு AI உதவியாளர் அடிப்படையில் ஒரு பணக்கார தொடர்பு முன்னுதாரணத்தை வழங்குகிறது. Google செயல்படுத்துவதில் வெற்றி பெற்று பயனர்கள் அதை ஏற்றுக்கொண்டால், அது மொபைல் AI உதவியாளர்களுக்கான எதிர்பார்ப்புகளை மறுவரையறை செய்யலாம், முழுத் தொழிலையும் முன்னோக்கித் தள்ளும். இது Android தளத்திற்கு, குறிப்பாக Google-இன் சுற்றுச்சூழல் அமைப்பில் முதலீடு செய்த பயனர்களுக்கு ஒரு சக்திவாய்ந்த வேறுபாட்டாளராகவும் செயல்படலாம். மாறாக, ஒரு மந்தமான வரவேற்பு, அத்தகைய மேம்பட்ட AI அம்சங்கள் முக்கிய பயன்பாடுகளுக்கு அப்பால் ஒரு கொலையாளி பயன்பாட்டைத் தேடுகின்றன என்ற கருத்தை வலுப்படுத்தக்கூடும், இது Apple போன்ற மெதுவான, அதிக ஒருங்கிணைந்த அணுகுமுறைகளை சரிபார்க்கக்கூடும். இந்த அம்சங்கள் அதிக பயனர்களைச் சென்றடையும் வரும் மாதங்கள், Gemini-யின் புதிதாகக் கிடைத்த பார்வை உண்மையான சந்தை நுண்ணறிவு மற்றும் பயனர் விசுவாசமாக மொழிபெயர்க்கப்படுகிறதா என்பதைத் தீர்மானிப்பதில் முக்கியமானதாக இருக்கும்.

முன்னோக்கிய பாதை: மொபைல் AI அரங்கில் தொடர்ச்சியான பரிணாமம்

Gemini-யின் காட்சி அம்சங்களின் வெளியீடு மொபைல் செயற்கை நுண்ணறிவின் தொடர்ச்சியான பரிணாம வளர்ச்சியில் மற்றொரு குறிப்பிடத்தக்க படியைக் குறிக்கிறது, ஆனால் இது இறுதி இலக்கிலிருந்து வெகு தொலைவில் உள்ளது. Google, Apple மற்றும் பிற முக்கிய வீரர்களுக்கு இடையிலான போட்டி புதுமையின் வேகம் விறுவிறுப்பாக இருக்கும் என்பதை உறுதி செய்கிறது, திறன்கள் எதிர்காலத்தில் வேகமாக விரிவடையும். Google-க்கு, உடனடி பணி, நிஜ உலக பயன்பாட்டு முறைகளின் அடிப்படையில் தற்போதைய கேமரா மற்றும் திரை பகிர்வு அம்சங்களின் செயல்திறன் மற்றும் நம்பகத்தன்மையை செம்மைப்படுத்துவதை உள்ளடக்கியது. மொழி ஆதரவை விரிவுபடுத்துதல், சூழல் புரிதலை மேம்படுத்துதல் மற்றும் சாதனப் பொருத்தப்பாட்டை விரிவுபடுத்துதல் ஆகியவை முக்கிய அடுத்த படிகளாக இருக்கும். Gemini காட்சித் தகவலை Maps, Photos அல்லது Shopping முடிவுகளுடன் இன்னும் அதிநவீன வழிகளில் பயன்படுத்த அனுமதிக்கும் வகையில் பிற Google சேவைகளுடன் ஆழமான ஒருங்கிணைப்பையும் நாம் காணலாம்.

இதற்கிடையில், Apple, Visual Intelligence உட்பட அறிவிக்கப்பட்ட Apple Intelligence அம்சங்களை அதன் சொந்த காலவரிசைப்படி வழங்குவதில் கவனம் செலுத்தும். தொடங்கப்பட்டதும், Apple அதன் சாதனத்தில் செயலாக்கத்தின் தனியுரிமை நன்மைகள் மற்றும் அதன் சுற்றுச்சூழல் அமைப்பிற்குள் தடையற்ற ஒருங்கிணைப்பை வலியுறுத்தும் என்று எதிர்பார்க்கலாம். எதிர்கால மறு செய்கைகள் Visual Intelligence-இன் திறன்களை விரிவுபடுத்துவதைக் காணும், இது Google நிரூபித்த அதிக ஊடாடும், நிகழ்நேர திறன்களுடன் உள்ள இடைவெளியைக் குறைக்கக்கூடும், ஆனால் தனியுரிமை மற்றும் ஒருங்கிணைப்பின் அதன் முக்கிய கொள்கைகளுக்கு இணங்க வாய்ப்புள்ளது. சாதனத்தில் மற்றும் கிளவுட் செயலாக்கத்திற்கு இடையிலான இடைவினை Apple-இன் மூலோபாயத்தின் வரையறுக்கும் பண்பாகத் தொடரும்.

இந்த இரண்டு ஜாம்பவான்களுக்கு அப்பால், பரந்த தொழில் எதிர்வினையாற்றி மாற்றியமைக்கும். பிற ஸ்மார்ட்போன் உற்பத்தியாளர்கள் மற்றும் AI டெவலப்பர்கள் பன்முக AI-யில் தங்கள் முயற்சிகளை விரைவுபடுத்துவார்கள், போட்டி அம்சங்களை வழங்க முற்படுவார்கள். மொழிபெயர்ப்பு, அணுகல் அல்லது படைப்பு உதவி போன்ற குறிப்பிட்ட காட்சிப் பணிகளில் சிறந்து விளங்கும் சில AI உதவியாளர்களுடன், அதிகரித்த நிபுணத்துவத்தை நாம் காணலாம். அடிப்படை AI மாதிரிகளின் வளர்ச்சி தொடரும், இது மேம்பட்ட துல்லியம், வேகமான மறுமொழி நேரங்கள் மற்றும் காட்சி நுணுக்கங்களைப் பற்றிய ஆழமான புரிதலுக்கு வழிவகுக்கும்.

இறுதியில், மொபைல் AI-யின் பாதை பயனர் தேவைகள் மற்றும் தத்தெடுப்பால் வடிவமைக்கப்படும். பயனர்கள் காட்சி உலகைப் புரிந்துகொள்ளக்கூடிய AI உடன் தொடர்புகொள்வதற்குப் பழகும்போது, எதிர்பார்ப்புகள் உயரும். டெவலப்பர்களுக்கான சவால், புதுமை அம்சங்களுக்கு அப்பால் சென்று, தொழில்நுட்ப ரீதியாக ஈர்க்கக்கூடியது மட்டுமல்லாமல், உற்பத்தித்திறன், படைப்பாற்றல் மற்றும் அன்றாட வாழ்க்கையை உண்மையாக மேம்படுத்தும் AI கருவிகளை வழங்குவதாகும். மிகவும் உதவிகரமான, உள்ளுணர்வு மற்றும் நம்பகமான AI உதவியாளரை உருவாக்கும் போட்டி நன்றாக நடந்து கொண்டிருக்கிறது, மேலும் பார்வையின் ஒருங்கிணைப்பு இந்த தொடர்ச்சியான தொழில்நுட்ப மாற்றத்தில் ஒரு முக்கியமான போர்க்களமாக நிரூபிக்கப்பட்டுள்ளது. AI பார்க்கும் சக்தியைப் பெறும்போது, பயனர்கள் அர்த்தமுள்ள நன்மைகளைப் பெறுவதை உறுதிசெய்து, உறுதியான மதிப்பை வழங்குவதில் கவனம் இருக்க வேண்டும்.