Gemini Live-இன் கேமரா முறை செயற்கை நுண்ணறிவின் (Artificial Intelligence) வளர்ச்சியில் ஒரு முக்கியமான முன்னேற்றமாக அமைந்துள்ளது. Pixel 9 மற்றும் Samsung Galaxy S25 சாதனங்களை வைத்திருக்கும் ஆரம்ப பயனர்கள் இந்த புதுமையான அம்சத்தை சிறிது காலமாக அனுபவித்து வருகின்றனர். Google நிறுவனம் தனது I/O மாநாட்டில் வெளியிட்ட சமீபத்திய அறிவிப்பு, Android மற்றும் iOS பயனர்கள் உட்பட அதிகமான பார்வையாளர்களுக்கு இதை விரிவுபடுத்தியுள்ளது. iPhone வைத்திருப்பவர்களுக்கு இது மிகவும் உற்சாகமான விஷயம். ஏனெனில், இப்போது அவர்கள் தற்போது கிடைக்கும் மிகச் சிறந்த AI செயல்பாடுகளில் ஒன்றை அனுபவிக்க முடியும். குறிப்பாக, கேமரா முறை முதலில் Android பயனர்களுக்கு ஏப்ரல் மாதத்திலேயே அறிமுகப்படுத்தப்பட்டது என்பதை கவனத்தில் கொள்ள வேண்டும்.
பார்வையிடும் திறனை வெளிப்படுத்துதல்: Gemini-ன் கேமரா முறை எப்படி வேலை செய்கிறது
Gemini Live-இன் கேமரா முறையின் முக்கிய அம்சம் என்னவென்றால், AI-க்கு "பார்க்கும்" திறனை வழங்குவதாகும். இது கேமரா பார்க்கும் எல்லையில் உள்ள பொருட்களை அடையாளம் காணவும் வகைப்படுத்தவும் உதவுகிறது. இது வெறும் மேலோட்டமான தந்திரம் அல்ல; இது ஒரு சக்திவாய்ந்த கருவியாகும். இதன் மூலம் பயனர்கள் தங்கள் சுற்றுப்புறத்துடன் மிகவும் உள்ளுணர்வுடனும் தகவலறிந்த வகையிலும் தொடர்பு கொள்ள முடியும்.
எளிமையான பொருள் அங்கீகாரத்திற்கு அப்பாற்பட்டு, Gemini அடையாளம் காணப்பட்ட பொருட்களைப் பற்றிய கேள்விகளுக்குப் பதிலளிக்கும் திறனைக் கொண்டுள்ளது, மேலும் தேவைக்கேற்ப சூழல் மற்றும் நுண்ணறிவுகளை வழங்குகிறது. கூடுதலாக, பயனர்கள் தங்கள் திரையை Gemini உடன் பகிர்ந்து கொள்ள முடியும். இதன் மூலம் AI அவர்களின் தொலைபேசி திரையில் காட்டப்படும் கூறுகளையும் பகுப்பாய்வு செய்து அடையாளம் காண முடியும். கேமரா முறையுடன் நேரடி அமர்வைத் தொடங்க, பயனர்கள் லைவ் கேமரா காட்சியை இயக்க வேண்டும். இது கேமரா கைப்பற்றும் எதைப் பற்றியும் சாட்போட்டுடன் உரையாட அனுமதிக்கிறது.
முதல் அபிப்ராயம்: Gemini Live உடன் ஒரு டெஸ்ட் டிரைவ்
Pixel 9 Pro XL இல் Gemini Live-ஐ வைத்து நான் மேற்கொண்ட ஆரம்ப கட்ட சோதனையில், அதன் திறன்களால் நான் உண்மையிலேயே ஈர்க்கப்பட்டேன். குறிப்பாக, நான் தொலைத்துவிட்ட கத்தரிக்கோலை கண்டுபிடிக்க Gemini-யிடம் கேட்ட ஒரு மறக்கமுடியாத அனுபவம் எனக்கு ஏற்பட்டது.
அதற்கு AI துல்லியமாக பதிலளித்தது: "உங்கள் கத்தரிக்கோல் மேஜையில், பச்சை நிற பிஸ்தா பாக்கெட்டுக்கு அருகில் உள்ளது. உங்களுக்கு தெரிகிறதா?"
நான் ஆச்சரியப்படும் விதமாக, Gemini குறிப்பிட்டது முற்றிலும் சரியானது. கத்தரிக்கோல் அது சுட்டிக்காட்டிய இடத்தில் சரியாக இருந்தது. நான் 15 நிமிட நேரடி அமர்வின்போது கேமராவை அதன் முன் சிறிது நேரம் மட்டுமே காட்டினேன், மேலும் நான் AI சாட்போட்டுக்கு என் வீட்டைச் சுற்றி ஒரு சுற்றுலா வழிகாட்டியாக இருந்தேன் என்பது குறிப்பிடத்தக்கது.
இந்த ஆரம்ப வெற்றியால் நான் மிகவும் ஆர்வமடைந்தேன், மேலும் கேமரா முறையை ஆராய ஆவலாக இருந்தேன். மற்றொரு சோதனை முயற்சியில், நான் அந்த அம்சத்தை இயக்கி என் வீட்டைச் சுற்றி நடக்க ஆரம்பித்தேன். அப்போது Gemini பார்த்த பொருட்களை அடையாளம் காட்டும்படி கூறினேன். அது பழங்கள், சாப்ஸ்டிக் மற்றும் பிற அன்றாட பொருட்கள் உட்பட பல்வேறு பொருட்களைத் துல்லியமாக அடையாளம் காட்டியது. இருப்பினும், கத்தரிக்கோலை மீண்டும் கண்டுபிடித்தது அதன் திறன்களின் மிக முக்கியமான நிரூபணமாக இருந்தது.
Gemini எந்தவித முன்னறிவிப்பும் இல்லாமல் கத்தரிக்கோலை அடையாளம் காட்டியது மிகவும் வியப்பாக இருந்தது. அந்த அமர்வின்போது AI ஒரு கட்டத்தில் அவற்றைத் தானாகவே கண்டுபிடித்து, அவற்றின் இருப்பிடத்தை மிகத் துல்லியமாக நினைவு கூர்ந்தது. இந்த அனுபவம் எதிர்காலத்தை நோக்கிய ஒரு பார்வையாக இருந்தது, அதன் திறனைப் பற்றி மேலும் விசாரிக்கத் தூண்டியது.
உத்வேகம் பெறுதல்: நேரடி வீடியோ AI-க்கான Google-இன் பார்வை
Gemini Live-இன் கேமரா அம்சம் உடனான எனது சோதனை, முந்தைய கோடையில் Google காட்சிப்படுத்திய டெமோவைப் பிரதிபலித்தது. அந்த டெமோ நேரடி வீடியோ AI திறன்களைப் பற்றிய முதல் பார்வையை வழங்கியது. அதில் Gemini பயனர் தனது கண்ணாடியை எங்கே வைத்திருந்தார் என்பதை நினைவூட்டியது, இது நம்பமுடியாத ஒரு சாதனையாகத் தோன்றியது. ஆனால் நான் கண்டுபிடித்தது போல, அந்த அளவிலான துல்லியம் உண்மையில் சாத்தியமானது.
Gemini Live சாதாரண வீட்டுப் பொருட்களை மட்டும் அடையாளம் காணும் திறன் கொண்டது மட்டுமல்ல. நெரிசலான ரயில் நிலையங்களில் பயனர்களுக்கு வழிகாட்டவும் அல்லது பேஸ்ட்ரிகளில் உள்ள fillings (உள்ளீடுகளை) அடையாளம் காணவும் இது உதவும் என்று Google கூறுகிறது. இது ஓவியங்களைப் பற்றிய ஆழமான நுண்ணறிவுகளை வழங்க முடியும். உதாரணமாக, அதன் தோற்றம் மற்றும் அது வரையறுக்கப்பட்ட பதிப்பா என்பதைப் பற்றிய தகவல்களைக் கூற முடியும்.
இந்த செயல்பாடு சாதாரண Google Lens-ன் செயல்பாட்டை விட மேம்பட்டது. ஏனெனில், நீங்கள் AI உடன் உரையாடலாம், இது Google Assistant-ஐ விட மிகவும் இயல்பாக உள்ளது.
Google இந்த அம்சத்தை விளக்கும் ஒரு YouTube வீடியோவையும் வெளியிட்டுள்ளது, மேலும் இது Google Store இல் அதன் சொந்த பக்கத்தையும் கொண்டுள்ளது.
தொடங்குவதற்கு, Gemini-ஐத் திறந்து, கேமராவை ஆன் செய்து, பேச ஆரம்பியுங்கள்.
Gemini Live, Google-இன் Project Astra-வின் மேல் கட்டப்பட்டுள்ளது, இது கடந்த ஆண்டு முதலில் அறிமுகப்படுத்தப்பட்டது. இது ஒருவேளை நிறுவனத்தின் மிகப்பெரிய "நாங்கள் எதிர்காலத்தில் இருக்கிறோம்" அம்சமாக இருக்கலாம். இது ChatGPT, Claude அல்லது Gemini போன்ற சாட்போட்டில் பிராம்ப்ட்களை (command) தட்டச்சு செய்வது அல்லது பேசுவதைத் தாண்டி, ஜெனரேட்டிவ் AI திறன்களுக்கான ஒரு சோதனை முயற்சியாகும்.
AI நிறுவனங்கள் வீடியோ உருவாக்கம் முதல் அடிப்படை செயலாக்க சக்தி வரை AI கருவிகளின் திறன்களைத் தொடர்ந்து மேம்படுத்தி வருகின்றன. iPhone தயாரிப்பாளரான Apple கடந்த ஆண்டு பீட்டாவில் வெளியிட்ட Visual Intelligence, Gemini Live-க்கு ஒப்பானதாகும்.
Gemini Live நமது டிஜிட்டல் மற்றும் பிசிக்ஸ் சுற்றுப்புறங்களை ஒன்றிணைத்து, கேமராவை எதன் முன்னால் வேண்டுமானாலும் பிடித்துக் கொண்டு, சுற்றுச்சூழலுடன் நாம் தொடர்பு கொள்ளும் விதத்தில் புரட்சியை ஏற்படுத்தும் திறனைக் கொண்டுள்ளது.
Gemini Live ஐ சோதனைக்கு உட்படுத்துதல்: நிஜ உலக சூழ்நிலைகள்
நான் முதன்முறையாகப் பயன்படுத்தியபோது, Gemini என் கேமராவின் காட்சியிலுள்ள ஒரு குறிப்பிட்ட கேமிங் சேகரிப்பான ஒரு பொம்மை முயலைத் துல்லியமாக அடையாளம் கண்டது. இரண்டாவது முறை, நான் அதை ஒரு கலைக்கூடத்தில் என் நண்பருக்குக் காட்டினேன். அது உடனடியாக ஒரு சிலுவையில் இருக்கும் ஆமையைக் கண்டறிந்தது (என்னைக் கேட்க வேண்டாம்) மற்றும் அதன் அருகில் இருந்த காஞ்சி எழுத்துக்களை அடையாளம் கண்டு மொழிபெயர்த்தது, அது இருவருக்கும் மெய்சிலிர்க்க வைத்தது, மேலும் சற்று பயமுறுத்தியது. ஆனால் இது ஒரு நல்ல வழியில் நடந்ததாக நான் நம்புகிறேன்.
இந்த செயல்பாட்டை எப்படி stress-test செய்வது என்று யோசிக்க ஆரம்பித்தேன். அதை action-இல் ஸ்கிரீன் ரெக்கார்ட் (screen record) செய்ய முயற்சித்தபோது, அது தொடர்ந்து தோல்வியடைந்தது. நான் வழக்கமான பாதையிலிருந்து விலகிச் சென்றால் என்ன செய்வது? நான் திகில் வகை (திரைப்படங்கள், தொலைக்காட்சி தொடர்கள் மற்றும் வீடியோ விளையாட்டுகள்) ரசிகன், நிறைய சேகரிப்புகள், சிறிய பொருட்கள் மற்றும் பிற பொருட்களை வைத்திருக்கிறேன். எனது திகில் கருப்பொருள் சேகரிப்புகளைப் போன்ற அதிக தெளிவற்ற பொருட்களுடன் இது எவ்வளவு சிறப்பாகச் செயல்படும்?
முதலில், Gemini நம்பமுடியாத அளவிற்கு ஆச்சரியமாகவும் அதே நேரத்தில் மிகவும் எரிச்சலூட்டும் வகையிலும் இருக்கிறது என்பதை நான் சொல்ல வேண்டும். Gemini அடையாளம் காண விரும்பும் சுமார் 11 பொருட்கள் என்னிடம் இருந்தன, மேலும் லைவ் அமர்வு எவ்வளவு அதிகமான நேரம் நீடித்ததோ, அவ்வளவு மோசமாக அது வளர்ந்தது, எனவே அமர்வுகளை ஒன்று அல்லது இரண்டு பொருட்களுக்கு மட்டுப்படுத்த வேண்டியிருந்தது. எனது கருத்தில், Gemini முன்பு அடையாளம் காணப்பட்ட பொருட்களின் சூழல் தகவலைப் பயன்படுத்தி புதிய பொருட்களை யூகிக்க முயன்றது, இது ஓரளவு புரிந்துகொள்ளக்கூடியது, ஆனால் இறுதியில் எனக்கோ அல்லது அதற்கோ பயனளிக்கவில்லை.
சில நேரங்களில், Gemini மிகவும் துல்லியமாக இருந்தது, சரியான பதில்களை எளிதாகவும் குழப்பமில்லாமலும் வழங்கியது, இருப்பினும் இது சமீபத்திய அல்லது பிரபலமான பொருட்களுடன் அடிக்கடி நிகழ்ந்தது. உதாரணமாக, என் சோதனை பொருட்களில் ஒன்று Destiny 2-லிருந்து மட்டுமல்லாமல், முந்தைய ஆண்டின் ஒரு குறிப்பிட்ட பருவகால நிகழ்விலிருந்து வந்த வரையறுக்கப்பட்ட பதிப்பு என்றும் அது உடனடியாகக் கண்டுபிடித்தபோது நான் ஆச்சரியப்பட்டேன்.
Gemini அடிக்கடி குறி தவறாமல், சரியான பதிலுக்கு அருகில் வர எனக்கு மேலும் குறிப்புகளை வழங்க வேண்டியிருந்தது. சில நேரங்களில், Gemini எனது முந்தைய லைவ் அமர்வுகளிலிருந்து பெறப்பட்ட சூழலைப் பயன்படுத்தி பதில்களை உருவாக்குவது போல் தோன்றியது, பல பொருட்களை சைலன்ட் ஹில்லிலிருந்து வந்ததாக அடையாளம் காட்டியது, அவை உண்மையல்ல. விளையாட்டுத் தொடருக்காக நான் ஒரு காட்சிப் பெட்டியையே வைத்திருக்கிறேன், எனவே அது ஏன் அந்தப் பகுதிக்கு விரைவாக நுழைய விரும்புகிறது என்பதை நான் புரிந்துகொள்கிறேன்.
குறைபாடுகளை வெளிப்படுத்துதல்: கணினியில் பிழைகள் மற்றும் வினோதங்கள்
Gemini சில நேரங்களில் முற்றிலும் பிழையாக இருக்கலாம். சில சந்தர்ப்பங்களில், Gemini பொருட்களில் ஒன்றை வெளியிடப்படாத Silent Hill: f விளையாட்டின் கற்பனைக் கதாபாத்திரமாக தவறாக அடையாளம் கண்டது, இது ஏற்கனவே இல்லாத ஒன்றை உருவாக்குவதற்காக வெவ்வேறு தலைப்புகளின் பகுதிகளை தெளிவாக இணைத்தது. Gemini ஒரு தவறான பதிலைக் கொடுத்து, நான் அதைச் சரிசெய்து பதிலுக்கு நெருக்கமான குறிப்பை வழங்கினேன் - அல்லது எளிமையாகப் பதிலைக் கொடுத்தேன் - ஆனால் அது ஒரு புதிய யூகம் போல தவறான பதிலைத் திரும்பச் சொன்னது, இது நான் எதிர்கொண்ட மற்ற நிலையான பிழையாக இருந்தது. அப்படி நடந்தால், நான் அமர்வை மூடிவிட்டு புதிதாகத் தொடங்குவேன், அது எப்போதும் பயனுள்ளதாக இல்லை.
நான் கண்டுபிடித்த ஒரு நுட்பம் என்னவென்றால், சில உரையாடல்கள் மற்றவற்றை விட பயனுள்ளதாக இருந்தன. எனது Gemini உரையாடல் பட்டியலுக்குச் சென்று, ஒரு குறிப்பிட்ட பொருளைச் சரியாகப் பெற்ற பழைய அரட்டையைத் தட்டி, பின்னர் அந்த அரட்டையிலிருந்து மீண்டும் லைவ் சென்றால், அது எந்தப் பிரச்சினையும் இல்லாமல் பொருட்களை அடையாளம் காண முடிந்தது. இது எப்போதும் எதிர்பார்க்கக்கூடியதாக இல்லை என்றாலும், அதே மொழியைப் பயன்படுத்தினாலும் ஒரு சில உரையாடல்கள் மற்றவற்றை விட சிறப்பாகச் செயல்பட்டது என்பதை கவனிப்பது ஆர்வமாக இருந்தது.
Gemini Live எவ்வாறு செயல்படுகிறது என்பது குறித்த கூடுதல் தகவல்களைப் பெறுவதற்கான எனது விசாரணைகளுக்கு Google பதிலளிக்கவில்லை.
Gemini எனது சவாலான, சில நேரங்களில் மிகவும் குறிப்பிட்ட கேள்விகளுக்கு வெற்றிகரமாகப் பதிலளிக்க வேண்டும் என்று நான் விரும்பினேன், எனவே நான் அதற்கு உதவ நிறைய குறிப்புகளை வழங்கினேன். அந்த nudges பயனுள்ளதாக இருந்தது, ஆனால் எப்போதும் இல்லை.
ஒரு மாற்றத்தக்க தொழில்நுட்பம்: Gemini Live-இன் சாத்தியமான தாக்கம்
Gemini Live நாம் நம்மைச் சுற்றியுள்ள சுற்றுச்சூழலுடன் தொடர்பு கொள்ளும் விதத்தில் ஒரு மாற்றத்தை ஏற்படுத்துகிறது, நமது கேமராக்களின் லென்ஸ் மூலம் டிஜிட்டல் மற்றும் பிசிக்கல் உலகங்களை தடையின்றி இணைக்கிறது. இந்த தொழில்நுட்பம் இன்னும் அதன் ஆரம்ப கட்டத்தில் இருந்தாலும், அதன் சாத்தியமான பயன்பாடுகள் பரந்தவை மற்றும் மாற்றத்தக்கவை.
Gemini Live ஐப் பயன்படுத்தி:
- பரிச்சயமில்லாத சூழல்களில் செல்லுங்கள்: தெரு அடையாளங்கள் அல்லது அடையாளச் சின்னங்களில் உங்கள் கேமராவை சுட்டிக்காட்டுங்கள், Gemini நிகழ்நேர திசைகள் மற்றும் தகவல்களை வழங்கும்.
- வரலாற்று கலைப்பொருட்கள் பற்றி கற்றுக்கொள்ளுங்கள்: ஒரு அருங்காட்சியகத்திற்கு வருகை தரும்போது, கலைப்படைப்புகள் மற்றும் வரலாற்றுப் பொருட்களுக்கான சூழலை அடையாளம் காண Gemini ஐப் பயன்படுத்துங்கள்.
- சிக்கலான சமையல் குறிப்புகளை சமைக்கவும்: ஒரு சமையல் குறிப்பின் ஒவ்வொரு கட்டத்திலும் உங்களுக்கு உதவ Gemini ஐக் கேளுங்கள், பொருட்கள் மற்றும் மாற்று நுட்பங்களை அடையாளம் காட்டுங்கள்.
- எளிதான வீட்டுப் பிரச்சினைகளை கண்டறியுங்கள்: பழுதான வீட்டு உபகரணத்தில் உங்கள் கேமராவைப் பாயிண்ட் செய்யுங்கள், Gemini சரிசெய்தல் உதவிக்குறிப்புகள் மற்றும் சாத்தியமான தீர்வுகளை வழங்கும்.
இவை Gemini Live நமது அன்றாட வாழ்க்கையை மேம்படுத்தும் எண்ணற்ற வழிகளில் சில எடுத்துக்காட்டுகள் மட்டுமே. இந்த தொழில்நுட்பம் தொடர்ந்து வளர்ந்து மேம்பட்டு வருவதால், நம்மைச் சுற்றியுள்ள உலகத்துடன் நாம் தொடர்பு கொள்ளும் விதத்தில் புரட்சி செய்யும் ஆற்றல் உண்மையிலேயே வரம்பற்றது.
iOS சாதனங்களில் Gemini Live இன் ஒருங்கிணைப்பு அதன் வரம்பையும் அணுகலையும் மேலும் விரிவுபடுத்துகிறது, இது AI-ஆதரவு பார்வையிடும் திறனின் சக்தியை ஒரு பரவலான பார்வையாளர்களுக்கு கொண்டு செல்கிறது. AI தொழில்நுட்பம் அதிவேகமாக முன்னேறி வருவதால், Gemini Live போன்ற அம்சங்கள் ஒரு எதிர்காலத்தின் பிரதிபலிப்பாகும், அதில் நம் சாதனங்கள் தொடர்பு மற்றும் பொழுதுபோக்கிற்கான கருவிகளாக மட்டுமல்லாமல், நம்மைச் சுற்றியுள்ள உலகத்துடன் புதிய மற்றும் அர்த்தமுள்ள வழிகளில் செல்லவும், புரிந்துகொள்ளவும், தொடர்பு கொள்ளவும் உதவும் அறிவார்ந்த நண்பர்களாகவும் உள்ளன.