செயற்கை நுண்ணறிவு (AI), பல ஆண்டுகளாக, பெரும்பாலும் உரையின் தளத்திலேயே தொடர்பு கொண்டு இயங்கி வருகிறது. மொழி மாதிரிகள் மனித மொழியைச் செயலாக்கவும், உருவாக்கவும், புரிந்து கொள்ளவும் கூடிய திறனால் வியக்க வைத்துள்ளன, நாம் தகவல்களுடனும் தொழில்நுட்பத்துடனும் தொடர்பு கொள்ளும் முறையை புரட்சிகரமாக்கியுள்ளன. ஆயினும், நாம் வாழும் உலகம் வெறும் உரை சார்ந்தது அல்ல; அது காட்சி தூண்டுதல்களின் செழுமையான திரைச்சீலை. யதார்த்தத்தின் இந்த அடிப்படை அம்சத்தை அங்கீகரித்து, AI வளர்ச்சியின் எல்லை, படிக்க மட்டுமல்லாமல், சுற்றியுள்ள காட்சி உலகைப் பார்க்கவும் விளக்கவும் கூடிய அமைப்புகளை நோக்கி வேகமாக முன்னேறி வருகிறது. இந்த வளர்ந்து வரும் நிலப்பரப்பில் உறுதியாக காலடி எடுத்து வைக்கும் வகையில், சீன தொழில்நுட்பக் குழுமமான Alibaba ஒரு புதிரான புதிய வளர்ச்சியை அறிமுகப்படுத்தியுள்ளது: QVQ-Max, காட்சி பகுத்தறிவுத் திறனுடன் வடிவமைக்கப்பட்ட ஒரு AI அமைப்பு. இது மனிதர்கள் தகவல்களுடன் தொடர்பு கொள்ளும் முறையைப் போலவே - பார்வையை புரிதல் மற்றும் சிந்தனையுடன் ஒருங்கிணைப்பதன் மூலம் - AI-ஐ நோக்கி ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது.
உரைக்கு அப்பால்: காட்சி பகுத்தறிவின் சாரத்தைப் புரிந்துகொள்வது
செயற்கை நுண்ணறிவில் காட்சி பகுத்தறிவு என்ற கருத்து முற்றிலும் உரை சார்ந்த செயலாக்கத்திலிருந்து ஒரு விலகலைக் குறிக்கிறது. பாரம்பரிய பெரிய மொழி மாதிரிகள் (LLMs) எழுதப்பட்ட அல்லது பேசப்பட்ட மொழி சம்பந்தப்பட்ட பணிகளில் சிறந்து விளங்குகின்றன - கட்டுரைகளைச் சுருக்குதல், மொழிகளை மொழிபெயர்த்தல், மின்னஞ்சல்களை எழுதுதல் அல்லது குறியீட்டை எழுதுதல் போன்றவை. இருப்பினும், அவற்றுக்கு ஒரு படம், ஒரு வரைபடம் அல்லது ஒரு வீடியோ கிளிப்பைக் கொடுத்தால், பன்முறை உள்ளீட்டிற்காக பிரத்யேகமாகப் பயிற்றுவிக்கப்படாவிட்டால் அவற்றின் புரிதல் ஒரு சுவரைத் தாக்கும். அடிப்படை கணினிப் பார்வையுடன் பொருத்தப்பட்டிருந்தால் அவை ஒரு படத்திற்குள் உள்ள பொருட்களை அடையாளம் காணக்கூடும், ஆனால் அவை பெரும்பாலும் சூழல், கூறுகளுக்கு இடையிலான உறவுகள் அல்லது பார்வைக்குத் தெரிவிக்கப்படும் அடிப்படைப் பொருளைப் புரிந்து கொள்ள சிரமப்படுகின்றன.
காட்சி பகுத்தறிவு இந்த முக்கியமான இடைவெளியைக் குறைப்பதை நோக்கமாகக் கொண்டுள்ளது. இது AI-க்கு ‘பார்க்கும்’ திறனை (பட அங்கீகாரம்) மட்டும் வழங்குவதோடு மட்டுமல்லாமல், இடைவெளி உறவுகளைப் புரிந்துகொள்வது, செயல்களை ஊகிப்பது, சூழலைக் கண்டறிவது மற்றும் காட்சி உள்ளீட்டின் அடிப்படையில் தர்க்கரீதியான முடிவுகளைச் செய்வது ஆகியவற்றையும் உள்ளடக்கியது. ஒரு படத்தில் ‘பூனை’ மற்றும் ‘பாய்’ ஆகியவற்றை அடையாளம் காண்பது மட்டுமல்லாமல், ‘பூனை பாயின் மீது இருக்கிறது’ என்ற கருத்தைப் புரிந்துகொள்ளும் ஒரு AI-ஐ கற்பனை செய்து பாருங்கள். இதை மேலும் நீட்டிக்கவும்: பொருட்கள் மற்றும் சமையல் படிகளைக் காட்டும் படங்களின் வரிசையைப் பார்த்து, பின்னர் ஒத்திசைவான வழிமுறைகளை உருவாக்கக்கூடிய அல்லது சாத்தியமான அழுத்தப் புள்ளிகளைக் கண்டறிய ஒரு சிக்கலான பொறியியல் வரைபடத்தை பகுப்பாய்வு செய்யக்கூடிய ஒரு AI.
இந்தத் திறன் AI-ஐ ஒரு முழுமையான நுண்ணறிவு வடிவத்திற்கு நெருக்கமாக நகர்த்துகிறது, இது மனித அறிவாற்றலை மிகவும் நெருக்கமாகப் பிரதிபலிக்கிறது. நாம் தொடர்ந்து காட்சித் தகவல்களைச் செயலாக்குகிறோம், உலகை வழிநடத்தவும், சிக்கல்களைத் தீர்க்கவும், திறம்பட தொடர்பு கொள்ளவும் நமது அறிவு மற்றும் பகுத்தறிவுத் திறன்களுடன் அதைத் தடையின்றி ஒருங்கிணைக்கிறோம். வலுவான காட்சி பகுத்தறிவுடன் கூடிய AI, தகவல்களின் பரந்த அளவிலான ஸ்பெக்ட்ரத்துடன் ஈடுபட முடியும், இது முன்னர் அறிவியல் புனைகதைக்கு மட்டுப்படுத்தப்பட்ட உதவி, பகுப்பாய்வு மற்றும் தொடர்புக்கான புதிய சாத்தியங்களைத் திறக்கிறது. இது ஒரு வரைபடத்தின் விளக்கத்தைப் படிக்கக்கூடிய AI-க்கும், காட்சி அடையாளங்களின் அடிப்படையில் திசைகளை வழங்க வரைபடத்தையே விளக்கக்கூடிய AI-க்கும் உள்ள வித்தியாசத்தைக் குறிக்கிறது. Alibaba-வின் QVQ-Max இந்த அதிநவீன களத்தில் ஒரு போட்டியாளராக தன்னை நிலைநிறுத்துகிறது, காட்சித் தரவுகளால் தூண்டப்படும் உண்மையான புரிதல் மற்றும் சிந்தனை செயல்முறைகளில் நீட்டிக்கப்படும் திறன்களைக் கோருகிறது.
QVQ-Max அறிமுகம்: AI பார்வை மற்றும் சிந்தனையில் Alibaba-வின் முயற்சி
Alibaba, QVQ-Max-ஐ வெறும் பட அங்கீகரிப்பாளராக அல்லாமல், ஒரு அதிநவீன காட்சி பகுத்தறிவு மாதிரியாக முன்வைக்கிறது. இந்த AI போட் எளிய பொருள் கண்டறிதலைத் தாண்டியது என்பது முக்கியக் கூற்று; இது புகைப்படங்கள் மற்றும் வீடியோ உள்ளடக்கத்திலிருந்து பெறப்பட்ட தகவல்களை தீவிரமாக பகுப்பாய்வு செய்து பகுத்தறிகிறது. Alibaba, QVQ-Max திறம்பட பார்க்கவும், புரிந்து கொள்ளவும், சிந்திக்கவும் வடிவமைக்கப்பட்டுள்ளது என்று பரிந்துரைக்கிறது, இதன் மூலம் சுருக்கமான, உரை அடிப்படையிலான AI செயலாக்கத்திற்கும், நிஜ உலகத் தரவுகளின் பெரும்பகுதியை உருவாக்கும் உறுதியான, காட்சித் தகவல்களுக்கும் இடையிலான பிளவைக் குறைக்கிறது.
இதன் பின்னணியில் உள்ள இயக்கவியல் சிக்கலான காட்சி காட்சிகளைப் பாகுபடுத்துதல் மற்றும் முக்கிய கூறுகள் மற்றும் அவற்றின் இடைத்தொடர்புகளை அடையாளம் காணுதல் ஆகியவற்றில் மேம்பட்ட திறன்களை உள்ளடக்கியது. இது பொருட்களை லேபிளிடுவது மட்டுமல்ல, காட்சி உள்ளீட்டிற்குள் உள்ள கதை அல்லது கட்டமைப்பைப் புரிந்துகொள்வது பற்றியது. Alibaba மாதிரியின் நெகிழ்வுத்தன்மையை எடுத்துக்காட்டுகிறது, இந்த முக்கிய காட்சி பகுத்தறிவுத் திறனிலிருந்து உருவாகும் பரந்த அளவிலான சாத்தியமான பயன்பாடுகளைக் குறிக்கிறது. இந்தப் பயன்பாடுகள் பல்வேறு துறைகளில் பரவியுள்ளன, இது இந்தத் தொழில்நுட்பத்தின் அடிப்படைத் தன்மையைக் குறிக்கிறது. மேற்கோள் காட்டப்பட்ட எடுத்துக்காட்டுகளில் விளக்கப்பட வடிவமைப்பில் உதவுதல், ஒருவேளை காட்சி பாணிகளைப் புரிந்துகொள்வதன் மூலம் அல்லது படத் தூண்டுதல்களின் அடிப்படையில் கருத்துக்களை உருவாக்குவதன் மூலம்; வீடியோ ஸ்கிரிப்ட் உருவாக்கத்தை எளிதாக்குதல், ஒருவேளை காட்சி வரிசைகள் அல்லது மனநிலைகளை விளக்குவதன் மூலம்; மற்றும் காட்சி சூழலை இணைக்கக்கூடிய அதிநவீன பாத்திரப் பாவனை காட்சிகளில் ஈடுபடுதல் ஆகியவை அடங்கும்.
QVQ-Max-இன் வாக்குறுதி, காட்சித் தரவை நேரடியாக சிக்கல் தீர்க்கும் மற்றும் பணிச் செயலாக்கத்தில் ஒருங்கிணைக்கும் திறனில் உள்ளது. வேலை, கல்வி மற்றும் தனிப்பட்ட வாழ்க்கை முழுவதும் உரை மற்றும் தரவுகளில் வேரூன்றிய பணிகளுக்கான பாரம்பரிய AI சாட்போட்களின் உதவியைத் தக்க வைத்துக் கொள்ளும்போது, அதன் காட்சிப் பரிமாணம் திறனின் அடுக்குகளைச் சேர்க்கிறது. காட்சி சூழல் துணைபுரியும் ஒன்றாக மட்டுமல்லாமல் அவசியமானதாக இருக்கும் சிக்கல்களைச் சமாளிப்பதை இது நோக்கமாகக் கொண்டுள்ளது.
நடைமுறை பயன்பாடுகள்: காட்சி பகுத்தறிவு எங்கே வித்தியாசத்தை ஏற்படுத்துகிறது
எந்தவொரு தொழில்நுட்ப முன்னேற்றத்தின் உண்மையான அளவுகோல் அதன் நடைமுறைப் பயன்பாட்டில் உள்ளது. ‘பார்க்க’ மற்றும் ‘பகுத்தறிய’ கூடிய AI எவ்வாறு உறுதியான நன்மைகளாக மாறுகிறது? Alibaba, QVQ-Max-இன் காட்சித் திறன் மாற்றத்தை ஏற்படுத்தக்கூடிய பல கட்டாயப் பகுதிகளைப் பரிந்துரைக்கிறது.
தொழில்முறை பணிப்பாய்வுகளை மேம்படுத்துதல்
பணியிடத்தில், காட்சித் தகவல்கள் எங்கும் நிறைந்துள்ளன. சாத்தியமான தாக்கத்தைக் கவனியுங்கள்:
- தரவு காட்சிப்படுத்தல் பகுப்பாய்வு: மூல தரவு அட்டவணைகளைச் செயலாக்குவதற்குப் பதிலாக, QVQ-Max சாத்தியமான விளக்கப்படங்கள் மற்றும் வரைபடங்களை நேரடியாகப் பகுப்பாய்வு செய்து, பார்வைக்கு வழங்கப்படும் போக்குகள், முரண்பாடுகள் அல்லது முக்கிய முடிவுகளை அடையாளம் காண முடியும். இது அறிக்கை பகுப்பாய்வு மற்றும் வணிக நுண்ணறிவுப் பணிகளை வியத்தகு முறையில் விரைவுபடுத்தும்.
- தொழில்நுட்ப வரைபட விளக்கம்: பொறியாளர்கள், கட்டிடக் கலைஞர்கள் மற்றும் தொழில்நுட்ப வல்லுநர்கள் பெரும்பாலும் சிக்கலான வரைபடங்கள், வரைபடங்கள் அல்லது திட்ட வரைபடங்களை நம்பியிருக்கிறார்கள். ஒரு காட்சி பகுத்தறிவு AI இந்த ஆவணங்களை விளக்க உதவலாம், ஒருவேளை கூறுகளை அடையாளம் காணுதல், இணைப்புகளைக் கண்டறிதல் அல்லது காட்சி வடிவங்களின் அடிப்படையில் சாத்தியமான வடிவமைப்பு குறைபாடுகளைக் கொடியிடுதல்.
- வடிவமைப்பு மற்றும் படைப்பாற்றல் உதவி: கிராஃபிக் வடிவமைப்பாளர்கள் அல்லது இல்லஸ்ட்ரேட்டர்களுக்கு, மாதிரி மனநிலை பலகைகள் அல்லது உத்வேகம் தரும் படங்களை பகுப்பாய்வு செய்து வண்ணத் தட்டுகள், தளவமைப்பு கட்டமைப்புகள் அல்லது ஸ்டைலிஸ்டிக் கூறுகளைப் பரிந்துரைக்கலாம். இது காட்சி விளக்கங்கள் அல்லது ஏற்கனவே உள்ள படங்களின் அடிப்படையில் வரைவு விளக்கப்படங்களை உருவாக்கலாம், இது ஒரு அதிநவீன படைப்பாற்றல் கூட்டாளியாக செயல்படுகிறது.
- விளக்கக்காட்சி உருவாக்கம்: ஒரு திட்டத்துடன் தொடர்புடைய படங்களின் தொகுப்பை AI-க்கு ஊட்டுவதை கற்பனை செய்து பாருங்கள்; இது சாத்தியமான ஒரு விளக்கக்காட்சியை கட்டமைக்கலாம், தொடர்புடைய தலைப்புகளை உருவாக்கலாம் மற்றும் காட்சி நிலைத்தன்மையை உறுதிப்படுத்தலாம், உருவாக்கும் செயல்முறையை நெறிப்படுத்தலாம்.
கல்வி மற்றும் கற்றலை புரட்சிகரமாக்குதல்
காட்சித் தகவல்களைப் புரிந்துகொள்ளும் AI-யிலிருந்து கல்வித் துறை கணிசமாகப் பயனடைய உள்ளது:
- STEM சிக்கல் தீர்க்கும்: கணிதம் மற்றும் இயற்பியல் சிக்கல்களுடன் கூடிய வரைபடங்களை பகுப்பாய்வு செய்யும் திறன் ஒரு சிறந்த எடுத்துக்காட்டு. QVQ-Max சாத்தியமான வடிவியல் உருவங்கள், விசை வரைபடங்கள் அல்லது சுற்று வரைபடங்களை விளக்கி, காட்சிப் பிரதிநிதித்துவத்தை உரை சிக்கல் விளக்கத்துடன் தொடர்புபடுத்தி படிப்படியான வழிகாட்டுதல் அல்லது விளக்கங்களை வழங்க முடியும். இது இயல்பாகவே காட்சி சார்ந்த கருத்துக்களைப் புரிந்துகொள்வதற்கான ஒரு பாதையை வழங்குகிறது.
- காட்சிப் பாடப் பயிற்சி: உயிரியல் (செல்லுலார் கட்டமைப்புகள், உடற்கூறியல்), வேதியியல் (மூலக்கூறு மாதிரிகள்), புவியியல் (வரைபடங்கள், புவியியல் வடிவங்கள்) மற்றும் கலை வரலாறு போன்ற பாடங்கள் காட்சிப் புரிதலை பெரிதும் நம்பியுள்ளன. ஒரு காட்சி பகுத்தறிவு AI ஒரு ஊடாடும் ஆசிரியராக செயல்படலாம், படங்களின் அடிப்படையில் கருத்துக்களை விளக்குதல், காட்சி அடையாளத்தில் மாணவர்களை வினாவுதல் அல்லது வரலாற்று கலைப்படைப்புகளுக்கு சூழலை வழங்குதல்.
- ஊடாடும் கற்றல் பொருட்கள்: கல்வி உள்ளடக்கத்தை உருவாக்குபவர்கள் மாணவர்கள் காட்சி கூறுகளுடன் தொடர்பு கொள்ளும் மேலும் ஆற்றல்மிக்க மற்றும் பதிலளிக்கக்கூடிய கற்றல் தொகுதிகளை உருவாக்க அத்தகைய தொழில்நுட்பத்தைப் பயன்படுத்தலாம், மேலும் AI அதன் காட்சிகளின் புரிதலின் அடிப்படையில் பின்னூட்டத்தை வழங்குகிறது.
தனிப்பட்ட வாழ்க்கை மற்றும் பொழுதுபோக்குகளை எளிதாக்குதல்
வேலை மற்றும் படிப்பிற்கு அப்பால், காட்சி பகுத்தறிவு AI அன்றாடப் பணிகள் மற்றும் ஓய்வு நேரங்களுக்கு புதிரான சாத்தியங்களை வழங்குகிறது:
- சமையல் வழிகாட்டுதல்: செய்முறைப் படங்களின் அடிப்படையில் ஒரு பயனரை சமையல் மூலம் வழிநடத்தும் உதாரணம் இதை எடுத்துக்காட்டுகிறது. AI படிகளைப் படிப்பது மட்டுமல்ல; இது பயனரின் முன்னேற்றத்தின் புகைப்படங்களை பகுப்பாய்வு செய்து, செய்முறைப் படங்களில் எதிர்பார்க்கப்படும் முடிவுகளுடன் ஒப்பிட்டு, திருத்த ஆலோசனைகளை வழங்கலாம் (“இந்தப் படத்துடன் ஒப்பிடும்போது உங்கள் சாஸ் இன்னும் கெட்டியாக வேண்டும் போல் தெரிகிறது”).
- DIY மற்றும் பழுதுபார்ப்பு உதவி: தளபாடங்களை அசெம்பிள் செய்வதில் அல்லது ஒரு சாதனத்தை சரிசெய்வதில் சிக்கலா? உங்கள் கேமராவை சிக்கல் பகுதி அல்லது அறிவுறுத்தல் கையேட்டின் வரைபடத்தில் சுட்டிக்காட்டுவது AI-க்கு பாகங்களை பார்வைக்கு அடையாளம் காணவும், அசெம்பிளி படியைப் புரிந்துகொள்ளவும், இலக்கு வழிகாட்டுதலை வழங்கவும் அனுமதிக்கும்.
- இயற்கை அடையாளம் காணல்: புகைப்படங்களிலிருந்து தாவரங்கள், பூச்சிகள் அல்லது பறவைகளை அடையாளம் காண்பது மிகவும் அதிநவீனமாக மாறும், AI சாத்தியமான அடையாளம் காண்பதன் அடிப்படையில் மட்டுமல்லாமல் காட்சி சூழலின் அடிப்படையிலும் விரிவான தகவல்களை வழங்குகிறது (எ.கா., ஒரு தாவரத்தை அடையாளம் கண்டு மற்றும் படத்தில் தெரியும் நோயின் அறிகுறிகளைக் குறிப்பிடுதல்).
- மேம்படுத்தப்பட்ட பாத்திரப் பாவனை: பாத்திரப் பாவனை விளையாட்டுகளில் காட்சி கூறுகளை ஒருங்கிணைப்பது மிகவும் ஆழமான அனுபவங்களை உருவாக்கும். AI காட்சிகள் அல்லது கதாபாத்திரங்களைக் குறிக்கும் படங்களுக்கு எதிர்வினையாற்றலாம், அவற்றை மாறும் வகையில் கதையில் நெசவு செய்யலாம்.
முன்னோக்கிய பாதை: QVQ-Max-இன் திறன்களைச் செம்மைப்படுத்துதல் மற்றும் விரிவுபடுத்துதல்
Alibaba, QVQ-Max, அதன் தற்போதைய வடிவத்தில், காட்சி பகுத்தறிவு AI-க்கான அவர்களின் பார்வையின் ஆரம்ப மறு செய்கையை மட்டுமே பிரதிபலிக்கிறது என்பதை உடனடியாக ஒப்புக்கொள்கிறது. மாதிரியின் நுட்பத்தையும் பயன்பாட்டையும் உயர்த்துவதற்காக மூன்று முக்கியப் பகுதிகளில் கவனம் செலுத்தி, எதிர்கால மேம்பாடுகளுக்கான தெளிவான வரைபடத்தை அவர்கள் வெளிப்படுத்தியுள்ளனர்.
1. பட அங்கீகாரத் துல்லியத்தை வலுப்படுத்துதல்: காட்சி பகுத்தறிவின் அடித்தளம் துல்லியமான புலனுணர்வு ஆகும். Alibaba, QVQ-Max-இன் ‘பார்க்கும்’ திறனைச் சரியாக விளக்கும் திறனை மேம்படுத்தத் திட்டமிட்டுள்ளது. இது grounding techniques-ஐப் பயன்படுத்துவதை உள்ளடக்கியது. AI-இல், grounding பொதுவாக சுருக்கமான சின்னங்கள் அல்லது மொழிப் பிரதிநிதித்துவங்களை (மாதிரியால் உருவாக்கப்பட்ட உரை போன்றவை) உறுதியான, நிஜ உலகக் குறிப்புகளுடன் இணைப்பதைக் குறிக்கிறது - இந்த விஷயத்தில், ஒரு படத்திற்குள் உள்ள குறிப்பிட்ட விவரங்கள். அதன் காட்சி அவதானிப்புகளை உண்மையான படத் தரவுகளுக்கு எதிராக மிகவும் கடுமையாகச் சரிபார்ப்பதன் மூலம், பிழைகள், தவறான விளக்கங்கள் மற்றும் உருவாக்க மாதிரிகளைப் பாதிக்கக்கூடிய AI ‘hallucinations’-ஐக் குறைப்பதே இதன் நோக்கம். உயர் நம்பகத்தன்மை கொண்ட காட்சிப் புரிதலுக்கான இந்தத் தேடல் நம்பகமான பகுத்தறிவுக்கு முக்கியமானது.
2. சிக்கலான தன்மை மற்றும் தொடர்புகளைக் கையாளுதல்: இரண்டாவது முக்கிய உந்துதல், பல படிகளில் வெளிப்படும் அல்லது சிக்கலான சிக்கல் தீர்க்கும் சூழ்நிலைகளை உள்ளடக்கிய மிகவும் சிக்கலான பணிகளைக் கையாள மாதிரியை இயக்குவதாகும். இந்த லட்சியம் செயலற்ற பகுப்பாய்விற்கு அப்பால் செயலில் உள்ள தொடர்புக்கு நீட்டிக்கப்படுகிறது. குறிப்பிடப்பட்ட குறிக்கோள் - AI-ஐ தொலைபேசிகள் மற்றும் கணினிகளை இயக்கவும், விளையாட்டுகளை விளையாடவும் இயக்குவது - குறிப்பாகக் குறிப்பிடத்தக்கது. இது வரைகலை பயனர் இடைமுகங்களை (GUIs) புரிந்துகொள்ளும் திறன் கொண்ட AI முகவர்களின் பரிணாம வளர்ச்சியைக் குறிக்கிறது, மாறும் காட்சிப் பின்னூட்டத்தை (ஒரு விளையாட்டு சூழலில் போன்றது) விளக்குகிறது, மேலும் காட்சி உள்ளீட்டின் அடிப்படையில் செயல்களின் வரிசைகளைச் செயல்படுத்துகிறது. இங்கு வெற்றி பெற்றால், மனிதர்கள் செய்வது போலவே, டிஜிட்டல் உலகத்துடன் பார்வைக்குத் தொடர்பு கொள்ளக்கூடிய மிகவும் தன்னாட்சி மற்றும் திறமையான AI உதவியாளர்களை நோக்கிய ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறிக்கும்.
3. உரைக்கு அப்பால் உள்ள முறைகளை விரிவுபடுத்துதல்: இறுதியாக, Alibaba, QVQ-Max-ஐ அதன் வெளியீடு மற்றும் சாத்தியமான உள்ளீட்டுச் செம்மைப்படுத்தலுக்கான முதன்மையாக உரை அடிப்படையிலான தொடர்புகளைச் சார்ந்திருப்பதிலிருந்து அப்பால் தள்ளத் திட்டமிட்டுள்ளது. வரைபடத்தில் tool verification மற்றும் visual generation ஆகியவை அடங்கும். Tool verification என்பது, ஒரு வெளிப்புற மென்பொருள் கருவி அல்லது API-யிலிருந்து கோரப்பட்ட ஒரு செயல், திரை மாற்றங்கள் அல்லது வெளியீட்டுப் படங்களை பகுப்பாய்வு செய்வதன் மூலம் வெற்றிகரமாக முடிக்கப்பட்டதை AI பார்வைக்கு உறுதிப்படுத்துவதைக் குறிக்கலாம். Visual generation, AI படங்களைப் புரிந்துகொள்வது மட்டுமல்லாமல், அதன் பகுத்தறிவு மற்றும் நடந்துகொண்டிருக்கும் தொடர்புகளின் அடிப்படையில் புதிய காட்சி உள்ளடக்கத்தை உருவாக்கக்கூடிய ஒரு உண்மையான பன்முறை உள்ளீடு/வெளியீடு அமைப்பை நோக்கி நகர்வதைப் பரிந்துரைக்கிறது. இது வரைபடங்களை உருவாக்குதல், அறிவுறுத்தல்களின் அடிப்படையில் படங்களை மாற்றுதல் அல்லது அதன் பகுத்தறிவு செயல்முறையின் காட்சிப் பிரதிநிதித்துவங்களை உருவாக்குதல் ஆகியவற்றை உள்ளடக்கியிருக்கலாம்.
இந்த முன்னோக்கு நிகழ்ச்சி நிரல், காட்சி பகுத்தறிவு AI-க்காகக் கற்பனை செய்யப்பட்ட நீண்ட கால ஆற்றலை அடிக்கோடிட்டுக் காட்டுகிறது - புலனுணர்வு மற்றும் சிந்தனைமிக்க அமைப்புகள் மட்டுமல்லாமல், பார்வைக்கு வளமான சூழல்களில் சிக்கலான, பல-படி செயல்பாடுகளுக்கு பெருகிய முறையில் ஊடாடும் மற்றும் திறமையானவை.
காட்சி மனதை அணுகுதல்: QVQ-Max உடன் ஈடுபடுதல்
இந்த புதிய காட்சி பகுத்தறிவு மாதிரியின் திறன்களை நேரடியாக ஆராய ஆர்வமுள்ளவர்களுக்கு, Alibaba அதன் தற்போதைய AI அரட்டை இடைமுகம் மூலம் QVQ-Max-ஐ அணுகும்படி செய்துள்ளது. பயனர்கள் chat.qwen.ai தளத்திற்குச் செல்லலாம். இடைமுகத்திற்குள், பொதுவாக மேல்-இடது மூலையில் அமைந்துள்ளது, வெவ்வேறு AI மாதிரிகளைத் தேர்ந்தெடுப்பதற்கான கீழ்தோன்றும் மெனு உள்ளது. ‘Expand more models’ என்ற விருப்பத்தைத் தேர்ந்தெடுப்பதன் மூலம், பயனர்கள் QVQ-Max-ஐக் கண்டுபிடித்து தேர்ந்தெடுக்கலாம். மாதிரி செயலில் ஆனதும், தொடர்பு நிலையான அரட்டைப் பெட்டி வழியாகத் தொடர்கிறது, அதன் தனித்துவமான பகுத்தறிவுத் திறன்களைத் திறக்க காட்சி உள்ளடக்கம் - படங்கள் அல்லது சாத்தியமான வீடியோ கிளிப்புகள் - இணைக்கும் முக்கியமான கூடுதலாக. இந்த முதல் தலைமுறை காட்சி பகுத்தறிவு கருவியின் நடைமுறை நோக்கம் மற்றும் வரம்புகளைப் புரிந்துகொள்வதற்கு பல்வேறு காட்சி உள்ளீடுகளுடன் பரிசோதனை செய்வது முக்கியம்.