பாய்டு ERNIE 4.5 & ERNIE X1 மூலம் AI-ஐ மேம்படுத்துகிறது

ERNIE 4.5: பன்முகத்திறன் கொண்ட அடிப்படை மாதிரியின் புதிய தலைமுறை

ERNIE 4.5 என்பது பாய்டுவின் (Baidu) சமீபத்திய, சுதந்திரமாக உருவாக்கப்பட்ட பன்முகத்திறன் (multimodal) கொண்ட அடிப்படை மாதிரி (foundation model) ஆகும். இந்த மாதிரி, பல்வேறு வகையிலான உள்ளீடுகளை (modalities) ஒருங்கிணைத்து, கூட்டு மேம்படுத்தலை (collaborative optimization) அடையும் வகையில் வடிவமைக்கப்பட்டுள்ளது. இந்த புதுமையான அணுகுமுறை, அசாதாரணமான பன்முகத்திறன் புரிதல் திறன்களை (multimodal comprehension capabilities) வழங்குகிறது. ERNIE 4.5-ஐ தனித்துவமாக்குவது அதன் மேம்படுத்தப்பட்ட மொழித் திறன்கள், புரிதல், உருவாக்கம், பகுத்தறிதல் (reasoning) மற்றும் நினைவகம் ஆகியவற்றில் ஒட்டுமொத்த மேம்பாடு ஆகும். மேலும், மாயத்தோற்றம் தவிர்த்தல் (hallucination prevention), தர்க்கரீதியான பகுத்தறிதல் (logical reasoning) மற்றும் குறியீட்டுத் திறன்கள் (coding abilities) உள்ளிட்ட AI மாடல்களுக்கு சவாலான பகுதிகளில் குறிப்பிடத்தக்க முன்னேற்றங்களைக் காட்டுகிறது.

ERNIE 4.5-ன் பன்முகத்திறன் தன்மை, பின்வரும் பல்வேறு வகையான உள்ளடக்கங்களை தடையின்றி ஒருங்கிணைத்து புரிந்துகொள்ளும் திறனில் வெளிப்படுகிறது:

  • உரை (Text): எழுதப்பட்ட தகவலை செயலாக்குதல் மற்றும் புரிந்துகொள்ளுதல்.
  • படங்கள் (Images): காட்சி உள்ளடக்கத்தை விளக்குதல் மற்றும் பகுப்பாய்வு செய்தல்.
  • ஆடியோ (Audio): பேசப்படும் மொழியைப் புரிந்துகொண்டு பதிலளித்தல்.
  • வீடியோ (Video): டைனமிக் காட்சி மற்றும் ஒலி தகவல்களை பகுப்பாய்வு செய்தல் மற்றும் புரிந்துகொள்ளுதல்.

இந்த விரிவான பன்முகத்திறன் திறன், சிக்கலான கேள்விகளுக்கு பதிலளிப்பது முதல் ஆக்கப்பூர்வமான உள்ளடக்கத்தை உருவாக்குவது வரை பரந்த அளவிலான பணிகளை ERNIE 4.5 கையாள அனுமதிக்கிறது.

அதன் முக்கிய பன்முகத்திறன் செயல்பாடுகளுக்கு அப்பால், ERNIE 4.5 குறிப்பிடத்தக்க அளவிலான நுண்ணறிவு மற்றும் சூழல் விழிப்புணர்வைக் (contextual awareness) காட்டுகிறது. இது சமகால இணைய கலாச்சாரத்தை சிரமமின்றி புரிந்துகொள்கிறது, மீம்ஸ்கள் (memes) மற்றும் நையாண்டி கார்ட்டூன்கள் (satirical cartoons) உட்பட, மாறிவரும் மொழி மற்றும் தொடர்பு பாணிகளுக்கு ஏற்ப அதன் திறனை வெளிப்படுத்துகிறது.

பாய்டுவின் முதன்மை அடிப்படை மாதிரி மற்றும் பன்முகத்திறன் வழங்கலாக, ERNIE 4.5 பல்வேறு பெஞ்ச்மார்க் சோதனைகளில் GPT-4.5-ஐ விட சிறப்பாக செயல்படும் வகையில் நிலைநிறுத்தப்பட்டுள்ளது. குறிப்பாக, GPT-4.5-ன் விலையில் ஒரு சிறிய பகுதியிலேயே (தோராயமாக 1%) இந்த உயர்ந்த செயல்திறனை அடைகிறது. இந்த செலவு-செயல்திறன், அதன் மேம்பட்ட திறன்களுடன் இணைந்து, ERNIE 4.5-ஐ AI துறையில் மிகவும் போட்டித்தன்மை வாய்ந்த மற்றும் அணுகக்கூடிய விருப்பமாக மாற்றுகிறது.

ERNIE 4.5-ன் திறன்களில் உள்ள குறிப்பிடத்தக்க மேம்பாடுகள் பல முக்கிய தொழில்நுட்ப முன்னேற்றங்களின் நேரடி விளைவாகும்:

  • ‘FlashMask’ டைனமிக் அட்டென்ஷன் மாஸ்கிங் (Dynamic Attention Masking): இந்த நுட்பம், உள்ளீட்டுத் தரவின் மிகவும் பொருத்தமான பகுதிகளில் மாடல் டைனமிக்காக கவனம் செலுத்த அனுமதிக்கிறது, செயல்திறன் மற்றும் துல்லியத்தை மேம்படுத்துகிறது.
  • ஹெட்டோரோஜினியஸ் மல்டிமோடல் மிக்ஸ்ச்சர்-ஆஃப்-எக்ஸ்பெர்ட்ஸ் (Heterogeneous Multimodal Mixture-of-Experts): ERNIE 4.5 பல்வேறு சிறப்பு துணை-மாடல்களைப் பயன்படுத்துகிறது என்பதை இது பரிந்துரைக்கிறது, ஒவ்வொன்றும் வெவ்வேறு முறைகள் அல்லது பணிகளுக்கு உகந்ததாக உள்ளது, பின்னர் அவை சிறந்த ஒட்டுமொத்த செயல்திறனை அடைய இணைக்கப்படுகின்றன.
  • ஸ்பேடியோடெம்போரல் ரெப்ரெசென்டேஷன் கம்ப்ரெஷன் (Spatiotemporal Representation Compression): வீடியோ உள்ளடக்கம் போன்ற காலப்போக்கில் மற்றும் வெளியில் மாறும் தரவை சுருக்கவும் திறமையாகவும் குறிக்க மாடல் மேம்பட்ட நுட்பங்களைப் பயன்படுத்துகிறது என்பதை இது குறிக்கிறது.
  • அறிவு சார்ந்த பயிற்சி தரவு கட்டுமானம் (Knowledge-Centric Training Data Construction): ERNIE 4.5-க்கான பயிற்சி தரவு கவனமாக தொகுக்கப்பட்டு, அறிவு பெறுதல் மற்றும் பிரதிநிதித்துவத்தை வலியுறுத்தும் வகையில் கட்டமைக்கப்பட்டுள்ளது, இது மேம்பட்ட பகுத்தறியும் திறன்களுக்கு வழிவகுக்கிறது.
  • சுய-பின்னூட்ட மேம்படுத்தப்பட்ட பிந்தைய பயிற்சி (Self-feedback Enhanced Post-Training): ஆரம்ப பயிற்சிக்குப் பிறகு மாடல் ஒரு சுத்திகரிப்பு செயல்முறைக்கு உட்படுகிறது என்பதை இது பரிந்துரைக்கிறது, அங்கு அது தனது சொந்த வெளியீடுகளிலிருந்து கற்றுக்கொள்கிறது மற்றும் அதன் செயல்திறனை மீண்டும் மீண்டும் மேம்படுத்துகிறது.

இந்த தொழில்நுட்ப முன்னேற்றங்கள் அனைத்தும் ERNIE 4.5-ன் ஈர்க்கக்கூடிய செயல்திறன் மற்றும் பன்முகத்தன்மைக்கு பங்களிக்கின்றன.

ERNIE X1: மேம்பட்ட AI திறன்களுக்கான ஆழமான சிந்தனை பகுத்தறிவு மாதிரி

ERNIE X1 AI-க்கான ஒரு வித்தியாசமான அணுகுமுறையைக் குறிக்கிறது, ஆழமான சிந்தனை (deep-thinking) மற்றும் பகுத்தறிவு திறன்களில் கவனம் செலுத்துகிறது. இந்த மாதிரி மேம்பட்ட அறிவாற்றல் செயல்பாடுகள் (cognitive functions) தேவைப்படும் பணிகளில் சிறந்து விளங்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது, அவை:

  • புரிதல் (Understanding): சிக்கலான தகவல்களையும் கருத்துகளையும் புரிந்துகொள்வது.
  • திட்டமிடல் (Planning): இலக்குகளை அடைய உத்திகள் மற்றும் செயல்களின் வரிசைகளை உருவாக்குதல்.
  • பிரதிபலிப்பு (Reflection): அதன் சொந்த பகுத்தறிவு செயல்முறைகளை மதிப்பீடு செய்தல் மற்றும் முன்னேற்றத்திற்கான பகுதிகளை அடையாளம் காணுதல்.
  • பரிணாமம் (Evolution): புதிய தகவல்கள் மற்றும் அனுபவங்களிலிருந்து தழுவி கற்றுக்கொள்வது.

கருவி பயன்பாட்டு திறன்களைக் கொண்ட பாய்டுவின் முதல் பன்முகத்திறன் ஆழமான சிந்தனை பகுத்தறிவு மாதிரியாக, ERNIE X1 பல முக்கிய பகுதிகளில் குறிப்பிட்ட பலங்களை நிரூபிக்கிறது:

  • சீன அறிவு கேள்வி பதில் (Chinese Knowledge Q&A): சீன மொழி மற்றும் கலாச்சாரத்தின் பரந்த அறிவுத் தளத்தின் அடிப்படையில் கேள்விகளுக்கு பதிலளித்தல்.
  • இலக்கிய உருவாக்கம் (Literary Creation): கவிதைகள், ஸ்கிரிப்ட்கள் அல்லது கட்டுரைகள் போன்ற ஆக்கப்பூர்வமான உரை வடிவங்களை உருவாக்குதல்.
  • கையெழுத்து எழுதுதல் (Manuscript Writing): நீண்ட வடிவ எழுதப்பட்ட உள்ளடக்கத்தை உருவாக்குவதற்கும் வரைவதற்கும் உதவுதல்.
  • உரையாடல் (Dialogue): இயல்பான மற்றும் ஒத்திசைவான உரையாடல்களில் ஈடுபடுதல்.
  • தர்க்கரீதியான பகுத்தறிதல் (Logical Reasoning): விலக்கு (deductive) மற்றும் தூண்டல் (inductive) பகுத்தறிதல் தேவைப்படும் சிக்கல்களைத் தீர்ப்பது.
  • சிக்கலான கணக்கீடுகள் (Complex Calculations): சிக்கலான கணித கணக்கீடுகளைச் செய்தல்.

ERNIE X1-ன் கருவிகளைப் பயன்படுத்தும் திறன் ஒரு குறிப்பிடத்தக்க வேறுபாடு ஆகும். அதன் செயல்திறனை மேம்படுத்தவும் மேலும் விரிவான தீர்வுகளை வழங்கவும் பல்வேறு கருவிகளைப் பயன்படுத்தலாம். இந்த கருவிகள் பின்வருமாறு:

  • மேம்பட்ட தேடல் (Advanced Search): தேடுபொறிகளிலிருந்து தகவல்களை அணுகுதல் மற்றும் மீட்டெடுத்தல்.
  • கொடுக்கப்பட்ட ஆவணத்தில் கேள்வி பதில் (Q&A on Given Document): ஒரு குறிப்பிட்ட ஆவணத்தின் உள்ளடக்கத்தின் அடிப்படையில் கேள்விகளுக்கு பதிலளித்தல்.
  • பட புரிதல் (Image Understanding): காட்சி தகவலை பகுப்பாய்வு செய்தல் மற்றும் விளக்குதல்.
  • AI பட உருவாக்கம் (AI Image Generation): உரை விளக்கங்களின் அடிப்படையில் புதிய படங்களை உருவாக்குதல்.
  • குறியீடு விளக்குதல் (Code Interpreting): கணினி குறியீட்டைப் புரிந்துகொள்வது மற்றும் செயல்படுத்துவது.
  • வலைப்பக்க வாசிப்பு (Webpage Reading): வலைப்பக்கங்களிலிருந்து தகவல்களைப் பிரித்தெடுத்தல்.
  • ட்ரீமைண்ட் மேப்பிங் (TreeMind Mapping): மைண்ட் மேப்களை உருவாக்குதல் மற்றும் கையாளுதல்.
  • பாய்டு கல்வி தேடல் (Baidu Academic Search): பாய்டுவின் கல்வி தேடுபொறியிலிருந்து தகவல்களை அணுகுதல் மற்றும் மீட்டெடுத்தல்.
  • வணிக தகவல் தேடல் (Business Information Search): வணிகங்கள் மற்றும் நிறுவனங்களைப் பற்றிய தகவல்களைச் சேகரித்தல்.
  • உரிமையாளர் தகவல் தேடல் (Franchise Information Search): உரிமையாளர் வாய்ப்புகள் தொடர்பான தகவல்களை மீட்டெடுத்தல்.

கருவி பயன்பாட்டின் இந்த ஒருங்கிணைப்பு, பல மூலங்களிலிருந்து தகவல்களை அணுகவும் செயலாக்கவும் தேவைப்படும் சிக்கலான, உண்மையான உலக சிக்கல்களைச் சமாளிக்க ERNIE X1-ஐ அனுமதிக்கிறது.

ERNIE X1-ன் மேம்படுத்தப்பட்ட திறன்கள் பல முக்கிய தொழில்நுட்ப முன்னேற்றங்களால் ஆதரிக்கப்படுகின்றன:

  • முற்போக்கான வலுவூட்டல் கற்றல் முறை (Progressive Reinforcement Learning Method): இந்த அணுகுமுறை, படிப்படியாக சவாலான பணிகளின் மூலம் மாடலைப் பயிற்றுவிப்பதை உள்ளடக்குகிறது, இது படிப்படியாக அதன் செயல்திறனை மேம்படுத்த அனுமதிக்கிறது.
  • சிந்தனை மற்றும் செயலின் சங்கிலிகளை ஒருங்கிணைக்கும் எண்ட்-டு-எண்ட் பயிற்சி அணுகுமுறை (End-to-End Training Approach Integrating Chains of Thought and Action): மாடல் வெளியீடுகளை உருவாக்குவது மட்டுமல்லாமல், அந்த வெளியீடுகளை அடைவதில் உள்ள படிகளைப் பற்றியும் சிந்திக்க பயிற்சி அளிக்கப்படுகிறது என்பதை இது பரிந்துரைக்கிறது, இது மேலும் விளக்கக்கூடிய மற்றும் நம்பகமான முடிவுகளுக்கு வழிவகுக்கிறது.
  • ஒருங்கிணைந்த பல அம்ச வெகுமதி அமைப்பு (A Unified Multi-Faceted Reward System): மாடல் பல்வேறு இலக்குகளை அடைவதற்கு வெகுமதி அளிக்கப்படுகிறது என்பதை இது குறிக்கிறது, இது பரந்த அளவிலான திறன்களையும் திறன்களையும் உருவாக்க ஊக்குவிக்கிறது.

இந்த தொழில்நுட்பங்கள் ERNIE X1-ன் சிக்கலான பகுத்தறிவு பணிகளைச் செய்யவும் அதன் சூழலுடன் திறம்பட தொடர்பு கொள்ளவும் பங்களிக்கின்றன.

அணுகல் மற்றும் ஒருங்கிணைப்பு: ERNIE 4.5 மற்றும் X1 ஆகியவற்றை பயனர்களுக்கு கொண்டு வருதல்

பாய்டுவின் அணுகலுக்கான அர்ப்பணிப்பு, ERNIE 4.5 மற்றும் ERNIE X1 ஆகிய இரண்டையும் ERNIE Bot இணையதளம் மூலம் தனிப்பட்ட பயனர்களுக்கு இலவசமாகக் கிடைக்கச் செய்வதற்கான அதன் முடிவில் தெளிவாகிறது. இந்த நடவடிக்கை, இந்த மேம்பட்ட AI மாடல்களின் சக்தியை ஒரு பரந்த பார்வையாளர்கள் நேரடியாக அனுபவிக்க அனுமதிக்கிறது.

நிறுவன பயனர்கள் மற்றும் டெவலப்பர்களுக்கு, ERNIE 4.5 பாய்டு AI கிளவுடின் MaaS தளமான Qianfan-ல் APIகள் மூலம் அணுகக்கூடியது. இந்த தளம் ERNIE 4.5-ன் திறன்களை பரந்த அளவிலான பயன்பாடுகளில் ஒருங்கிணைக்க ஒரு வலுவான மற்றும் அளவிடக்கூடிய உள்கட்டமைப்பை வழங்குகிறது. Qianfan-ல் ERNIE 4.5-க்கான விலை நிர்ணயம் மிகவும் போட்டித்தன்மை வாய்ந்தது, உள்ளீட்டு விலைகள் ஆயிரம் டோக்கன்களுக்கு RMB 0.004-ல் தொடங்கி வெளியீட்டு விலைகள் ஆயிரம் டோக்கன்களுக்கு RMB 0.016 ஆக உள்ளன. ERNIE X1 விரைவில் Qianfan தளத்தில் கிடைக்கும், இது நிறுவன பயனர்களுக்கான விருப்பங்களை மேலும் விரிவுபடுத்துகிறது.

பாய்டு தனது பரந்த தயாரிப்பு சுற்றுச்சூழல் அமைப்பில் ERNIE 4.5 மற்றும் X1 ஆகிய இரண்டையும் படிப்படியாக ஒருங்கிணைக்க திட்டமிட்டுள்ளது. இந்த ஒருங்கிணைப்பு பல்வேறு பாய்டு சலுகைகளை உள்ளடக்கும், அவற்றுள்:

  • பாய்டு தேடல் (Baidu Search): மேம்பட்ட AI திறன்களுடன் தேடல் அனுபவத்தை மேம்படுத்துதல்.
  • வென்சியாயன் செயலி (Wenxiaoyan App): பாய்டுவின் பிரபலமான எழுத்து உதவி செயலியில் மாடல்களை ஒருங்கிணைத்தல்.
  • பிற சலுகைகள் (Other Offerings): ERNIE 4.5 மற்றும் X1-ன் வரம்பை மற்ற பாய்டு தயாரிப்புகள் மற்றும் சேவைகளுக்கு விரிவுபடுத்துதல்.

இந்த பரவலான ஒருங்கிணைப்பு, இந்த மேம்பட்ட AI மாடல்களின் நன்மைகள் பரந்த அளவிலான பயனர் அனுபவங்களில் உணரப்படுவதை உறுதி செய்யும்.

இந்த முன்னேற்றங்கள் செயற்கை நுண்ணறிவு துறையில் ஒரு குறிப்பிடத்தக்க படியை முன்வைக்கின்றன. பன்முகத்திறன் புரிதல் மற்றும் ஆழமான சிந்தனை பகுத்தறிதல் ஆகிய இரண்டிலும் கவனம் செலுத்துவதன் மூலம், பாய்டு AI திறனின் வெவ்வேறு அம்சங்களை நிவர்த்தி செய்யும் இரண்டு சக்திவாய்ந்த மாடல்களை உருவாக்கியுள்ளது. இலவச பொது அணுகல் மற்றும் நிறுவன பயனர்களுக்கான போட்டி விலை நிர்ணயம் மூலம் அணுகலுக்கான அர்ப்பணிப்பு, இந்த முன்னேற்றங்கள் பரந்த தாக்கத்தை ஏற்படுத்தும் என்பதை உறுதி செய்கிறது. இந்த மாடல்களை பாய்டுவின் தயாரிப்பு சுற்றுச்சூழல் அமைப்பில் ஒருங்கிணைப்பது, நிறுவனத்தின் AI உத்தியின் முக்கிய கூறுகளாக அவற்றின் நிலையை மேலும் பலப்படுத்துகிறது. செயற்கை நுண்ணறிவு, தரவு மையங்கள் மற்றும் கிளவுட் உள்கட்டமைப்பு ஆகியவற்றில் தொடர்ச்சியான முதலீடு, AI திறன்களை மேம்படுத்துவதற்கும் எதிர்காலத்தில் இன்னும் புத்திசாலித்தனமான மற்றும் சக்திவாய்ந்த அடுத்த தலைமுறை மாடல்களை உருவாக்குவதற்கும் பாய்டுவின் அர்ப்பணிப்பை அடிக்கோடிட்டுக் காட்டுகிறது.