டீப்சீக்கின் OpenAI சாயல்: வெளிப்படுத்தப்பட்டதா?

டீப்சீக்-R1 இன் பயிற்சி மூலங்களை வெளிப்படுத்துதல்

AI கண்டறிதல் மற்றும் நிர்வாகத்தில் நிபுணத்துவம் பெற்ற நிறுவனமான காப்பிலீக்ஸ் (Copyleaks) நடத்திய சமீபத்திய ஆராய்ச்சி, டீப்சீக்-R1 (DeepSeek-R1) OpenAI இன் மாதிரியில் பயிற்சி பெற்றதா என்ற கேள்விக்கு திட்டவட்டமான பதிலைக் காட்டுகிறது: ஆம். டீப்சீக், இலவசமாகக் கிடைக்கக்கூடிய AI-இயங்கும் சாட்போட் (chatbot), அதன் தோற்றம், உணர்வு மற்றும் செயல்பாடு ஆகியவற்றில் ChatGPT உடன் குறிப்பிடத்தக்க ஒற்றுமையைக் கொண்டுள்ளது.

கைரேகை நுட்பம்: உருவாக்கும் AI-ஐ அடையாளம் காணுதல்

AI-உருவாக்கிய உரையின் தோற்றம் குறித்து வெளிச்சம் போட, ஆராய்ச்சியாளர்கள் ஒரு புதுமையான உரை கைரேகை கருவியை உருவாக்கினர். கொடுக்கப்பட்ட உரையை உருவாக்க காரணமான குறிப்பிட்ட AI மாதிரியை தீர்மானிக்க இந்தக் கருவி வடிவமைக்கப்பட்டுள்ளது. ஆராய்ச்சியாளர்கள் ஆயிரக்கணக்கான AI-உருவாக்கிய மாதிரிகளின் பரந்த தரவுத்தொகுப்பைப் பயன்படுத்தி கருவியை கவனமாகப் பயிற்றுவித்தனர். பின்னர், அவர்கள் அதை அறியப்பட்ட AI மாதிரிகளைப் பயன்படுத்தி சோதனைக்கு உட்படுத்தினர், மேலும் முடிவுகள் சந்தேகத்திற்கு இடமின்றி இருந்தன.

வியக்க வைக்கும் ஒற்றுமை: டீப்சீக்-R1 மற்றும் OpenAI

சோதனை ஒரு கட்டாய புள்ளிவிவரத்தை வெளிப்படுத்தியது: டீப்சீக்-R1 ஆல் உருவாக்கப்பட்ட உரைகளில் கணிசமான 74.2 சதவீதம் OpenAI இன் வெளியீட்டுடன் பாணியில் பொருந்தியதைக் காட்டியது. இந்த வலுவான தொடர்பு டீப்சீக் அதன் பயிற்சி கட்டத்தில் OpenAI இன் மாதிரியை இணைத்ததாக வலுவாக பரிந்துரைக்கிறது.

அணுகுமுறையில் ஒரு வேறுபாடு: மைக்ரோசாப்டின் ஃபை-4 (Phi-4)

ஒரு மாறுபட்ட கண்ணோட்டத்தை வழங்க, மைக்ரோசாப்டின் ஃபை-4 மாதிரியைக் கவனியுங்கள். அதே சோதனையில், ஃபை-4 அறியப்பட்ட எந்த மாதிரியுடனும் குறிப்பிடத்தக்க 99.3 சதவீத ‘கருத்து வேறுபாட்டை’ நிரூபித்தது. இந்த முடிவு சுதந்திரமான பயிற்சிக்கான கட்டாய ஆதாரமாக செயல்படுகிறது, ஃபை-4 ஏற்கனவே உள்ள மாதிரிகளை நம்பாமல் உருவாக்கப்பட்டது என்பதைக் குறிக்கிறது. ஃபை-4 இன் சுதந்திரமான தன்மைக்கும் டீப்சீக்கின் OpenAI உடனான அதிகப்படியான ஒற்றுமைக்கும் இடையிலான அப்பட்டமான வேறுபாடு, பிந்தையது வெளிப்படையான நகலெடுப்பு அல்லது நகலெடுப்பதை அடிக்கோடிட்டுக் காட்டுகிறது.

நெறிமுறை மற்றும் அறிவுசார் சொத்துரிமை கவலைகள்

இந்த வெளிப்பாடு டீப்சீக்-R1 இன் OpenAI இன் மாதிரியுடன் நெருக்கமான ஒற்றுமை குறித்து கடுமையான கவலைகளை எழுப்புகிறது. இந்த கவலைகள் பல முக்கியமான பகுதிகளை உள்ளடக்கியது:

  • தரவு ஆதாரம்: டீப்சீக்-R1 ஐப் பயிற்றுவிக்கப் பயன்படுத்தப்படும் தரவின் தோற்றம் ஒரு முக்கியமான கேள்வியாகிறது.
  • அறிவுசார் சொத்துரிமை: OpenAI இன் அறிவுசார் சொத்துரிமைகளின் சாத்தியமான மீறல் ஒரு குறிப்பிடத்தக்க கவலையாகும்.
  • வெளிப்படைத்தன்மை: டீப்சீக்கின் பயிற்சி முறையைப் பற்றிய வெளிப்படைத்தன்மை இல்லாதது நெறிமுறை கேள்விகளை எழுப்புகிறது.

ஆராய்ச்சிக் குழு மற்றும் வழிமுறை

யெஹோனாடன் பிட்டன் (Yehonatan Bitton), ஷாய் நிசான் (Shai Nisan) மற்றும் எலாட் பிட்டன் (Elad Bitton) ஆகியோரின் தலைமையில் காப்பிலீக்ஸ் தரவு அறிவியல் குழு இந்த அற்புதமான ஆராய்ச்சியை நடத்தியது. அவர்களின் வழிமுறை ‘ஒருமனதான நடுவர்’ அணுகுமுறையை மையமாகக் கொண்டது. இந்த அணுகுமுறை மூன்று தனித்துவமான கண்டறிதல் அமைப்புகளை உள்ளடக்கியது, ஒவ்வொன்றும் AI-உருவாக்கிய உரைகளை வகைப்படுத்தும் பணியை மேற்கொண்டன. மூன்று அமைப்புகளும் உடன்படும்போது மட்டுமே ஒரு முடிவான தீர்ப்பு எட்டப்பட்டது.

செயல்பாட்டு மற்றும் சந்தை தாக்கங்கள்

நெறிமுறை மற்றும் அறிவுசார் சொத்துரிமை கவலைகளுக்கு அப்பால், கருத்தில் கொள்ள வேண்டிய நடைமுறை செயல்பாட்டு தாக்கங்களும் உள்ளன. ஏற்கனவே உள்ள மாதிரிகளை வெளிப்படுத்தப்படாத சார்பு பல சிக்கல்களுக்கு வழிவகுக்கும்:

  • சார்புகளை வலுப்படுத்துதல்: அசல் மாதிரியில் இருக்கும் சார்புகள் நிலைத்திருக்கலாம்.
  • வரையறுக்கப்பட்ட பன்முகத்தன்மை: வெளியீடுகளின் பன்முகத்தன்மை கட்டுப்படுத்தப்படலாம், இது புதுமைகளைத் தடுக்கிறது.
  • சட்ட மற்றும் நெறிமுறை அபாயங்கள்: எதிர்பாராத சட்ட அல்லது நெறிமுறை சிக்கல்கள் ஏற்படலாம்.

மேலும், டீப்சீக்கின் புரட்சிகரமான, செலவு குறைந்த பயிற்சி முறையின் கூற்றுக்கள், OpenAI இன் தொழில்நுட்பத்தின் அங்கீகரிக்கப்படாத வடிகட்டுதலை அடிப்படையாகக் கொண்டவை எனக் கண்டறியப்பட்டால், குறிப்பிடத்தக்க சந்தை விளைவுகளை ஏற்படுத்தக்கூடும். இது NVIDIA வின் ஒரு நாள் இழப்பான $593 பில்லியனுக்கு பங்களித்திருக்கலாம் மற்றும் டீப்சீக்கிற்கு நியாயமற்ற போட்டி நன்மையை வழங்கியிருக்கலாம்.

ஒரு கடுமையான அணுகுமுறை: பல வகைப்படுத்திகளை இணைத்தல்

ஆராய்ச்சி முறையானது மிகவும் கடுமையான அணுகுமுறையைப் பயன்படுத்தியது, மூன்று மேம்பட்ட AI வகைப்படுத்திகளை ஒருங்கிணைத்தது. இந்த வகைப்படுத்திகள் ஒவ்வொன்றும் நான்கு முக்கிய AI மாதிரிகளிலிருந்து உரை மாதிரிகளில் கவனமாக பயிற்சி பெற்றன:

  1. கிளாட் (Claude)
  2. ஜெமினி (Gemini)
  3. லாமா (Llama)
  4. OpenAI

இந்த வகைப்படுத்திகள் நுட்பமான பாணி நுணுக்கங்களை அடையாளம் காண வடிவமைக்கப்பட்டுள்ளன, அவற்றுள்:

  • வாக்கிய அமைப்பு: வாக்கியங்களுக்குள் சொற்கள் மற்றும் சொற்றொடர்களின் ஏற்பாடு.
  • சொல்லகராதி: சொற்களின் தேர்வு மற்றும் அவற்றின் அதிர்வெண்.
  • சொற்றொடர்: ஒட்டுமொத்த பாணி மற்றும் வெளிப்பாட்டின் தொனி.

‘ஒருமனதான நடுவர்’ அமைப்பு: துல்லியத்தை உறுதி செய்தல்

‘ஒருமனதான நடுவர்’ அமைப்பு முறையின் முக்கிய அங்கமாக இருந்தது, இது தவறான நேர்மறைகளுக்கு எதிரான வலுவான சோதனையை உறுதி செய்தது. இந்த அமைப்பு மூன்று வகைப்படுத்திகளும் ஒரு வகைப்பாட்டை இறுதியாகக் கருதுவதற்கு முன்பு அதைத் தனித்தனியாக ஒப்புக்கொள்ள வேண்டும். இந்த கடுமையான அளவுகோல் 99.88 சதவீத விதிவிலக்கான துல்லிய விகிதத்தையும், 0.04 சதவீதம் மட்டுமே குறிப்பிடத்தக்க குறைந்த தவறான நேர்மறை விகிதத்தையும் விளைவித்தது. அறியப்பட்ட மற்றும் அறியப்படாத AI மாதிரிகள் இரண்டிலிருந்தும் உரைகளை துல்லியமாக அடையாளம் காணும் திறனை இந்த அமைப்பு நிரூபித்தது.

AI கண்டறிதலுக்கு அப்பால்: மாதிரி-குறிப்பிட்ட பண்புக்கூறு

‘இந்த ஆராய்ச்சியின் மூலம், நாங்கள் அறிந்த பொதுவான AI கண்டறிதலுக்கு அப்பால் மாதிரி-குறிப்பிட்ட பண்புக்கூறுக்கு நகர்ந்துள்ளோம், இது AI உள்ளடக்கத்தை நாம் அணுகும் விதத்தை அடிப்படையாக மாற்றும் ஒரு திருப்புமுனை’ என்று காப்பிலீக்ஸின் தலைமை தரவு விஞ்ஞானி ஷாய் நிசான் கூறினார்.

மாதிரி பண்புக்கூறின் முக்கியத்துவம்

நிசான் இந்த திறனின் முக்கியத்துவத்தை மேலும் வலியுறுத்தினார்: ‘ஒட்டுமொத்த வெளிப்படைத்தன்மையை மேம்படுத்துதல், நெறிமுறை AI பயிற்சி நடைமுறைகளை உறுதி செய்தல் மற்றும் மிக முக்கியமாக, AI தொழில்நுட்பங்களின் அறிவுசார் சொத்துரிமைகளைப் பாதுகாத்தல் மற்றும் அவற்றின் சாத்தியமான தவறான பயன்பாட்டைத் தடுப்பது உள்ளிட்ட பல காரணங்களுக்காக இந்த திறன் முக்கியமானது.’

ஆழமாக ஆராய்தல்: டீப்சீக்கின் அணுகுமுறையின் தாக்கங்கள்

இந்த ஆராய்ச்சியின் கண்டுபிடிப்புகள் டீப்சீக் OpenAI இன் மாதிரியை நகலெடுத்ததா என்ற உடனடி கேள்விக்கு அப்பால் நீட்டிக்கப்படும் தொலைநோக்கு தாக்கங்களைக் கொண்டுள்ளன. இந்த தாக்கங்களில் சிலவற்றை இன்னும் விரிவாக ஆராய்வோம்:

புதுமையின் மாயை

டீப்சீக்கின் பயிற்சி OpenAI இன் மாதிரியை பெரிதும் நம்பியிருந்தால், அது அதன் புதுமையின் உண்மையான அளவு குறித்த கேள்விகளை எழுப்புகிறது. டீப்சீக் தனது சாட்போட்டை ஒரு புதிய உருவாக்கம் என்று முன்வைத்திருக்கலாம் என்றாலும், அடிப்படை தொழில்நுட்பம் ஆரம்பத்தில் கூறப்பட்டதை விட குறைவான புரட்சிகரமானதாக இருக்கலாம். இது உண்மையிலேயே தனித்துவமான AI அமைப்புடன் தொடர்பு கொள்கிறோம் என்று நம்பும் பயனர்களையும் முதலீட்டாளர்களையும் தவறாக வழிநடத்தக்கூடும்.

AI நிலப்பரப்பில் தாக்கம்

மற்ற மாதிரிகளில் பயிற்சி பெற்ற AI மாதிரிகளை பரவலாக ஏற்றுக்கொள்வது AI நிலப்பரப்பில் ஒரு ஒருமைப்படுத்தும் விளைவை ஏற்படுத்தக்கூடும். பல AI அமைப்புகள் இறுதியில் ஒரு சில அடிப்படை மாதிரிகளிலிருந்து பெறப்பட்டால், அது துறையில் உள்ள அணுகுமுறைகள் மற்றும் கண்ணோட்டங்களின் பன்முகத்தன்மையைக் கட்டுப்படுத்தக்கூடும். இது புதுமைகளைத் தடுக்கலாம் மற்றும் குறைவான ஆற்றல்மிக்க மற்றும் போட்டித்தன்மை வாய்ந்த AI சுற்றுச்சூழல் அமைப்புக்கு வழிவகுக்கும்.

அதிக வெளிப்படைத்தன்மைக்கான தேவை

இந்த வழக்கு AI மாதிரிகளின் வளர்ச்சி மற்றும் வரிசைப்படுத்தலில் அதிக வெளிப்படைத்தன்மைக்கான அவசர தேவையை எடுத்துக்காட்டுகிறது. AI அமைப்புகள் எவ்வாறு பயிற்சி அளிக்கப்படுகின்றன மற்றும் எந்த தரவு மூலங்கள் பயன்படுத்தப்படுகின்றன என்பதை பயனர்களும் பங்குதாரர்களும் அறிய தகுதியானவர்கள். இந்த தகவல் இந்த அமைப்புகளின் சாத்தியமான சார்புகள், வரம்புகள் மற்றும் நெறிமுறை தாக்கங்களை மதிப்பிடுவதற்கு முக்கியமானது.

ஒழுங்குமுறையின் பங்கு

டீப்சீக் வழக்கு AI துறையின் அதிக ஒழுங்குமுறையின் தேவை குறித்த விவாதத்தையும் தூண்டக்கூடும். AI டெவலப்பர்கள் நெறிமுறை வழிகாட்டுதல்களைப் பின்பற்றுகிறார்கள், அறிவுசார் சொத்துரிமைகளைப் பாதுகாக்கிறார்கள் மற்றும் வெளிப்படைத்தன்மையை ஊக்குவிக்கிறார்கள் என்பதை உறுதிப்படுத்த அரசாங்கங்களும் ஒழுங்குமுறை அமைப்புகளும் நடவடிக்கைகளை பரிசீலிக்க வேண்டியிருக்கும்.

AI வளர்ச்சியின் எதிர்காலம்

டீப்சீக்கின் பயிற்சி முறைகளைச் சுற்றியுள்ள சர்ச்சை AI வளர்ச்சியின் எதிர்காலம் குறித்த பரந்த விவாதத்திற்கு ஒரு ஊக்கியாக செயல்படக்கூடும். இது சிறந்த நடைமுறைகள், நெறிமுறை பரிசீலனைகள் மற்றும் AI அமைப்புகளை உருவாக்குவதில் அசல் தன்மையின் முக்கியத்துவம் ஆகியவற்றை மறுபரிசீலனை செய்யத் தூண்டலாம்.

பொறுப்பான AI வளர்ச்சிக்கான அழைப்பு

டீப்சீக் வழக்கு பொறுப்பான AI வளர்ச்சியின் முக்கியத்துவத்தை நினைவூட்டுகிறது. இது பின்வருவனவற்றின் தேவையை அடிக்கோடிட்டுக் காட்டுகிறது:

  • அசல் தன்மை: AI டெவலப்பர்கள் ஏற்கனவே உள்ளவற்றை பெரிதும் நம்புவதற்குப் பதிலாக உண்மையிலேயே புதிய மாதிரிகளை உருவாக்க முயற்சிக்க வேண்டும்.
  • வெளிப்படைத்தன்மை: AI அமைப்புகளை உருவாக்கப் பயன்படுத்தப்படும் பயிற்சி தரவு மற்றும் முறைகள் பயனர்களுக்கும் பங்குதாரர்களுக்கும் வெளிப்படுத்தப்பட வேண்டும்.
  • நெறிமுறை பரிசீலனைகள்: AI வளர்ச்சி நெறிமுறை கொள்கைகளால் வழிநடத்தப்பட வேண்டும், இதில் நியாயம், பொறுப்புக்கூறல் மற்றும் அறிவுசார் சொத்துரிமைகளுக்கான மரியாதை ஆகியவை அடங்கும்.
  • ஒத்துழைப்பு: AI சமூகத்திற்குள் திறந்த ஒத்துழைப்பு மற்றும் அறிவு பகிர்வு புதுமைகளை வளர்க்கவும் ஏற்கனவே உள்ள சார்புகளை நகலெடுப்பதை தடுக்கவும் உதவும்.

முன்னோக்கி செல்லும் பாதை: ஒரு மாறுபட்ட மற்றும் நெறிமுறை AI எதிர்காலத்தை உறுதி செய்தல்

புதுமை செழித்து வளரும் மற்றும் பயனர்கள் தாங்கள் தொடர்பு கொள்ளும் அமைப்புகளை நம்பக்கூடிய ஒரு மாறுபட்ட மற்றும் நெறிமுறை AI சுற்றுச்சூழல் அமைப்பை உருவாக்குவதே இறுதி இலக்காக இருக்க வேண்டும். இதற்கு பொறுப்பான AI வளர்ச்சி நடைமுறைகள், வெளிப்படைத்தன்மை மற்றும் இந்த வேகமாக வளர்ந்து வரும் தொழில்நுட்பத்தின் நெறிமுறை தாக்கங்கள் குறித்த தொடர்ச்சியான உரையாடல் ஆகியவற்றிற்கு அர்ப்பணிப்பு தேவைப்படுகிறது. டீப்சீக் வழக்கு ஒரு மதிப்புமிக்க பாடமாக செயல்படுகிறது, ஏற்கனவே உள்ள மாதிரிகளை அதிகமாக நம்பியிருப்பதன் சாத்தியமான ஆபத்துக்களை எடுத்துக்காட்டுகிறது மற்றும் AI முன்னேற்றத்தை தொடரும்போது அசல் தன்மை மற்றும் நெறிமுறை பரிசீலனைகளின் முக்கியத்துவத்தை வலியுறுத்துகிறது. AI இன் எதிர்காலம் இன்று நாம் எடுக்கும் தேர்வுகளைப் பொறுத்தது, மேலும் அனைவருக்கும் ஒரு நன்மை பயக்கும் மற்றும் சமமான எதிர்காலத்தை உறுதிப்படுத்த பொறுப்பான வளர்ச்சிக்கு முன்னுரிமை அளிப்பது முக்கியம்.

காப்பிலீக்ஸ் விசாரணையின் கண்டுபிடிப்புகள் AI வளர்ச்சியின் ஒரு முக்கியமான அம்சத்தை வெளிச்சம் போட்டுக் காட்டியுள்ளன, மேலும் ஒட்டுமொத்த தொழிற்துறையும் இந்த அனுபவத்திலிருந்து கற்றுக்கொண்டு ஒரு வெளிப்படையான, நெறிமுறை மற்றும் புதுமையான எதிர்காலத்தை வளர்ப்பது கட்டாயமாகும்.