டீப்சீக்: AI உலகில் ஒரு புயல்?

டீப்சீக் அறிமுகம்: நிறுவனத்தைப் பற்றிய ஒரு நெருக்கமான பார்வை

DeepSeek, முறையாக DeepSeek Artificial Intelligence Fundamental Technology Research Co., Ltd. என பதிவுசெய்யப்பட்டுள்ளது, ஜூலை 2023 இல் அதிகாரப்பூர்வமாக രംഗപ്രവേശം ചെയ്തു. நிறுவனம் தன்னை தொழில்நுட்ப ஸ்டார்ட்அப்களின் உலகில் ஒரு முன்னோடி சக்தியாக நிலைநிறுத்துகிறது, பெரிய மொழி மாதிரிகள் (LLMs) மற்றும் அவற்றை இயக்கும் தொடர்புடைய தொழில்நுட்பங்களின் அதிநவீனத்தை உருவாக்குவதிலும் மேம்படுத்துவதிலும் ஒரு லேசர் கவனம் செலுத்துகிறது. AI துறையில் சாத்தியமானவற்றின் எல்லைகளைத் தாண்டுவதே அவர்களின் நோக்கம்.

நிறுவனத்தின் பயணம் அதற்கு முந்தைய ஆண்டு ஜனவரியில் ‘DeepSeek LLM,’ என்ற பெயரிடப்பட்ட அதன் தொடக்க மாதிரியை வெளியிட்டதன் மூலம் தொடங்கியது. அந்த ஆரம்ப முயற்சிக்குப் பிறகு, டீப்சீக் விரைவான மறு செய்கை மற்றும் தொடர்ச்சியான முன்னேற்றத்திற்கான அர்ப்பணிப்பை நிரூபித்துள்ளது. நிறுவனம் அதன் மாதிரிகளை பல சுற்று சுத்திகரிப்புக்கு உட்படுத்தியுள்ளது, தொடர்ந்து அவற்றின் திறன்களையும் செயல்திறனையும் மேம்படுத்த முயல்கிறது.

டீப்சீக்கின் பாதையில் ஒரு குறிப்பிடத்தக்க மைல்கல் டிசம்பரில் நிகழ்ந்தது, ஸ்டார்ட்அப் அதன் திறந்த மூல LLM ஆன ‘V3’ ஐ வெளியிட்டது. அமெரிக்க ஊடகங்களில் பரவி வரும் அறிக்கைகளின்படி, இந்த மாதிரி ஒரு குறிப்பிடத்தக்க சாதனையை நிகழ்த்தியது: இது செயல்திறன் அளவுகோல்களில் மெட்டாவின் அனைத்து திறந்த மூல LLM களையும் மிஞ்சியது. இந்த சாதனை மட்டுமே குறிப்பிடத்தக்கதாக இருக்கும், ஆனால் அறிக்கைகள் மேலும் ‘V3’ AI தொழில்நுட்பத்தின் முன்னணியில் கருதப்படும் OpenAI இன் மூடிய மூல GPT4-o உடன் கூட போட்டியிட்டதாகக் கூறின. இது டீப்சீக்கை வெளிச்சத்திற்கு கொண்டு வந்தது, வளர்ந்து வரும் இந்த நிறுவனத்தை கவனிக்க தொழில்துறையை கட்டாயப்படுத்தியது.

டீப்சீக்கின் அணுகுமுறையை மிகவும் புதிரானதாகவும், சீர்குலைக்கும் சாத்தியமுள்ளதாகவும் மாற்றுவது எது என்பதை ஆழமாக ஆராய்வோம்:

திறன் முன்னுதாரணம்:

டீப்சீக்கின் கூற்றுக்களின் மிகவும் கட்டாயமான அம்சங்களில் ஒன்று அதன் செயல்திறன் மீதான அழுத்தம். பெரிய மொழி மாதிரிகளின் வளர்ச்சி மற்றும் பயிற்சி ஆகியவை மோசமான வள-தீவிர செயல்முறைகள். அவற்றுக்கு பொதுவாக அதிக அளவு கணினி சக்தி தேவைப்படுகிறது, பெரும்பாலும் GPUகள் (கிராபிக்ஸ் செயலாக்க அலகுகள்) அல்லது TPUகள் (டென்சர் செயலாக்க அலகுகள்) போன்ற சிறப்பு வன்பொருள் சம்பந்தப்பட்டிருக்கும், மேலும் கணிசமான அளவு ஆற்றலைப் பயன்படுத்துகின்றன. இது கணிசமான நிதிச் செலவுகளுக்கு வழிவகுக்கிறது, அதிநவீன AI மாடல்களை உருவாக்க விரும்பும் பல நிறுவனங்களுக்கு நுழைவதற்கு அதிக தடையை உருவாக்குகிறது.

தொழில்துறை தலைவர்களுடன் ஒப்பிடக்கூடிய செயல்திறனை வளங்களின் ஒரு ‘பின்னத்தை’ பயன்படுத்தும் போது அடைய முடியும் என்ற டீப்சீக்கின் கூற்று ஒரு கேம்-சேஞ்சர். இது உண்மையாக இருந்தால், டீப்சீக் அதன் மாதிரிகளின் மிகவும் திறமையான பயிற்சி மற்றும் செயல்பாட்டை அனுமதிக்கும் புதுமையான நுட்பங்கள் அல்லது கட்டமைப்புகளை உருவாக்கியுள்ளது என்று கூறுகிறது. இது AI வளர்ச்சியின் ஜனநாயகமயமாக்கலுக்கு ஆழமான தாக்கங்களை ஏற்படுத்தக்கூடும், குறைந்த வளங்களைக் கொண்ட சிறிய நிறுவனங்கள் மற்றும் ஆராய்ச்சி குழுக்கள் அதிக அளவில் போட்டியிட உதவும்.

திறந்த மூல நன்மை:

‘V3’ போன்ற சில மாடல்களை டீப்சீக் திறந்த மூலமாக வெளியிட முடிவு செய்ததும் அதன் வளர்ந்து வரும் செல்வாக்கிற்கு பங்களிக்கும் மற்றொரு முக்கிய காரணியாகும். மென்பொருள் மேம்பாட்டு உலகில், திறந்த மூலமானது ஒரு நிரலின் மூலக் குறியீட்டை பொதுமக்களுக்கு இலவசமாகக் கிடைக்கச் செய்வதைக் குறிக்கிறது. இது குறியீட்டை ஆய்வு செய்யவும், மாற்றவும் மற்றும் விநியோகிக்கவும் யாரையும் அனுமதிக்கிறது, சமூகத்திற்குள் ஒத்துழைப்பு மற்றும் கண்டுபிடிப்புகளை வளர்க்கிறது.

திறந்த மூல அணுகுமுறை மூடிய மூல மாதிரியுடன் முரண்படுகிறது, அங்கு மூலக் குறியீடு தனியுரிமையாக வைக்கப்பட்டு அணுகல் கட்டுப்படுத்தப்படுகிறது. மூடிய மூல மாதிரிகள் அறிவுசார் சொத்து மீதான அதிக கட்டுப்பாடு போன்ற சில நன்மைகளை வழங்க முடியும் என்றாலும், திறந்த மூல இயக்கம் சமீபத்திய ஆண்டுகளில், குறிப்பாக AI துறையில் குறிப்பிடத்தக்க வேகத்தைப் பெற்றுள்ளது.

திறந்த மூலத்தை ஏற்றுக்கொள்வதன் மூலம், டீப்சீக் மிகவும் வெளிப்படையான மற்றும் கூட்டு AI சுற்றுச்சூழல் அமைப்புக்கு பங்களிக்கிறது. இது உலகெங்கிலும் உள்ள ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்களை அதன் மாதிரிகளை ஆராயவும், சாத்தியமான பலவீனங்களை அடையாளம் காணவும், அவற்றின் முன்னேற்றத்திற்கு பங்களிக்கவும் அனுமதிக்கிறது. இந்த கூட்டு அணுகுமுறை கண்டுபிடிப்புகளின் வேகத்தை துரிதப்படுத்தலாம் மற்றும் மிகவும் வலுவான மற்றும் நம்பகமான AI அமைப்புகளின் வளர்ச்சிக்கு வழிவகுக்கும்.

சீனா காரணி:

AI துறையில் டீப்சீக் ஒரு முக்கிய நிறுவனமாக உருவெடுத்திருப்பது, இந்தத் துறையில் சீனாவின் வளர்ந்து வரும் முக்கியத்துவத்தையும் எடுத்துக்காட்டுகிறது. சமீபத்திய ஆண்டுகளில், சீனா AI ஆராய்ச்சி மற்றும் மேம்பாட்டில் கணிசமான முதலீடுகளைச் செய்துள்ளது, இந்த மூலோபாய முக்கியத்துவம் வாய்ந்த தொழில்நுட்பத்தில் உலகளாவிய தலைவராக மாறுவதை நோக்கமாகக் கொண்டுள்ளது.

சீன நிறுவனங்கள் மற்றும் ஆராய்ச்சி நிறுவனங்கள் இயற்கை மொழி செயலாக்கம், கணினி பார்வை மற்றும் இயந்திர கற்றல் போன்ற துறைகளில் விரைவான முன்னேற்றம் அடைந்துள்ளன. டீப்சீக்கின் வெற்றி சீன AI சுற்றுச்சூழல் அமைப்பின் வளர்ந்து வரும் திறன்களுக்கும், மேற்கத்திய நாடுகளில் நிறுவப்பட்ட நிறுவனங்களின் ஆதிக்கத்திற்கு சவால் விடும் அதன் திறனுக்கும் ஒரு சான்றாகும்.

சாத்தியமான பயன்பாடுகள் மற்றும் தாக்கங்கள்:

டீப்சீக் செய்த முன்னேற்றங்கள் பரந்த அளவிலான பயன்பாடுகளுக்கு தொலைநோக்கு தாக்கங்களைக் கொண்டுள்ளன. பெரிய மொழி மாதிரிகள் பல்வேறு தொழில்களை மாற்றும் பல AI-இயங்கும் கருவிகள் மற்றும் சேவைகளின் அடித்தளமாக உள்ளன. சில உதாரணங்கள்:

  • இயற்கை மொழி புரிதல்: LLMகள் சாட்போட்கள், விர்ச்சுவல் அசிஸ்டென்ட்கள் மற்றும் மனித மொழியைப் புரிந்துகொண்டு பதிலளிக்க வேண்டிய பிற பயன்பாடுகளுக்குப் பயன்படுத்தப்படலாம்.
  • உரை உருவாக்கம்: LLMகள் கவிதைகள், குறியீடு, ஸ்கிரிப்ட்கள், இசைத் துண்டுகள், மின்னஞ்சல், கடிதங்கள் போன்ற பல்வேறு ஆக்கப்பூர்வமான உரை வடிவங்களை உருவாக்கலாம் மற்றும் உங்கள் கேள்விகளுக்கு ஒரு தகவல் வழியில் பதிலளிக்கலாம்.
  • இயந்திர மொழிபெயர்ப்பு: வெவ்வேறு மொழிகளுக்கு இடையில் உரையை அதிக துல்லியம் மற்றும் சரளத்துடன் மொழிபெயர்க்க LLMகளைப் பயன்படுத்தலாம்.
  • குறியீடு உருவாக்கம்: குறியீடு துணுக்குகளை உருவாக்குதல், குறியீட்டை நிறைவு செய்தல் மற்றும் குறியீட்டை பிழைத்திருத்தம் செய்தல் மூலம் மென்பொருள் உருவாக்குநர்களுக்கு உதவ LLMகள் பெருகிய முறையில் பயன்படுத்தப்படுகின்றன.
  • அறிவியல் ஆராய்ச்சி: பெரிய தரவுத்தொகுப்புகளை பகுப்பாய்வு செய்யவும், வடிவங்களை அடையாளம் காணவும், கருதுகோள்களை உருவாக்கவும் LLMகளைப் பயன்படுத்தலாம், இது அறிவியல் கண்டுபிடிப்புகளின் வேகத்தை துரிதப்படுத்துகிறது.

LLM தொழில்நுட்பத்தில் டீப்சீக்கின் முன்னேற்றங்கள் இந்த பயன்பாடுகளின் செயல்திறன் மற்றும் திறனை மேம்படுத்தக்கூடும், இது மிகவும் சக்திவாய்ந்த மற்றும் அணுகக்கூடிய AI-இயங்கும் கருவிகளுக்கு வழிவகுக்கும்.

சவால்கள் மற்றும் பரிசீலனைகள்:

டீப்சீக்கின் முன்னேற்றம் சந்தேகத்திற்கு இடமின்றி ஈர்க்கக்கூடியதாக இருந்தாலும், முன்னால் இருக்கும் சவால்கள் மற்றும் பரிசீலனைகளை ஒப்புக்கொள்வது முக்கியம்.

  • கூற்றுக்களின் சரிபார்ப்பு: டீப்சீக்கின் மாதிரிகளின் செயல்திறன் மற்றும் திறன் பற்றிய கூற்றுக்கள் பரந்த AI ஆராய்ச்சி சமூகத்தால் சுயாதீனமாக சரிபார்க்கப்பட வேண்டும். இந்த கூற்றுக்களின் துல்லியம் மற்றும் நம்பகத்தன்மையை உறுதிப்படுத்த கடுமையான சோதனை மற்றும் அளவுகோல் அவசியம்.
  • நெறிமுறை பரிசீலனைகள்: எந்தவொரு சக்திவாய்ந்த AI தொழில்நுட்பத்தையும் போலவே, LLMகளின் வளர்ச்சி மற்றும் வரிசைப்படுத்தல் முக்கியமான நெறிமுறை பரிசீலனைகளை எழுப்புகிறது. சார்பு, நியாயம், வெளிப்படைத்தன்மை மற்றும் பொறுப்புக்கூறல் போன்ற சிக்கல்கள் கவனமாக கையாளப்பட வேண்டும், இந்த மாதிரிகள் பொறுப்புடன் பயன்படுத்தப்படுவதையும், ஏற்கனவே உள்ள சமூக ஏற்றத்தாழ்வுகளை நிலைநிறுத்தவோ அல்லது பெருக்கவோ கூடாது என்பதையும் உறுதிப்படுத்த வேண்டும்.
  • போட்டி மற்றும் ஒத்துழைப்பு: டீப்சீக்கின் தோற்றம் AI நிலப்பரப்பில் போட்டியை தீவிரப்படுத்தும். போட்டி கண்டுபிடிப்புகளை ஊக்குவிக்கும் அதே வேளையில், முன்னேற்றத்தை துரிதப்படுத்தவும், AI ஆல் ஏற்படும் நெறிமுறை மற்றும் சமூக சவால்களை எதிர்கொள்ளவும் ஒத்துழைப்பு மற்றும் அறிவு பகிர்வை வளர்ப்பது முக்கியம்.
  • பாதுகாப்பு கவலைகள்: திறந்த மூல மாதிரிகளின் பயன்பாடு சில பாதுகாப்பு சிக்கல்களைக் கொண்டு வரலாம். மூல குறியீடு அனைவருக்கும் கிடைப்பதால், தீங்கிழைக்கும் நபர்கள் அறியப்படாத சில பிழைகளைப் பயன்படுத்திக் கொள்ளலாம்.

டீப்சீக்கின் தொழில்நுட்ப அணுகுமுறை பற்றிய ஆழமான பார்வை (ஊகமானது):

டீப்சீக் அதன் தொழில்நுட்ப கண்டுபிடிப்புகளின் துல்லியமான விவரங்களை பகிரங்கமாக வெளியிடவில்லை என்றாலும், AI ஆராய்ச்சியில் தற்போதைய போக்குகளின் அடிப்படையில் அவர்கள் ஆராயக்கூடிய சில சாத்தியமான வழிகளைப் பற்றி நாம் ஊகிக்க முடியும்:

  • மாதிரி கட்டமைப்பு உகப்பாக்கம்: டீப்சீக் கணக்கீடு மற்றும் நினைவக பயன்பாட்டின் அடிப்படையில் மிகவும் திறமையான நாவல் மாதிரி கட்டமைப்புகளை உருவாக்கியிருக்கலாம். இதில் போன்ற நுட்பங்கள் இருக்கலாம்:

    • Sparse Attention Mechanisms: டிரான்ஸ்பார்மர்களில் உள்ள பாரம்பரிய attention mechanisms (LLMகளுக்கான மேலாதிக்க கட்டமைப்பு) ஒரு வரிசையில் உள்ள அனைத்து ஜோடி சொற்களுக்கும் இடையே attention weights கணக்கிட வேண்டும். Sparse attention mechanisms, மறுபுறம், இந்த இணைப்புகளில் ஒரு துணைக்குழுவில் கவனம் செலுத்துகின்றன, கணக்கீட்டு செலவைக் குறைக்கின்றன.
    • Knowledge Distillation: இந்த நுட்பம் ஒரு பெரிய, அதிக சக்திவாய்ந்த ‘ஆசிரியர்’ மாதிரியின் நடத்தையைப் பின்பற்ற ஒரு சிறிய, அதிக திறமையான ‘மாணவர்’ மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்குகிறது.
    • Quantization: இது மாதிரி அளவுருக்களைக் குறிக்கப் பயன்படுத்தப்படும் எண் மதிப்புகளின் துல்லியத்தைக் குறைப்பதை உள்ளடக்குகிறது, இது சிறிய மாதிரி அளவுகள் மற்றும் வேகமான அனுமானத்திற்கு வழிவகுக்கிறது.
  • திறமையான பயிற்சி நுட்பங்கள்: டீப்சீக் தங்கள் மாதிரிகளை மிகவும் திறமையாக பயிற்றுவிக்க அனுமதிக்கும் மேம்பட்ட பயிற்சி நுட்பங்களைப் பயன்படுத்தலாம். இதில் அடங்கும்:

    • Gradient Accumulation: இந்த நுட்பம் வரையறுக்கப்பட்ட நினைவகம் கொண்ட வன்பொருளில் கூட, பெரிய பயனுள்ள தொகுதி அளவுகளுடன் பயிற்சி அளிக்க அனுமதிக்கிறது.
    • Mixed Precision Training: இது பயிற்சி செயல்முறையின் சில பகுதிகளுக்கு குறைந்த துல்லியமான எண் வடிவங்களைப் பயன்படுத்துவதை உள்ளடக்குகிறது, துல்லியத்தை கணிசமாக தியாகம் செய்யாமல் கணக்கீட்டை துரிதப்படுத்துகிறது.
    • Data Augmentation: இது பயிற்சி தொகுப்பின் அளவு மற்றும் பன்முகத்தன்மையை அதிகரிக்க செயற்கை பயிற்சி தரவை உருவாக்குவதை உள்ளடக்குகிறது, மாதிரி பொதுமைப்படுத்தலை மேம்படுத்துகிறது.
  • வன்பொருள் உகப்பாக்கம்: டீப்சீக் சிறப்பு வன்பொருளைப் பயன்படுத்தலாம் அல்லது ஏற்கனவே உள்ள வன்பொருளின் முழுப் பலனைப் பெற அதன் மென்பொருளை மேம்படுத்தலாம். இதில் அடங்கும்:

    • Custom Hardware Accelerators: AI பணிச்சுமைகளுக்கு ஏற்ப தனிப்பயன் சில்லுகளை வடிவமைத்தல்.
    • Efficient Compiler Optimizations: குறிப்பிட்ட வன்பொருளில் செயல்படுத்துவதற்கான உயர்-நிலை மாதிரி விளக்கங்களை குறைந்த-நிலை இயந்திர குறியீடாக மொழிபெயர்க்கும் மென்பொருளை மேம்படுத்துதல்.

இவை வெறும் ஊக சாத்தியக்கூறுகள் மட்டுமே, மேலும் டீப்சீக்கின் கண்டுபிடிப்புகளின் உண்மையான அளவு இன்னும் முழுமையாக வெளியிடப்படவில்லை. இருப்பினும், அவர்கள் LLM வளர்ச்சியில் சாத்தியமானவற்றின் எல்லைகளைத் தள்ளுகிறார்கள் என்பது தெளிவாகிறது, மேலும் அவர்களின் முன்னேற்றம் AI சமூகத்தால் உன்னிப்பாகக் கவனிக்கப்படும்.