ডিপ রিসার্চ টিম: এজেন্টদের চূড়ান্ত রূপ হল সব কাজের জন্য অল-ইন-ওয়ান

OpenAI-এর দ্বিতীয় এজেন্ট

তিন সপ্তাহ আগে, OpenAI তাদের দ্বিতীয় এজেন্ট Deep Research চালু করে। এই এজেন্টটি একাধিক ওয়েবসাইট অনুসন্ধান করতে পারে এবং ৫-৩০ মিনিটের মধ্যে অনলাইনে বিস্তৃত গবেষণা সম্পন্ন করতে পারে, তথ্য সংশ্লেষণ করে এবং উদ্ধৃতিসহ বিস্তারিত রিপোর্ট প্রদান করে।

এই নিবন্ধটি Sequoia Capital-এর সাথে Isa Fulford এবং Josh Tobin-এর একটি সাক্ষাত্কার সংকলন ও সংগঠিত করে, যারা OpenAI-এর Deep Research-এর নেতৃত্ব দিচ্ছেন। এই দুই সদস্য Deep Research-এর পেছনের প্রযুক্তিগত সুনির্দিষ্টতা এবং পণ্যের ভাবনা, সেইসাথে তারা বর্তমানে যে ব্যবহারের ক্ষেত্রগুলি পর্যবেক্ষণ করছেন, তা বিস্তারিতভাবে শেয়ার করেছেন।

Deep Research-এর উদ্ভব OpenAI-এর অভ্যন্তরীণ অনুসন্ধান থেকে, যেখানে মডেলের দীর্ঘমেয়াদী কাজগুলি পরিচালনা করার ক্ষমতা পরীক্ষা করা হচ্ছিল। দলের দীর্ঘমেয়াদী লক্ষ্য হল ভবিষ্যতে ব্যবহারকারীদের চূড়ান্ত এজেন্ট সরবরাহ করা: একটি স্বাভাবিক অল-ইন-ওয়ান সমাধান, যা ওয়েব অনুসন্ধান, কম্পিউটার ব্যবহার, বা অন্য যেকোনো কাজ, যা ব্যবহারকারী এজেন্টকে দিয়ে করাতে চান, তা সম্পন্ন করতে পারবে।

Deep Research-কে পণ্যের স্তরে বিশেষভাবে অপ্টিমাইজ করা হয়েছে। উদাহরণস্বরূপ, আমাদের DeepSeek বিশ্লেষণে যেমন উল্লেখ করা হয়েছে, Deep Research সুস্পষ্ট উদ্ধৃতি এবং Chain-of-Thought (CoT)-এর মাধ্যমে ব্যবহারকারীর বিশ্বাস বাড়ায়। দলটি একটি স্পষ্টীকরণ প্রক্রিয়াও ডিজাইন করেছে যাতে কাজের ধারাবাহিকতা বোঝা যায়। Deep Research তথ্য পুনরুদ্ধার এবং সংগঠনে AI অনুসন্ধান এবং ChatGPT-কে ছাড়িয়ে যায়। তবে, এই পর্যায়ে, Deep Research বিদ্যমান তথ্য থেকে নতুন অন্তর্দৃষ্টি বের করার ক্ষেত্রে ততটা কার্যকর নয় এবং এখনও নতুন বৈজ্ঞানিক আবিষ্কার করতে পারে না।

গুরুত্বপূর্ণ বিষয়গুলি:

  • OpenAI তার দ্বিতীয় এজেন্ট Deep Research চালু করেছে, যা পুঙ্খানুপুঙ্খ অনলাইন অনুসন্ধান করতে সক্ষম।
  • এজেন্টের ক্ষমতা মডেলের এন্ড-টু-এন্ড প্রশিক্ষণ থেকে উদ্ভূত।
  • Deep Research তথ্য সংশ্লেষণ এবং অস্পষ্ট তথ্য খুঁজে বের করার ক্ষেত্রে পারদর্শী।
  • ব্যবহারের ক্ষেত্রগুলি পেশাগত কাজ, ব্যক্তিগত জীবন, প্রোগ্রামিং এবং শিক্ষাকে অন্তর্ভুক্ত করে।
  • দলটি ২০২৫ সালে এজেন্টদের জন্য উল্লেখযোগ্য অগ্রগতির প্রত্যাশা করছে।

এজেন্টের ক্ষমতা মডেলের এন্ড-টু-এন্ড প্রশিক্ষণ থেকে উদ্ভূত

Deep Research হল একটি এজেন্ট যা একাধিক অনলাইন ওয়েবসাইট অনুসন্ধান করতে এবং বিস্তৃত রিপোর্ট তৈরি করতে সক্ষম, যা অনেক কাজ সম্পন্ন করে যা মানুষের করতে কয়েক ঘণ্টা সময় লাগত। ChatGPT-এর মধ্যে কাজ করে, এটি প্রায় ৫-৩০ মিনিটের মধ্যে প্রশ্নের উত্তর দেয়, গভীর গবেষণার সুযোগ দেয় এবং স্ট্যান্ডার্ড ChatGPT-এর চেয়ে আরও বিস্তারিত এবং সুনির্দিষ্ট উত্তর প্রদান করে। OpenAI পূর্বে Operator চালু করেছিল, এবং Deep Research হল এর দ্বিতীয় এজেন্ট, আরও এজেন্ট আসার কথা রয়েছে।

উৎস

প্রায় এক বছর আগে, OpenAI অভ্যন্তরীণভাবে একটি যুক্তিযুক্ত দৃষ্টান্ত (reasoning paradigm) গ্রহণ করা শুরু করে, যার লক্ষ্য ছিল উত্তর দেওয়ার আগে মডেলগুলিকে চিন্তা করতে প্রশিক্ষণ দেওয়া। এই পদ্ধতিটি অত্যন্ত সফল প্রমাণিত হয়েছে।

প্রাথমিকভাবে, OpenAI গণিত এবং বিজ্ঞানের উপর দৃষ্টি নিবদ্ধ করেছিল। যাইহোক, তারা আবিষ্কার করেছে যে এই নতুন যুক্তিযুক্ত মডেল আর্কিটেকচারটি দীর্ঘমেয়াদী কাজগুলি পরিচালনা করার ক্ষমতাও উন্মুক্ত করেছে, যার মধ্যে এজেন্টের ক্ষমতাও রয়েছে।

একই সাথে, OpenAI বুঝতে পেরেছিল যে অনেক কাজের জন্য বিস্তৃত অনলাইন গবেষণা বা বাহ্যিক প্রসঙ্গ, শক্তিশালী যুক্তিযুক্ত ক্ষমতা, তথ্যের উৎসগুলির বিচক্ষণতা এবং কিছুটা সৃজনশীলতার প্রয়োজন হয়। শেষ পর্যন্ত, OpenAI মডেল প্রশিক্ষণের পদ্ধতি তৈরি করেছে যা এই কাজগুলি পরিচালনা করতে সক্ষম। তারা ব্রাউজিং কাজগুলি সম্পাদন করার জন্য মডেলগুলিকে প্রশিক্ষণ দেওয়ার সিদ্ধান্ত নিয়েছে, যুক্তিযুক্ত মডেলগুলিকে প্রশিক্ষণের জন্য ব্যবহৃত একই পদ্ধতি ব্যবহার করে, তবে আরও বাস্তব-বিশ্বের কাজগুলিতে প্রয়োগ করে।

Deep Research প্রকল্পটি Isa Fulford এবং Yash Patil-এর একটি মূল ডেমো দিয়ে শুরু হয়েছিল। Josh Tobin প্রায় ছয় মাস আগে একটি স্টার্টআপে কাজ করার পর OpenAI-তে ফিরে আসেন, এই মৌলিক কাজের প্রতি গভীরভাবে আগ্রহী হয়ে ওঠেন এবং Deep Research প্রকল্পে যোগদান করেন।

মূল ব্যক্তি:

  • Isa Fulford: OpenAI-এর Post-training টিমের AI গবেষক, ChatGPT Retrieval Plugin-এর একজন প্রধান অবদানকারী।
  • Yash Patil: OpenAI-এর Post-training টিমের কোর মডেল টিমের সদস্য, স্ট্যানফোর্ড থেকে ড্রপ আউট হয়েছেন।
  • Josh Tobin: পূর্বে OpenAI-তে একজন Research Scientist ছিলেন, পরে Gantry (বিশ্লেষণ, সতর্কতা এবং মানুষের প্রতিক্রিয়ার মাধ্যমে ML উন্নত করার একটি পণ্য) প্রতিষ্ঠা করেন। তিনি OpenAI-তে ফিরে আসেন এবং বর্তমানে Agents প্রোডাক্ট রিসার্চ টিমের নেতৃত্ব দিচ্ছেন।

স্পষ্টীকরণ প্রক্রিয়া (Clarification Flow)

Deep Research-এর একটি অনন্য ডিজাইন রয়েছে: স্পষ্টীকরণ প্রক্রিয়া। গবেষণা শুরু করার আগে, Deep Research মডেল ব্যবহারকারীকে প্রশ্ন জিজ্ঞাসা করে। সাধারণত, ChatGPT শুধুমাত্র উত্তরের শেষে ফলো-আপ প্রশ্ন জিজ্ঞাসা করে বা উত্তরটি সন্তোষজনক কিনা তা জানতে চায়, Deep Research-এর মতো নয়, যা এই আচরণটি শুরুতেই করে।

এটি দলের একটি ইচ্ছাকৃত ডিজাইন পছন্দ ছিল। ব্যবহারকারীরা Deep Research মডেল থেকে সেরা প্রতিক্রিয়া তখনই পান যখন তাদের প্রম্পটগুলি খুব স্পষ্ট এবং বিস্তারিত হয়। যাইহোক, ব্যবহারকারীরা প্রায়শই তাদের প্রাথমিক প্রম্পটে সমস্ত তথ্য সরবরাহ করেন না। অতএব, OpenAI নিশ্চিত করতে চেয়েছিল যে ৫ বা ৩০ মিনিট অপেক্ষা করার পরে, ব্যবহারকারীরা একটি যথেষ্ট বিস্তারিত এবং সন্তোষজনক উত্তর পাবেন। মডেলের জন্য প্রয়োজনীয় সমস্ত বিবরণ ব্যবহারকারীরা সরবরাহ করছেন তা নিশ্চিত করার জন্য এই অতিরিক্ত পদক্ষেপটি যুক্ত করা হয়েছিল।

X-এর অনেক ব্যবহারকারী তাদের প্রম্পটগুলিকে পরিমার্জিত করার জন্য প্রথমে o1 বা o1 Pro-এর সাথে ইন্টারঅ্যাক্ট করার কথা উল্লেখ করেছেন। একবার সন্তুষ্ট হলে, তারা প্রম্পটটি Deep Research-এ পাঠান।

এজেন্টদের চূড়ান্ত রূপ

গত কয়েক মাসে, OpenAI Deep Research-এর তিনটি ভিন্ন সংস্করণ চালু করেছে, সবগুলির নাম Deep Research। Josh Tobin বিশ্বাস করেন যে প্রতিটি পণ্যের নিজস্ব শক্তি এবং দুর্বলতা থাকলেও, তাদের মধ্যে গুণমানের পার্থক্য স্পষ্ট। শেষ পর্যন্ত, এটি মডেলগুলি কীভাবে নির্মিত হয়, ডেটাসেট তৈরিতে কতটা প্রচেষ্টা বিনিয়োগ করা হয় এবং ইঞ্জিন হিসাবে O-সিরিজ মডেলগুলির ব্যবহারের কারণে। এটি Deep Research মডেলগুলিকে অপ্টিমাইজ করার অনুমতি দেয়, অত্যন্ত বুদ্ধিমান এবং উচ্চ-মানের সরঞ্জাম তৈরি করে।

বর্তমানে, Deep Research, O3, এবং Operator তুলনামূলকভাবে স্বাধীন। যাইহোক, OpenAI-এর লক্ষ্য হল ব্যবহারকারীদের জন্য শেষ পর্যন্ত একটি একক, চূড়ান্ত এজেন্ট থাকবে যা ওয়েব অনুসন্ধান করতে পারে, কম্পিউটার ব্যবহার করতে পারে, বা অন্যান্য পছন্দসই কাজগুলি সম্পন্ন করতে পারে, এই সমস্ত ফাংশনগুলিকে আরও স্বাভাবিক উপায়ে সংহত করে।

এন্ড-টু-এন্ড প্রশিক্ষণ হল মডেলের শক্তির মূল কারণ

Deep Research-এর অন্তর্নিহিত মডেল হল O3-এর একটি ফাইন-টিউনড সংস্করণ। O3 হল OpenAI-এর সবচেয়ে উন্নত যুক্তিযুক্ত মডেল, এবং Deep Research-এর বেশিরভাগ বিশ্লেষণ ক্ষমতা এটি থেকে আসে। OpenAI বিশেষভাবে Deep Research মডেলটিকে জটিল ব্রাউজিং কাজ এবং অন্যান্য যুক্তিযুক্ত কাজের উপর প্রশিক্ষণ দিয়েছে। অতএব, Deep Research ব্রাউজিং টুল এবং Python টুলগুলিও ব্যবহার করতে পারে। এই কাজগুলিতে এন্ড-টু-এন্ড প্রশিক্ষণের মাধ্যমে, Deep Research এগুলি পরিচালনা করার কৌশল শিখেছে, শেষ পর্যন্ত মডেলটিকে অনলাইন অনুসন্ধান বিশ্লেষণে পারদর্শী করে তুলেছে।

স্বজ্ঞাতভাবে, একজন ব্যবহারকারী একটি অনুরোধ করেন, এবং মডেলটি প্রথমে এটি সম্পর্কে সাবধানে চিন্তা করে। তারপর, এটি প্রাসঙ্গিক তথ্য অনুসন্ধান করে, এটি বের করে এবং পড়ে। এই তথ্যটি অনুরোধের সাথে কীভাবে সম্পর্কিত তা বোঝার পরে, মডেলটি সিদ্ধান্ত নেয় যে ব্যবহারকারীর পছন্দসই চূড়ান্ত উত্তরের কাছাকাছি যাওয়ার জন্য পরবর্তীতে কী অনুসন্ধান করতে হবে। Deep Research এই সমস্ত তথ্যকে একটি পরিপাটি রিপোর্টে সংহত করতে পারে, যেখানে মূল উৎসগুলির দিকে নির্দেশ করে উদ্ধৃতি রয়েছে।

Deep Research-কে তার এজেন্টের ক্ষমতা প্রদান করে এমন উদ্ভাবনটি হল OpenAI-এর মডেলের এন্ড-টু-এন্ড প্রশিক্ষণ। এর মানে হল যে গবেষণা প্রক্রিয়ার সময় অনেক অপারেশন আগে থেকে অনুমান করা যায় না। একটি ভাষা মডেল, প্রোগ্রাম বা স্ক্রিপ্ট লিখে প্রশিক্ষণের মাধ্যমে মডেল যে নমনীয়তা অর্জন করে তা অর্জন করা অসম্ভব। প্রশিক্ষণের মাধ্যমে, Deep Research মডেল রিয়েল-টাইম ওয়েব তথ্যের প্রতি প্রতিক্রিয়া জানাতে এবং এটি যা দেখে তার উপর ভিত্তি করে অবিলম্বে কৌশলগুলি সামঞ্জস্য করতে শিখেছে। অতএব, Deep Research মডেলটি আসলে খুব সৃজনশীল অনুসন্ধান পরিচালনা করছে। ব্যবহারকারীরা দেখতে পারেন যে মডেলটি পরবর্তীতে কী অনুসন্ধান করতে হবে বা CoT-এর সারাংশ পড়ে কীভাবে নির্দিষ্ট সমস্যাগুলি এড়াতে হবে তা সিদ্ধান্ত নেওয়ার ক্ষেত্রে কতটা বুদ্ধিমান।

Deep Research এবং AI অনুসন্ধানের মধ্যে পার্থক্য

John Collison-এর প্রশ্নের উত্তরে যে Deep Research-এর কতটা ক্ষমতা রিয়েল-টাইম ওয়েব সামগ্রীতে অ্যাক্সেস থেকে আসে এবং কতটা CoT থেকে আসে, OpenAI-এর দুই গবেষক বিশ্বাস করেন যে Deep Research-এর অসামান্য ক্ষমতা উভয়ের সমন্বয়ের ফলাফল।

অন্যান্য AI অনুসন্ধান পণ্যগুলি এন্ড-টু-এন্ড প্রশিক্ষিত নয়, তাই তারা তথ্যের প্রতি Deep Research-এর মতো নমনীয় নয়, বা নির্দিষ্ট সমস্যা সমাধানে ততটা সৃজনশীল নয়।

OpenAI-তে যোগদানের আগে, Josh Tobin একটি স্টার্টআপে কাজ করতেন এবং বেশিরভাগ লোক যেভাবে এজেন্ট তৈরি করার কথা বলে সেভাবে এজেন্ট তৈরি করার চেষ্টা করেছিলেন, মূলত LLM-গুলিকে কিছু নোডে হস্তক্ষেপ করে একটি অপারেশন গ্রাফ তৈরি করা। যদিও LLM সিদ্ধান্ত নিতে পারে যে পরবর্তীতে কী করতে হবে, পদক্ষেপগুলির সম্পূর্ণ ক্রমটির যুক্তি মানুষের দ্বারা সংজ্ঞায়িত করা হয়।

Josh Tobin এটিকে দ্রুত প্রোটোটাইপিংয়ের জন্য একটি শক্তিশালী পদ্ধতি বলে মনে করেছেন, কিন্তু এটি দ্রুত বাস্তব জগতে সমস্যার সম্মুখীন হয়েছে। মডেলটি যে সমস্ত পরিস্থিতির মুখোমুখি হতে পারে তা পূর্বাভাস করা এবং এটি যে সমস্ত পথের শাখা নিতে চাইতে পারে তা বিবেচনা করা কঠিন। অধিকন্তু, যেহেতু এই মডেলগুলি বিশেষভাবে সিদ্ধান্ত নেওয়ার জন্য প্রশিক্ষিত নয়, তাই তারা প্রায়শই নোডগুলিতে সেরা সিদ্ধান্ত গ্রহণকারী হয় না; তাদের সিদ্ধান্ত গ্রহণের মতো কিছু করার জন্য প্রশিক্ষণ দেওয়া হয়।

এটি পুনরাবৃত্তি করে যে Deep Research মডেলের আসল শক্তি সরাসরি এন্ড-টু-এন্ড প্রশিক্ষণ থেকে আসে, যার লক্ষ্য হল ব্যবহারকারীদের প্রকৃতপক্ষে যে কাজগুলি সমাধান করতে হবে সেগুলি সমাধান করা। অতএব, ব্যাকগ্রাউন্ড আর্কিটেকচারে একটি অপারেশন গ্রাফ সেট আপ করার বা নোডের সিদ্ধান্ত নেওয়ার প্রয়োজন নেই; সবকিছু মডেল নিজেই চালিত করে।

অধিকন্তু, যদি একজন ব্যবহারকারীর একটি খুব সুনির্দিষ্ট এবং অনুমানযোগ্য ওয়ার্কফ্লো থাকে, তাহলে Josh Tobin উপরে যেভাবে বর্ণনা করেছেন সেভাবে করা মূল্যবান। কিন্তু যদি খুব নমনীয় প্রক্রিয়াকরণের প্রয়োজন হয়, তাহলে Deep Research-এর মতো একটি পদ্ধতি সেরা পছন্দ হতে পারে।

Josh Tobin পরামর্শ দেন যে কিছু কঠোর নিয়ম মডেলের মধ্যে হার্ড-কোড করা উচিত নয়। যদি “মডেলটিকে একটি নির্দিষ্ট ডাটাবেস অ্যাক্সেস করতে না চাওয়া” এর মতো প্রয়োজন হয়, তবে এটি ম্যানুয়ালি লেখা যুক্তির সাথে বাস্তবায়ন করা ভাল। লোকেরা প্রায়শই মনে করে যে তারা কোড লিখে মডেলের চেয়ে বেশি স্মার্ট হতে পারে, কিন্তু বাস্তবে, ক্ষেত্রটি বিকশিত হওয়ার সাথে সাথে, মডেলগুলি সাধারণত মানুষের চেয়ে ভাল সমাধান নিয়ে আসে।

মেশিন লার্নিং-এর সবচেয়ে গুরুত্বপূর্ণ শিক্ষাগুলির মধ্যে একটি হল আপনি যে ফলাফলগুলি পান তা নির্ভর করে আপনি কীসের জন্য অপ্টিমাইজ করছেন তার উপর। সুতরাং, যদি ব্যবহারকারীরা পছন্দসই ফলাফলের জন্য সরাসরি অপ্টিমাইজ করার জন্য একটি সিস্টেম সেট আপ করতে পারেন, তবে এটি সম্পূর্ণ কাজের সাথে খাপ খায় না এমন মডেলগুলিকে একত্রিত করার চেষ্টা করার চেয়ে অনেক ভাল হবে। অতএব, সামগ্রিক মডেলের ভিত্তিতে RL টিউনিং সবচেয়ে শক্তিশালী এজেন্ট তৈরির একটি মূল অংশ হয়ে উঠতে পারে।

উচ্চ-মানের ডেটা মডেলের সাফল্যের অন্যতম প্রধান কারণ

Deep Research মডেলের সাফল্যের অন্যতম প্রধান কারণ হল একটি উচ্চ-মানের ডেটাসেট থাকা। মডেলে ইনপুট করা ডেটার গুণমান সম্ভবত মডেলের গুণমান নির্ধারণকারী মূল কারণ। Deep Research প্রকল্পে, Edward Sun সমস্ত ডেটাসেট অপ্টিমাইজ করে।

Deep Research-এর সুবিধা

Deep Research-এর শক্তি হল ব্যবহারকারীদের যখন তাদের চাহিদার বিস্তারিত বিবরণ থাকে তখন সেরা উত্তর সরবরাহ করার ক্ষমতা। যাইহোক, ব্যবহারকারীর প্রশ্ন অস্পষ্ট হলেও, Deep Research পছন্দসই তথ্য স্পষ্ট করতে পারে। ব্যবহারকারীরা যখন তথ্যের একটি নির্দিষ্ট সেট খুঁজছেন তখন এটি সবচেয়ে শক্তিশালী।

Deep Research শুধুমাত্র একটি উৎস সম্পর্কে বিস্তৃতভাবে সমস্ত তথ্য সংগ্রহ করতে সক্ষম নয়, এটি খুব অস্পষ্ট তথ্য খুঁজে বের করার ক্ষেত্রেও পারদর্শী, যেমন লং-টেইল কন্টেন্ট যা ঐতিহ্যগত অনুসন্ধানে প্রথম কয়েকটি পৃষ্ঠায় প্রদর্শিত হবে না, একটি অস্পষ্ট টিভি শো-এর একটি নির্দিষ্ট পর্বের বিবরণ ইত্যাদি। একজন অস্ট্রিয়ান জেনারেল সম্পর্কে একটি প্রশ্নে, ChatGPT একবার ভুল উত্তর দিয়েছিল, যেখানে Deep Research সফলভাবে সঠিক উত্তরটি খুঁজে পেয়েছিল।

Deep Research তথ্য সংশ্লেষণে খুব ভাল, বিশেষ করে নির্দিষ্ট, খুঁজে পাওয়া কঠিন তথ্য খুঁজে বের করার ক্ষেত্রে। যাইহোক, Deep Research বিদ্যমান তথ্য থেকে নতুন অন্তর্দৃষ্টি বের করার ক্ষেত্রে ততটা কার্যকর নয় এবং এখনও নতুন বৈজ্ঞানিক আবিষ্কার করতে পারে না।

Deep Research-এর ব্যবহারের ক্ষেত্র

লক্ষ্য ব্যবহারকারী

Deep Research তাদের জন্য ডিজাইন করা হয়েছে যারা তাদের দৈনন্দিন কাজ বা জীবনে জ্ঞান-ভিত্তিক কাজ করেন, বিশেষ করে যাদের প্রচুর পরিমাণে তথ্য সংগ্রহ করতে, ডেটা বিশ্লেষণ করতে এবং সিদ্ধান্ত নিতে হয়। অনেক ব্যবহারকারী Deep Research-কে তাদের কাজে প্রয়োগ করেন, যেমন গবেষণায়, বাজার, কোম্পানি এবং রিয়েল এস্টেটের মতো ক্ষেত্রগুলির পরিস্থিতি বোঝার জন্য।

ব্যবহারের ক্ষেত্র

OpenAI আশা করে যে Deep Research ব্যবসা এবং ব্যক্তিগত উভয় জীবনের পরিস্থিতিতেই কাজ করতে পারবে, কারণ এটি আসলে একটি খুব বহুমুখী ক্ষমতা যা কাজ এবং ব্যক্তিগত জীবন উভয়ের ক্ষেত্রেই প্রযোজ্য। Deep Research-এর আবেদন হল এটি অনেক সময় বাঁচাতে পারে। কিছু কাজ যা করতে কয়েক ঘণ্টা বা এমনকি কয়েক দিন লাগত, সেগুলি এখন Deep Research-এর সাহায্যে ৯০% উত্তর দেওয়া যেতে পারে। OpenAI বিশ্বাস করে যে ব্যবসায়িক পরিস্থিতিতে আরও অনুরূপ কাজ থাকবে, তবে Deep Research মানুষের ব্যক্তিগত জীবনেরও একটি অংশ হয়ে উঠবে।

Deep Research কর্মীবাহিনীকে প্রতিস্থাপন করার বিষয়ে নয়। জ্ঞান-ভিত্তিক কাজের জন্য, বিশেষ করে যে কাজগুলিতে তথ্য খুঁজে বের করতে এবং সিদ্ধান্তে পৌঁছাতে অনেক সময় লাগে, Deep Research মানুষকে সুপারপাওয়ার দিয়ে ক্ষমতায়িত করবে, যে কাজগুলি করতে ৪ বা ৮ ঘণ্টা লাগত সেগুলি ৫ মিনিটের মধ্যে সম্পন্ন করার অনুমতি দেবে, ব্যবহারকারীদের আরও বেশি কিছু অর্জন করতে সক্ষম করবে।

সাক্ষাত্কারে চিকিৎসা, বিনিয়োগ এবং অন্যান্য পেশাগত কাজের পরিস্থিতি; কেনাকাটা, ভ্রমণ এবং অন্যান্য পারিবারিক পরিস্থিতি; প্রোগ্রামিং এবং ব্যক্তিগতকৃত শিক্ষা সহ ব্যবহারের ক্ষেত্রগুলি উল্লেখ করা হয়েছে।

  • চিকিৎসা, বিনিয়োগ এবং অন্যান্য পেশাগত কাজের পরিস্থিতি

    চিকিৎসাক্ষেত্রে, Deep Research একটি নির্দিষ্ট রোগের সমস্ত সাহিত্য বা সাম্প্রতিক ঘটনাগুলি খুঁজে পেতে সাহায্য করতে পারে, এইভাবে সময় সাশ্রয় হয়।

    বিনিয়োগে, Deep Research-এর সাহায্যে, বিনিয়োগকারীরা তাদের বিনিয়োগ করতে পারে এমন প্রতিটি সম্ভাব্য স্টার্টআপ নিয়ে গবেষণা করতে পারেন, শুধুমাত্র যাদের সাথে তাদের দেখা করার সময় আছে তাদের নিয়ে নয়।

    কোম্পানির পরিচালনায়, একজন ব্যবহারকারী যিনি একটি ভোগ্যপণ্য কোম্পানি শুরু করার কথা বিবেচনা করছেন, তিনি Deep Research ব্যবহার করে ব্যাপকভাবে নির্ধারণ করছেন যে নির্দিষ্ট ব্র্যান্ডের নামগুলি ইতিমধ্যেই নিবন্ধিত হয়েছে কিনা, ডোমেন নামগুলি দখল করা হয়েছে কিনা, বাজারের আকার এবং অন্যান্য বিভিন্ন তথ্য।

  • কেনাকাটা, ভ্রমণ এবং অন্যান্য পারিবারিক পরিস্থিতি

    একজন ব্যবহারকারী যিনি একটি নতুন গাড়ি কেনার কথা বিবেচনা করছেন, তিনি জানতে চেয়েছিলেন যে পরবর্তী মডেলটি কখন প্রকাশিত হবে। অনলাইনে অনেক অনুমানমূলক নিবন্ধ ছিল, তাই ব্যবহারকারী Deep Research-কে সমস্ত প্রাসঙ্গিক গুজব সংকলন করতে বলেছিলেন। Deep Research একটি চমৎকার রিপোর্ট তৈরি করেছে, ব্যবহারকারীকে জানিয়েছে যে আগামী কয়েক মাসের মধ্যে একটি নতুন গাড়ি প্রকাশিত হতে পারে।

    যখন Deep Research জাপানে চালু হয়েছিল, ব্যবহারকারীরা এটিকে নির্দিষ্ট প্রয়োজনীয়তা পূরণ করে এমন রেস্তোরাঁ খুঁজে বের করার জন্য খুব সহায়ক বলে মনে করেছিলেন এবং ব্যবহারকারীদের এমন জিনিসগুলি আবিষ্কার করতেও সাহায্য করতে পারে যা তারা অন্যথায় খুঁজে পেতেন না।

    যখন ব্যবহারকারীদের একটি দামী জিনিস কিনতে হয়, একটি বিশেষ ভ্রমণের পরিকল্পনা করতে হয়, বা একটি সমস্যা সম্পর্কে চিন্তা করার জন্য অনেক সময় ব্যয় করতে হয়, তখন তারা অনলাইনে প্রাসঙ্গিক তথ্য অনুসন্ধান করতে, সমস্ত পর্যালোচনা ব্রাউজ করতে ইত্যাদি কয়েক ঘণ্টা ব্যয় করতে পারেন। Deep Research দ্রুত এই তথ্যটি সংগঠিত করতে পারে, একটি সংক্ষিপ্ত রিপোর্ট তৈরি করতে পারে এবং বিস্তারিত এবং ব্যক্তিগতকৃত পরামর্শ দিতে পারে।

    ব্যস্ত কর্মজীবী মায়েরা প্রায়শই তাদের সন্তানদের জন্য জন্মদিনের পার্টি পরিকল্পনা করার সময় পান না, কিন্তু এখন তারা Deep Research-এর সাহায্যে দ্রুত এটি করতে পারেন।

    Deep Research নির্দেশাবলী অনুসরণ করার ক্ষেত্রেও চমৎকার। যদি ব্যবহারকারীরা শুধুমাত্র একটি পণ্য সম্পর্কে জানতে না চান, তবে অন্য সমস্ত পণ্যের সাথে তুলনা করতে চান, বা এমনকি Reddit-এর মতো ওয়েবসাইটগুলি থেকে পর্যালোচনা দেখতে চান, তবে তারা Deep Research-এর কাছে অনেকগুলি ভিন্ন অনুরোধ করতে পারেন এবং এটি এই সমস্ত কাজ একবারে সম্পন্ন করবে। ব্যবহারকারীরা Deep Research-কে তথ্যগুলি একটি টেবিলে রাখতেও বলতে পারেন।

  • প্রোগ্রামিং

    অনেক লোক প্রোগ্রামিংয়ের জন্য Deep Research ব্যবহার করে। এই পরিস্থিতিটি প্রাথমিকভাবে OpenAI দ্বারা বিবেচনা করা হয়নি, কিন্তু অনেক লোক এটি কোড লিখতে, কোড অনুসন্ধান করতে, এমনকি একটি প্যাকেজের জন্য সর্বশেষ ডকুমেন্টেশন খুঁজে বের করতে বা স্ক্রিপ্ট লিখতে ব্যবহার করছে, চিত্তাকর্ষক ফলাফলের সাথে।

  • শিক্ষা

    ব্যক্তিগতকৃত শিক্ষা একটি খুব আকর্ষণীয় প্রয়োগের ক্ষেত্র। যদি ব্যবহারকারীদের এমন একটি বিষয় থাকে যাতারা শিখতে চান, যেমন জীববিজ্ঞান পর্যালোচনা করা বা বর্তমান ঘটনাগুলি বোঝা, তবে তাদের কেবল সেই অংশগুলি সরবরাহ করতে হবে যা তারা বোঝেন না বা যে তথ্যগুলি তারা গভীরভাবে জানতে চান, এবং Deep Research একটি বিস্তারিত রিপোর্ট সংকলন করতে পারে। সম্ভবত ভবিষ্যতে, Deep Research ব্যবহারকারী সম্পর্কে যা শিখেছে তার উপর ভিত্তি করে ব্যক্তিগতকৃত শিক্ষা প্রদান করা সম্ভব হবে।

২০২৫ সালে এজেন্টদের উত্থান হবে

Deep Research-এর ভবিষ্যতের উন্নয়নের দিকনির্দেশ

পণ্যের আকারের ক্ষেত্রে, OpenAI আশা করে যে Deep Research ভবিষ্যতে ছবি এম্বেড করতে, পণ্যের ছবি খুঁজে বের করতে, চার্ট তৈরি করতে এবং এই চার্টগুলিকে উত্তরগুলিতে এম্বেড করতে সক্ষম হবে।

তথ্যের উৎসের ক্ষেত্রে, OpenAI আশা করে যে মডেলটি যে ডেটা উৎসগুলি অ্যাক্সেস করতে পারে তা প্রসারিত করবে। তারা আশা করে যে মডেলটি ভবিষ্যতে ব্যক্তিগত ডেটা অনুসন্ধান করতে সক্ষম হবে। OpenAI মডেলের ক্ষমতা আরও বাড়িয়ে তুলবে, এটিকে ব্রাউজিং এবং বিশ্লেষণে আরও ভাল করে তুলবে।

তথ্যের নির্ভুলতার ক্ষেত্রে, ব্যবহারকারীদের Deep Research-এর আউটপুটের উপর বিশ্বাস রাখতে সক্ষম করার জন্য, ব্যবহারকারীরা মডেল দ্বারা উদ্ধৃত তথ্যের উৎসগুলি দেখতে পারেন। মডেল প্রশিক্ষণের সময়, OpenAI উদ্ধৃতিগুলির সঠিকতা নিশ্চিত করার জন্যও প্রচেষ্টা করে, কিন্তু মডেলটি এখনও ভুল করতে পারে, হ্যালুসিনেট করতে পারে, বা এমনকি এমন একটি উৎসের উপর বিশ্বাস করতে পারে যা সবচেয়ে বিশ্বাসযোগ্য নাও হতে পারে। অতএব, এটি এমন একটি ক্ষেত্র যেখানে OpenAI উন্নতি চালিয়ে যেতে চায়।

OpenAI Agent রোডম্যাপে আরও বিস্তৃতভাবে সংহত করার জন্য, OpenAI আশা করে যে Deep Research-কে অনেকগুলি ভিন্ন প্রয়োগের পরিস্থিতিতে প্রসারিত করা যেতে পারে, সবচেয়ে উন্নত যুক্তিযুক্ত মডেলগুলিকে এমন সরঞ্জামগুলির সাথে একত্রিত করে যা মানুষ কাজ বা দৈনন্দিন জীবনের কাজগুলি সম্পন্ন করতে ব্যবহার করতে পারে এবং তারপরে সরাসরি মডেলটিকে অপ্টিমাইজ করে ব্যবহারকারীরা এজেন্টকে যে ফলাফলগুলি অর্জন করতে চান তা অর্জন করতে।

এই পর্যায়ে, Deep Research-কে আরও জটিল কাজের পরিস্থিতিতে প্রসারিত করতে আসলে কিছুই বাধা দিচ্ছে না। AGI এখন একটি অপারেশনাল সমস্যা, এবং ভবিষ্যতে দেখার জন্য অনেক উত্তেজনাপূর্ণ উন্নয়ন থাকবে।

Sam Altman বিশ্বাস করেন যে Deep Research যে কাজগুলি সম্পন্ন করতে পারে তা বিশ্বের সমস্ত অর্থনৈতিকভাবে কার্যকর কাজের কয়েক শতাংশের জন্য দায়ী হবে। Josh Tobin বিশ্বাস করেন যে Deep Research ব্যবহারকারীদের জন্য সমস্ত কাজ করতে পারে না, তবে এটি ব্যবহারকারীদের কয়েক ঘণ্টা বা এমনকি কয়েক দিন বাঁচাতে পারে। OpenAI আশা করে যে একটি তুলনামূলকভাবে কাছাকাছি লক্ষ্য হল Deep Research এবং পরবর্তীতে নির্মিত এজেন্টগুলি, সেইসাথে এই ভিত্তির উপর নির্মিত অন্যান্য এজেন্টগুলি, ব্যবহারকারীদের তাদের কাজের ধরনের উপর নির্ভর করে ১%, ৫%, ১০% বা ২৫% সময় সাশ্রয় করবে।

এজেন্ট এবং RL

Isa Fulford এবং Josh Tobin একমত যে এই বছর এজেন্টদের উত্থান হবে।

RL একটি শিখর অনুভব করেছিল, তারপর কিছুটা নিম্নমুখী হয়েছিল বলে মনে হয়েছিল, এবং এখন আবার মনোযোগ পাচ্ছে। Yann LeCun-এর একবার একটি উপমা ছিল: যদি লোকেরা একটি কেক তৈরি করে, তবে এর বেশিরভাগই কেক হবে, একটু ফ্রস্টিং থাকবে এবং অবশেষে উপরে কয়েকটি চেরি থাকবে। আনসুপারভাইজড লার্নিং হল কেকের মতো, সুপারভাইজড লার্নিং হল ফ্রস্টিং, এবং RL হল চেরি।

Josh Tobin বিশ্বাস করেন যে ২০১৫-২০১৬ সালে RL করার সময়, কেকের উপমা ব্যবহার করে, এটি সম্ভবত কেক ছাড়াই চেরি যোগ করার চেষ্টা করছিল। কিন্তু এখন, প্রচুর পরিমাণে ডেটার উপর প্রি-ট্রেইনড ভাষা মডেল রয়েছে, এই মডেলগুলি খুব শক্তিশালী, এবং আমরা জানি কিভাবে এই ভাষা মডেলগুলিতে সুপারভাইজড ফাইন-টিউনিং করতে হয় যাতে সেগুলি নির্দেশাবলী কার্যকর করতে এবং মানুষ যা চায় তা করতে ভাল হয়। এখন সবকিছু খুব ভাল কাজ করে, এবং এটি যেকোনো ব্যবহারের ক্ষেত্রের জন্য ব্যবহারকারী-সংজ্ঞায়িত পুরস্কার ফাংশন অনুযায়ী এই মডেলগুলিকে সামঞ্জস্য করার জন্য খুব উপযুক্ত।