Derin Araştırma: Ajanların En Üstün Hali

OpenAI’nin İkinci Ajanı

Üç hafta önce, OpenAI ikinci ajanı olan Deep Research’ü tanıttı. Bu ajan, birden fazla web sitesinde arama yapabilir ve 5-30 dakika içinde kapsamlı çevrimiçi araştırmayı tamamlayabilir, bilgileri sentezleyebilir ve alıntılarla birlikte ayrıntılı raporlar sunabilir.

Bu makale, Sequoia Capital’in OpenAI’nin Deep Research liderleri Isa Fulford ve Josh Tobin ile yaptığı bir röportajı derleyip düzenlemektedir. İki üye, Deep Research’ün arkasındaki teknik ayrıntıları ve ürün düşüncesini, şu anda gözlemledikleri kullanım durumlarıyla birlikte ayrıntılı olarak paylaşıyor.

Deep Research, OpenAI’nin modelin uzun vadeli görevleri ele alma yeteneğini keşfetme çabasından doğdu. Ekibin uzun vadeli hedefi, kullanıcılara gelecekte nihai ajanı sağlamaktır: web araması, bilgisayar kullanımı veya ajanın tamamlamasını istedikleri diğer görevler için doğal, hepsi bir arada bir çözüm.

Deep Research, ürün düzeyinde de özel olarak optimize edilmiştir. Örneğin, DeepSeek analizimizde belirtildiği gibi, Deep Research, net alıntılar ve Chain-of-Thought (CoT) aracılığıyla kullanıcı güvenini artırır. Ekip ayrıca, görevin tutarlı bir şekilde anlaşılmasını sağlamak için bir açıklama akışı tasarlamıştır. Deep Research, bilgi alma ve düzenlemede AI aramasını ve ChatGPT’yi geride bırakır. Ancak, bu aşamada, Deep Research, mevcut bilgilerden yeni içgörüler çıkarma konusunda o kadar etkili değildir ve henüz yeni bilimsel keşifler yapamaz.

Önemli Çıkarımlar:

  • OpenAI, kapsamlı çevrimiçi araştırmalar yapabilen ikinci ajanı Deep Research’ü başlattı.
  • Ajan yetenekleri, modelin uçtan uca eğitiminden kaynaklanmaktadır.
  • Deep Research, bilgi sentezi ve belirsiz gerçekleri bulmada üstündür.
  • Kullanım alanları profesyonel iş, kişisel yaşam, programlama ve eğitimi kapsar.
  • Ekip, 2025’te ajanlar için önemli gelişmeler bekliyor.

Ajan Yetenekleri Uçtan Uca Model Eğitiminden Kaynaklanıyor

Deep Research, birden fazla çevrimiçi web sitesinde arama yapabilen ve kapsamlı raporlar oluşturabilen, insanların saatlerini alacak birçok görevi tamamlayabilen bir ajandır. ChatGPT içinde çalışır, soruları yaklaşık 5-30 dakika içinde yanıtlar, daha derin araştırmayı mümkün kılar ve standart ChatGPT’den daha ayrıntılı ve spesifik yanıtlar sağlar. OpenAI daha önce Operator’ü başlatmıştı ve Deep Research onun ikinci ajanıdır, daha fazlası da gelecek.

Kökenler

Yaklaşık bir yıl önce, OpenAI dahili olarak bir akıl yürütme paradigması benimsemeye başladı ve modelleri cevaplamadan önce düşünmeye eğitmeyi amaçladı. Bu yaklaşım oldukça başarılı oldu.

Başlangıçta, OpenAI Matematik ve Bilim’e odaklandı. Ancak, bu yeni akıl yürütme modeli mimarisinin, ajan yeteneklerini içeren daha uzun vadeli görevleri ele alma yeteneğinin de kilidini açtığını keşfettiler.

Aynı zamanda, OpenAI, birçok görevin kapsamlı çevrimiçi araştırma veya dış bağlam, güçlü akıl yürütme yetenekleri, bilgi kaynaklarını ayırt etme ve bir dereceye kadar yaratıcılık gerektirdiğini fark etti. Sonuç olarak, OpenAI bu görevleri yerine getirebilen model eğitim yöntemleri geliştirdi. Akıl yürütme modellerini eğitmek için kullandıkları aynı yöntemleri kullanarak, ancak daha gerçek dünya görevlerine uygulayarak modelleri tarama görevlerini gerçekleştirmek üzere eğitmeye karar verdiler.

Deep Research projesi, Isa Fulford ve Yash Patil tarafından hazırlanan orijinal bir demo ile başladı. Josh Tobin, bir startup’ta çalıştıktan sonra yaklaşık altı ay önce OpenAI’ye yeniden katıldı, temel çalışmalara büyük ilgi duydu ve Deep Research projesine katıldı.

Önemli Kişiler:

  • Isa Fulford: OpenAI’nin Post-training ekibinde AI araştırmacısı, ChatGPT Retrieval Plugin’in önemli bir katkıda bulunanı.
  • Yash Patil: OpenAI’nin Post-training ekibindeki çekirdek model ekibinin üyesi, Stanford’dan ayrıldı.
  • Josh Tobin: Daha önce OpenAI’de Araştırma Bilimcisi, daha sonra Gantry’yi (analiz, uyarılar ve insan geri bildirimi yoluyla ML’yi iyileştirmek için bir ürün) kurdu. OpenAI’ye yeniden katıldı ve şu anda Agents ürün araştırma ekibini yönetiyor.

Açıklama Akışı

Deep Research benzersiz bir tasarıma sahiptir: açıklama akışı. Araştırmaya başlamadan önce, Deep Research modeli kullanıcıya sorular sorar. Tipik olarak, ChatGPT yalnızca bir yanıtın sonunda takip soruları sorar veya yanıtın tatmin edici olup olmadığını sorar, Deep Research’ün aksine, bu davranışı en başta sergiler.

Bu, ekip tarafından bilinçli bir tasarım seçimiydi. Kullanıcılar, Deep Research modelinden en iyi yanıtları yalnızca istemleri çok açık ve ayrıntılı olduğunda alırlar. Ancak, kullanıcılar genellikle ilk istemlerinde tüm bilgileri sağlamazlar. Bu nedenle, OpenAI, 5 veya 30 dakika bekledikten sonra kullanıcıların yeterince ayrıntılı ve tatmin edici bir yanıt almasını sağlamak istedi. Bu ekstra adım, kullanıcıların model için gerekli tüm ayrıntıları sağlamasını sağlamak için eklendi.

X’teki birçok kullanıcı, istemlerini iyileştirmek için önce o1 veya o1 Pro ile etkileşime girdiğinden bahsetti. Tatmin olduklarında, istemi Deep Research’e gönderiyorlar.

Ajanların Nihai Formu

Son birkaç ay içinde, OpenAI, hepsi Deep Research olarak adlandırılan üç farklı Deep Research sürümü başlattı. Josh Tobin, her ürünün güçlü ve zayıf yönleri olsa da, aralarındaki kalite farklarının belirgin olduğuna inanıyor. Sonuç olarak, bu, modellerin nasıl oluşturulduğu, veri kümelerini oluşturmak için harcanan çaba ve motor olarak O-serisi modellerin kullanılmasıyla ilgilidir. Bu, Deep Research modellerinin optimize edilmesini sağlayarak, son derece akıllı ve yüksek kaliteli araçlar yaratır.

Şu anda, Deep Research, O3 ve Operator nispeten bağımsızdır. Ancak, OpenAI, kullanıcıların sonunda web aramaları yapabilen, bilgisayarları kullanabilen veya istenen diğer görevleri tamamlayabilen, tüm bu işlevleri daha doğal bir şekilde entegre eden tek, nihai bir ajana sahip olmasını hedefliyor.

Uçtan Uca Eğitim, Modelin Gücünün Temel Nedenidir

Deep Research’ün temel modeli, O3’ün ince ayarlanmış bir sürümüdür. O3, OpenAI’nin en gelişmiş akıl yürütme modelidir ve Deep Research’ün analitik yeteneğinin çoğu ondan gelir. OpenAI, Deep Research modelini özellikle karmaşık tarama görevleri ve diğer akıl yürütme görevleri üzerinde eğitti. Bu nedenle, Deep Research tarama araçlarını ve Python araçlarını da kullanabilir. Bu görevler üzerinde uçtan uca eğitim yoluyla, Deep Research bunları ele almak için stratejiler öğrendi, sonuçta modeli çevrimiçi arama analizinde mükemmel hale getirdi.

Sezgisel olarak, bir kullanıcı bir istekte bulunur ve model önce dikkatlice düşünür. Ardından, ilgili bilgileri arar, çıkarır ve okur. Bu bilginin istekle nasıl ilişkili olduğunu anladıktan sonra, model kullanıcının istediği nihai yanıta yaklaşmak için ne arayacağına karar verir. Deep Research, tüm bu bilgileri, orijinal kaynaklara işaret eden alıntılarla birlikte düzgün bir rapora entegre edebilir.

Deep Research’e ajan yeteneklerini veren yenilik, OpenAI’nin modelin uçtan uca eğitiminde yatmaktadır. Bu, araştırma sürecindeki birçok işlemin önceden tahmin edilemez olduğu anlamına gelir. Modelin eğitim yoluyla kazandığı esnekliği bir dil modeli, program veya komut dosyası yazarak elde etmek mümkün değildir. Eğitim yoluyla, Deep Research modeli gerçek zamanlı web bilgilerine nasıl tepki vereceğini ve gördüklerine göre stratejileri derhal nasıl ayarlayacağını öğrendi. Bu nedenle, Deep Research modeli aslında çok yaratıcı aramalar yapıyor. Kullanıcılar, CoT özetlerini okuyarak modelin bir sonraki ne arayacağına veya belirli sorunları nasıl aşacağına karar vermede ne kadar akıllı olduğunu görebilirler.

Deep Research ve AI Araması Arasındaki Farklar

John Collison’ın Deep Research’ün yeteneğinin ne kadarının web içeriğine gerçek zamanlı erişimden ve ne kadarının CoT’den geldiği sorusuna ilişkin olarak, iki OpenAI araştırmacısı, Deep Research’ün olağanüstü yeteneğinin her ikisinin birleşiminin bir sonucu olduğuna inanıyor.

Diğer AI arama ürünleri uçtan uca eğitilmemiştir, bu nedenle Deep Research kadar bilgiye yanıt vermede esnek değillerdir ve belirli sorunları çözmede o kadar yaratıcı değillerdir.

OpenAI’ye katılmadan önce, Josh Tobin bir startup’ta çalıştı ve çoğu insanın ajanları inşa etmeyi tarif ettiği şekilde ajanlar inşa etmeye çalıştı, esasen bazı düğümlerde LLM’lerin müdahale ettiği bir işlem grafiği oluşturdu. LLM bir sonraki ne yapacağına karar verebilirken, tüm adım dizisinin mantığı insanlar tarafından tanımlanır.

Josh Tobin, bunun hızlı prototipleme için güçlü bir yöntem olduğunu, ancak gerçek dünyada hızla sorunlarla karşılaştığını buldu. Modelin karşılaşabileceği tüm durumları öngörmek ve almak isteyebileceği tüm farklı yol dallarını dikkate almak zordur. Dahası, bu modeller karar vermek için özel olarak eğitilmediğinden, genellikle düğümlerde en iyi karar vericiler değildirler; karar vermeye benzer bir şey yapmak için eğitilirler.

Bu, Deep Research modelinin gerçek gücünün, kullanıcıların aslında çözmesi gereken görevleri çözmeyi amaçlayan doğrudan uçtan uca eğitimden geldiğini yineler. Bu nedenle, bir işlem grafiği kurmaya veya arka plan mimarisinde düğüm kararları vermeye gerek yoktur; her şey modelin kendisi tarafından yönlendirilir.

Ayrıca, bir kullanıcının çok özel ve öngörülebilir bir iş akışı varsa, o zaman Josh Tobin’in yukarıda açıkladığı şekilde yapmak değerlidir. Ancak çok esnek bir işleme gerekiyorsa, Deep Research’e benzer bir yaklaşım en iyi seçim olabilir.

Josh Tobin, bazı katı kuralların modele kodlanmaması gerektiğini öne sürüyor. ‘Modelin belirli bir veritabanına erişmesini istememek’ gibi bir ihtiyaç varsa, bunu elle yazılmış mantıkla uygulamak daha iyidir. İnsanlar genellikle kod yazarak modelden daha akıllı olabileceklerini düşünürler, ancak gerçekte, alan geliştikçe, modeller genellikle insanlardan daha iyi çözümler bulurlar.

Makine öğreniminin en önemli derslerinden biri, elde ettiğiniz sonuçların neyi optimize ettiğinize bağlı olduğudur. Bu nedenle, kullanıcılar istenen sonucu doğrudan optimize etmek için bir sistem kurabilirlerse, tüm göreve uymayan modelleri bir araya getirmeye çalışmaktan çok daha iyi olacaktır. Bu nedenle, genel model temelinde RL ayarlaması, en güçlü ajanları oluşturmanın önemli bir parçası haline gelebilir.

Yüksek Kaliteli Veriler, Model Başarısının Anahtar Faktörlerinden Biridir

Deep Research modelinin başarısının anahtar faktörlerinden biri, yüksek kaliteli bir veri kümesine sahip olmaktır. Modele girilen verilerin kalitesi, modelin kalitesini belirleyen anahtar faktördür. Deep Research projesinde, Edward Sun tüm veri kümelerini optimize eder.

Deep Research’ün Avantajları

Deep Research’ün gücü, kullanıcıların ihtiyaçlarının ayrıntılı bir açıklamasına sahip olduklarında en iyi yanıtları verme yeteneğinde yatmaktadır. Ancak, kullanıcının sorusu belirsiz olsa bile, Deep Research istenen bilgileri netleştirebilir. Kullanıcılar belirli bir bilgi kümesi aradıklarında en güçlüsüdür.

Deep Research, yalnızca bir kaynak hakkındaki tüm bilgileri geniş çapta toplamakla kalmaz, aynı zamanda çok belirsiz gerçekleri bulmada da üstündür, örneğin geleneksel bir aramada ilk birkaç sayfada görünmeyecek uzun kuyruklu içerik, belirsiz bir TV şovunun belirli bir bölümünün ayrıntıları vb. Avusturyalı bir general hakkındaki bir soruda, ChatGPT bir zamanlar yanlış cevap verirken, Deep Research doğru olanı başarıyla buldu.

Deep Research, özellikle belirli, bulunması zor bilgileri bulmada, bilgileri sentezlemede çok iyidir. Ancak, Deep Research, mevcut bilgilerden yeni içgörüler çıkarma konusunda o kadar etkili değildir ve henüz yeni bilimsel keşifler yapamaz.

Deep Research’ün Kullanım Durumları

Hedef Kullanıcılar

Deep Research, günlük işlerinde veya yaşamlarında bilgi işiyle uğraşan, özellikle de büyük miktarda bilgi toplaması, verileri analiz etmesi ve karar vermesi gereken herkes için tasarlanmıştır. Birçok kullanıcı, Deep Research’ü pazarlar, şirketler ve emlak gibi alanlardaki durumu anlamak için araştırma gibi işlerine uygular.

Kullanım Durumları

OpenAI, Deep Research’ün hem iş hem de kişisel yaşam senaryolarına hizmet edebileceğini umuyor, çünkü aslında hem iş hem de kişisel yaşam için geçerli olan çok yönlü bir yetenektir. Deep Research’ün çekiciliği, çok fazla zaman kazandırma yeteneğinde yatmaktadır. Saatler hatta günler sürebilecek bazı görevler artık Deep Research ile %90 oranında yanıtlanabilir. OpenAI, iş senaryolarında daha benzer görevler olacağına inanıyor, ancak Deep Research insanların kişisel yaşamlarının da bir parçası olacak.

Deep Research, iş gücünün yerini almakla ilgili değildir. Bilgi işi için, özellikle bilgi bulmak ve sonuç çıkarmak için çok zaman gerektiren görevler için, Deep Research insanlara süper güçler verecek, 4 veya 8 saat sürebilecek görevlerin 5 dakika içinde tamamlanmasını sağlayarak kullanıcıların daha fazlasını başarmasını sağlayacaktır.

Röportajda, tıp, yatırım ve diğer profesyonel iş senaryoları; alışveriş, seyahat ve diğer aile senaryoları; programlama ve kişiselleştirilmiş eğitim dahil olmak üzere kullanım durumlarından bahsedildi.

  • Tıp, Yatırım ve Diğer Profesyonel İş Senaryoları

    Tıpta, Deep Research belirli bir hastalığın tüm literatürünü veya son vakalarını bulmaya yardımcı olabilir, böylece zaman kazandırır.

    Yatırımda, Deep Research’ün yardımıyla, yatırımcılar görüşmek için zamanları olanlarla sınırlı kalmayıp, yatırım yapabilecekleri her potansiyel startup’ı araştırmayı seçebilirler.

    Şirket operasyonlarında, bir tüketim malları şirketi kurmayı düşünen bir kullanıcı, belirli marka adlarının zaten tescilli olup olmadığını, alan adlarının işgal edilip edilmediğini, pazar büyüklüğünü ve diğer çeşitli bilgileri belirlemek için Deep Research’ü kapsamlı bir şekilde kullanıyor.

  • Alışveriş, Seyahat ve Diğer Aile Senaryoları

    Yeni bir araba almayı düşünen bir kullanıcı, bir sonraki modelin ne zaman piyasaya sürüleceğini bilmek istedi. Çevrimiçi olarak birçok spekülatif makale vardı, bu yüzden kullanıcı Deep Research’ten ilgili tüm söylentileri derlemesini istedi. Deep Research mükemmel bir rapor hazırladı ve kullanıcıya önümüzdeki birkaç ay içinde yeni bir arabanın piyasaya sürülebileceğini bildirdi.

    Deep Research Japonya’da piyasaya sürüldüğünde, kullanıcılar belirli gereksinimleri karşılayan restoranları bulmada çok yardımcı olduğunu ve ayrıca kullanıcıların aksi takdirde bulamayacakları şeyleri keşfetmelerine yardımcı olabileceğini buldular.

    Kullanıcıların pahalı bir ürün satın almaları, özel bir gezi planlamaları veya bir sorun hakkında düşünmek için çok zaman harcamaları gerektiğinde, ilgili bilgileri aramak, tüm incelemelere göz atmak vb. için saatlerce çevrimiçi olarak harcayabilirler. Deep Research bu bilgileri hızla düzenleyebilir, bir özet raporu oluşturabilir ve ayrıntılı ve kişiselleştirilmiş tavsiyeler sağlayabilir.

    Yoğun çalışan anneler genellikle çocukları için doğum günü partileri planlamak için zamanları yoktur, ancak şimdi Deep Research’ün yardımıyla bunu hızlı bir şekilde yapabilirler.

    Deep Research talimatları takip etmede de mükemmeldir. Kullanıcılar sadece bir ürün hakkında bilgi edinmekle kalmayıp, aynı zamanda onu diğer tüm ürünlerle karşılaştırmak, hatta Reddit gibi web sitelerinden gelen incelemeleri görmek istiyorlarsa, Deep Research’e birçok farklı istekte bulunabilirler ve tüm bu görevleri tek seferde tamamlayacaktır. Kullanıcılar ayrıca Deep Research’ten bilgileri bir tabloya koymasını isteyebilirler.

  • Programlama

    Birçok kişi Deep Research’ü programlama için kullanıyor. Bu senaryo başlangıçta OpenAI tarafından düşünülmemişti, ancak birçok kişi kodu yazmak, kod aramak, hatta bir paket için en son belgeleri bulmak veya komut dosyaları yazmak için kullanıyor ve etkileyici sonuçlar elde ediyor.

  • Eğitim

    Kişiselleştirilmiş eğitim çok ilginç bir uygulama senaryosudur. Kullanıcıların öğrenmek istedikleri bir konu varsa, örneğin biyolojiyi gözden geçirmek veya güncel olayları anlamak gibi, yalnızca anlamadıkları kısımları veya derinlemesine incelemek istedikleri bilgileri sağlamaları yeterlidir ve Deep Research ayrıntılı bir rapor derleyebilir. Belki gelecekte, Deep Research’ün kullanıcı hakkında öğrendiklerine göre kişiselleştirilmiş eğitim sağlamak mümkün olacaktır.

2025’te Ajanlar Ortaya Çıkacak

Deep Research için Gelecekteki Geliştirme Yönleri

Ürün formu açısından, OpenAI, Deep Research’ün gelecekte görüntüleri gömebilmesini, ürünlerin resimlerini bulabilmesini, grafikler oluşturabilmesini ve bu grafikleri yanıtlara gömebilmesini umuyor.

Bilgi kaynakları açısından, OpenAI modelin erişebileceği veri kaynaklarını genişletmeyi umuyor. Modelin gelecekte özel verileri arayabilmesini umuyorlar. OpenAI, modelin yeteneklerini daha da geliştirecek ve tarama ve analizde daha iyi hale getirecek.

Bilgi doğruluğu açısından, kullanıcıların Deep Research’ün çıktısına güvenmesini sağlamak için, kullanıcılar model tarafından alıntılanan bilgi kaynaklarını görebilirler. Model eğitim süreci sırasında, OpenAI ayrıca alıntıların doğruluğunu sağlamaya çalışır, ancak model yine de hatalar yapabilir, halüsinasyon görebilir ve hatta en güvenilir olmayabilecek bir kaynağa güvenebilir. Bu nedenle, bu OpenAI’nin geliştirmeye devam etmeyi umduğu bir alandır.

OpenAI Agent yol haritasına daha geniş bir şekilde entegre olmak için, OpenAI, Deep Research’ün birçok farklı uygulama senaryosuna genişletilebilmesini, en gelişmiş akıl yürütme modellerini insanların iş veya günlük yaşam görevlerini tamamlamak için kullanabileceği araçlarla birleştirebilmesini ve ardından modeli doğrudan kullanıcıların ajanın elde etmesini istediği sonuçları elde etmek için optimize edebilmesini umuyor.

Bu aşamada, Deep Research’ü daha karmaşık görev senaryolarına genişletmeyi engelleyen hiçbir şey yoktur. AGI artık operasyonel bir sorundur ve gelecekte dört gözle beklenecek birçok heyecan verici gelişme olacaktır.

Sam Altman, Deep Research’ün tamamlayabileceği görevlerin dünyadaki tüm ekonomik olarak uygulanabilir görevlerin birkaç yüzdesini oluşturacağına inanıyor. Josh Tobin, Deep Research’ün kullanıcılar için tüm işi yapamayacağına, ancak kullanıcılara birkaç saat hatta günler kazandırabileceğine inanıyor. OpenAI, nispeten yakın bir hedefin, Deep Research ve daha sonra inşa edilen ajanların yanı sıra bu temel üzerine inşa edilen diğer ajanların, yaptıkları işin türüne bağlı olarak kullanıcılara zamanlarının %1, %5, %10 veya %25’ini kazandırması olduğunu umuyor.

Ajan ve RL

Isa Fulford ve Josh Tobin, ajanların bu yıl ortaya çıkacağı konusunda hemfikir.

RL bir zirve yaşadı, sonra biraz düşüş yaşadı ve şimdi tekrar dikkat çekiyor. Yann LeCun bir zamanlar bir benzetme yapmıştı: insanlar bir pasta yapıyorsa, çoğu pasta olacak, biraz krema olacak ve sonunda birkaç kiraz olacak. Denetimsiz öğrenme pasta gibidir, denetimli öğrenme krema ve RL kirazdır.

Josh Tobin, 2015-2016’da RL yaparken, pasta benzetmesini kullanarak, pasta olmadan kirazı eklemeye çalışıyor olabileceğine inanıyor. Ancak şimdi, büyük miktarda veri üzerinde önceden eğitilmiş dil modelleri var, bu modeller çok güçlü ve bu dil modelleri üzerinde denetimli ince ayar yapmayı biliyoruz, böylece talimatları yerine getirmede ve insanların istediğini yapmada iyi oluyorlar. Şimdi her şey çok iyi çalışıyor ve bu modelleri kullanıcı tanımlı ödül işlevlerine göre herhangi bir kullanım durumu için ayarlamak çok uygun.