Wakala wa Pili wa OpenAI
Wiki tatu zilizopita, OpenAI ilianzisha Deep Research, wakala wake wa pili. Wakala huyu anaweza kutafuta tovuti nyingi na kukamilisha utafiti wa kina mtandaoni katika dakika 5-30, akichambua habari na kutoa ripoti za kina zenye marejeleo.
Makala haya yanakusanya na kupanga mahojiano ya Sequoia Capital na Isa Fulford na Josh Tobin, viongozi wa Deep Research ya OpenAI. Wajumbe hao wawili wanaelezea kwa undani mambo ya kiufundi na mawazo ya bidhaa nyuma ya Deep Research, pamoja na matumizi wanayoona sasa.
Deep Research ilianzia kwenye uchunguzi wa ndani wa OpenAI wa uwezo wa mfumo kushughulikia kazi za muda mrefu. Lengo la muda mrefu la timu ni kuwapa watumiaji wakala bora zaidi siku zijazo: suluhisho la asili la kila kitu kwa utafutaji wa wavuti, matumizi ya kompyuta, au kazi nyingine yoyote ambayo wanataka wakala akamilishe.
Deep Research pia imeboreshwa haswa katika kiwango cha bidhaa. Kwa mfano, kama ilivyotajwa katika uchambuzi wetu wa DeepSeek, Deep Research huongeza uaminifu wa mtumiaji kupitia marejeleo ya wazi na Chain-of-Thought (CoT). Timu pia imeunda mtiririko wa ufafanuzi ili kuhakikisha uelewa thabiti wa kazi. Deep Research inazidi utafutaji wa AI na ChatGPT katika upatikanaji na upangaji wa habari. Hata hivyo, katika hatua hii, Deep Research si nzuri sana katika kutoa maarifa mapya kutoka kwa habari iliyopo na bado haiwezi kufanya uvumbuzi mpya wa kisayansi.
Mambo Muhimu:
- OpenAI imezindua wakala wake wa pili, Deep Research, anayeweza kufanya uchunguzi wa kina mtandaoni.
- Uwezo wa wakala unatokana na mafunzo ya mwisho hadi mwisho ya mfumo.
- Deep Research ni bora katika kuunganisha habari na kupata ukweli usiojulikana.
- Matumizi yanahusu kazi ya kitaaluma, maisha ya kibinafsi, upangaji programu, na elimu.
- Timu inatarajia maendeleo makubwa kwa mawakala mnamo 2025.
Uwezo wa Wakala Unatokana na Mafunzo ya Mfumo wa Mwisho hadi Mwisho
Deep Research ni wakala anayeweza kutafuta tovuti nyingi mtandaoni na kutoa ripoti za kina, akimaliza kazi nyingi ambazo zingechukua wanadamu masaa mengi. Ikifanya kazi ndani ya ChatGPT, inajibu maswali katika takriban dakika 5-30, ikiruhusu utafiti wa kina zaidi na kutoa majibu ya kina na maalum zaidi kuliko ChatGPT ya kawaida. OpenAI hapo awali ilizindua Operator, na Deep Research ni wakala wake wa pili, na wengine zaidi wanakuja.
Asili
Karibu mwaka mmoja uliopita, OpenAI ilianza kutumia dhana ya kufikiri ndani, ikilenga kufundisha mifumo kufikiri kabla ya kujibu. Njia hii ilionekana kuwa na mafanikio makubwa.
Hapo awali, OpenAI ililenga Hisabati na Sayansi. Hata hivyo, waligundua kuwa usanifu huu mpya wa mfumo wa kufikiri pia ulifungua uwezo wa kushughulikia kazi za muda mrefu zaidi, zinazohusisha uwezo wa wakala.
Wakati huo huo, OpenAI ilitambua kuwa kazi nyingi zinahitaji utafiti wa kina mtandaoni au muktadha wa nje, uwezo mkubwa wa kufikiri, utambuzi wa vyanzo vya habari, na kiwango cha ubunifu. Hatimaye, OpenAI ilitengeneza mbinu za mafunzo ya mfumo zinazoweza kushughulikia kazi hizi. Waliamua kufundisha mifumo kufanya kazi za kuvinjari, wakitumia mbinu sawa na za kufundisha mifumo ya kufikiri lakini zikitumika kwa kazi za ulimwengu halisi zaidi.
Mradi wa Deep Research ulianza na onyesho la awali la Isa Fulford na Yash Patil. Josh Tobin alijiunga tena na OpenAI karibu miezi sita iliyopita baada ya kufanya kazi katika kampuni changa, akavutiwa sana na kazi ya msingi, na akajiunga na mradi wa Deep Research.
Watu Muhimu:
- Isa Fulford: Mtafiti wa AI katika timu ya Post-training ya OpenAI, mchangiaji mkuu wa ChatGPT Retrieval Plugin.
- Yash Patil: Mjumbe wa timu ya msingi ya mfumo katika timu ya Post-training ya OpenAI, akiwa ameacha masomo Stanford.
- Josh Tobin: Hapo awali alikuwa Mwanasayansi wa Utafiti katika OpenAI, baadaye akaanzisha Gantry (bidhaa ya kuboresha ML kupitia uchambuzi, arifa, na maoni ya binadamu). Alijiunga tena na OpenAI na sasa anaongoza timu ya utafiti wa bidhaa za Agents.
Mtiririko wa Ufafanuzi
Deep Research ina muundo wa kipekee: mtiririko wa ufafanuzi. Kabla ya kuanza utafiti, mfumo wa Deep Research humuuliza mtumiaji maswali. Kwa kawaida, ChatGPT huuliza tu maswali ya ufuatiliaji mwishoni mwa jibu au huuliza ikiwa jibu linaridhisha, tofauti na Deep Research, ambayo inashiriki katika tabia hii mapema.
Hii ilikuwa chaguo la makusudi la muundo wa timu. Watumiaji hupokea majibu bora kutoka kwa mfumo wa Deep Research pale tu ambapo maagizo yao ni wazi na ya kina. Hata hivyo, watumiaji mara nyingi hawatoi habari zote katika agizo lao la awali. Kwa hivyo, OpenAI ilitaka kuhakikisha kuwa baada ya kusubiri dakika 5 au 30, watumiaji watapokea jibu la kina na la kuridhisha. Hatua hii ya ziada iliongezwa ili kuhakikisha watumiaji wanatoa maelezo yote muhimu kwa mfumo.
Watumiaji wengi kwenye X wametaja kuingiliana na o1 au o1 Pro kwanza ili kuboresha maagizo yao. Mara tu wanaporidhika, wanatuma agizo kwa Deep Research.
Aina ya Mwisho ya Mawakala
Katika miezi michache iliyopita, OpenAI imezindua matoleo matatu tofauti ya Deep Research, yote yakiitwa Deep Research. Josh Tobin anaamini kuwa ingawa kila bidhaa ina nguvu na udhaifu wake, tofauti za ubora kati yao zinaonekana. Hatimaye, hii ni kwa sababu ya jinsi mifumo inavyojengwa, juhudi zilizowekezwa katika kujenga seti za data, na matumizi ya mifumo ya O-series kama injini. Hii inaruhusu mifumo ya Deep Research kuboreshwa, na kuunda zana zenye akili nyingi na za ubora wa juu.
Hivi sasa, Deep Research, O3, na Operator ni huru. Hata hivyo, OpenAI inalenga kwa watumiaji hatimaye kuwa na wakala mmoja, wa mwisho ambaye anaweza kufanya utafutaji wa wavuti, kutumia kompyuta, au kukamilisha kazi nyingine zinazohitajika, akiunganisha kazi hizi zote kwa njia ya asili zaidi.
Mafunzo ya Mwisho hadi Mwisho ndio Sababu ya Msingi ya Nguvu ya Mfumo
Mfumo wa msingi wa Deep Research ni toleo lililoboreshwa la O3. O3 ni mfumo wa juu zaidi wa kufikiri wa OpenAI, na uwezo mwingi wa uchambuzi wa Deep Research unatoka humo. OpenAI ilifundisha haswa mfumo wa Deep Research juu ya kazi ngumu za kuvinjari na kazi nyingine za kufikiri. Kwa hivyo, Deep Research pia inaweza kutumia zana za kuvinjari na zana za Python. Kupitia mafunzo ya mwisho hadi mwisho juu ya kazi hizi, Deep Research ilijifunza mikakati ya kuzishughulikia, hatimaye ikifanya mfumo kuwa bora katika uchambuzi wa utafutaji mtandaoni.
Kwa intuitively, mtumiaji hufanya ombi, na mfumo kwanza hufikiria kwa makini juu yake. Kisha, hutafuta habari husika, huichambua, na kuisoma. Baada ya kuelewa jinsi habari hii inavyohusiana na ombi, mfumo huamua nini cha kutafuta baadaye ili kupata karibu na jibu la mwisho linalohitajika na mtumiaji. Deep Research inaweza kuunganisha habari hii yote katika ripoti nadhifu, yenye marejeleo yanayoelekeza kwenye vyanzo vya asili.
Ubunifu unaoipa Deep Research uwezo wake wa wakala upo katika mafunzo ya mwisho hadi mwisho ya OpenAI ya mfumo. Hii inamaanisha kuwa shughuli nyingi wakati wa mchakato wa utafiti hazitabiriki mapema. Haiwezekani kufikia unyumbufu ambao mfumo hupata kupitia mafunzo kwa kuandika mfumo wa lugha, programu, au hati. Kupitia mafunzo, mfumo wa Deep Research ulijifunza jinsi ya kuguswa na habari ya wavuti ya wakati halisi na kurekebisha mikakati mara moja kulingana na kile inachokiona. Kwa hivyo, mfumo wa Deep Research kwa kweli unafanya utafutaji wa ubunifu sana. Watumiaji wanaweza kuona jinsi mfumo ulivyo na akili katika kuamua nini cha kutafuta baadaye au jinsi ya kukwepa masuala fulani kwa kusoma muhtasari wa CoT.
Tofauti Kati ya Deep Research na Utafutaji wa AI
Kuhusu swali la John Collison kuhusu ni kiasi gani cha uwezo wa Deep Research kinatokana na ufikiaji wa wakati halisi wa maudhui ya wavuti na ni kiasi gani kutoka kwa CoT, watafiti hao wawili wa OpenAI wanaamini kuwa uwezo bora wa Deep Research ni matokeo ya mchanganyiko wa yote mawili.
Bidhaa nyingine za utafutaji wa AI hazifunzwi mwisho hadi mwisho, kwa hivyo hazina unyumbufu katika kujibu habari kama Deep Research, wala hazina ubunifu katika kutatua matatizo maalum.
Kabla ya kujiunga na OpenAI, Josh Tobin alifanya kazi katika kampuni changa na alijaribu kujenga mawakala kwa njia ambayo watu wengi wanaelezea kuwajenga, kimsingi kujenga grafu ya operesheni na LLMs zikiingilia kati katika baadhi ya nodi. Wakati LLM inaweza kuamua nini cha kufanya baadaye, mantiki ya mlolongo mzima wa hatua hufafanuliwa na wanadamu.
Josh Tobin aliona hii kuwa njia yenye nguvu ya uundaji wa haraka, lakini ilikumbana na matatizo haraka katika ulimwengu halisi. Ni vigumu kuona mapema hali zote ambazo mfumo unaweza kukabiliana nazo na kuzingatia matawi yote tofauti ya njia ambazo inaweza kutaka kuchukua. Zaidi ya hayo, kwa kuwa mifumo hii haijafunzwa haswa kufanya maamuzi, mara nyingi sio watoa maamuzi bora kwenye nodi; wamefundishwa kufanya kitu sawa na kufanya maamuzi.
Hii inasisitiza kuwa nguvu ya kweli ya mfumo wa Deep Research inatokana na mafunzo ya moja kwa moja ya mwisho hadi mwisho, ikilenga kutatua kazi ambazo watumiaji wanahitaji kutatua. Kwa hivyo, hakuna haja ya kuweka grafu ya operesheni au kufanya maamuzi ya nodi katika usanifu wa nyuma; kila kitu kinaendeshwa na mfumo wenyewe.
Zaidi ya hayo, ikiwa mtumiaji ana mtiririko wa kazi maalum na unaotabirika, basi kuufanya kwa njia ambayo Josh Tobin alielezea hapo juu ni muhimu. Lakini ikiwa usindikaji rahisi sana unahitajika, basi mbinu sawa na Deep Research inaweza kuwa chaguo bora.
Josh Tobin anapendekeza kuwa baadhi ya sheria kali hazipaswi kuwekwa kwa bidii kwenye mfumo. Ikiwa kuna haja kama ‘kutotaka mfumo ufikie hifadhidata fulani,’ ni bora kuitekeleza kwa mantiki iliyoandikwa kwa mkono. Watu mara nyingi hufikiri wanaweza kuwa na akili zaidi kuliko mfumo kwa kuandika msimbo, lakini kwa kweli, kadiri uwanja unavyoendelea, mifumo kawaida huja na suluhisho bora kuliko wanadamu.
Moja ya masomo muhimu zaidi ya kujifunza kwa mashine ni kwamba matokeo unayopata yanategemea kile unachoboresha. Kwa hivyo, ikiwa watumiaji wanaweza kuanzisha mfumo wa kuboresha moja kwa moja kwa matokeo yanayotarajiwa, itakuwa bora zaidi kuliko kujaribu kuunganisha mifumo ambayo haifai kazi nzima. Kwa hivyo, RL tuning kwenye msingi wa mfumo wa jumla inaweza kuwa sehemu muhimu ya kujenga mawakala wenye nguvu zaidi.
Data ya Ubora wa Juu ni Moja ya Mambo Muhimu kwa Mafanikio ya Mfumo
Moja ya mambo muhimu kwa mafanikio ya mfumo wa Deep Research ni kuwa na seti ya data ya ubora wa juu. Ubora wa data inayoingizwa kwenye mfumo kuna uwezekano kuwa jambo muhimu linaloamua ubora wa mfumo. Katika mradi wa Deep Research, Edward Sun huboresha seti zote za data.
Faida za Deep Research
Nguvu ya Deep Research iko katika uwezo wake wa kutoa majibu bora wakati watumiaji wana maelezo ya kina ya mahitaji yao. Hata hivyo, hata kama swali la mtumiaji haliko wazi, Deep Research inaweza kufafanua habari inayotakiwa. Ni nguvu zaidi wakati watumiaji wanatafuta seti maalum ya habari.
Deep Research haiwezi tu kukusanya kwa upana habari zote kuhusu chanzo lakini pia ni bora katika kupata ukweli usiojulikana sana, kama vile maudhui ya mkia mrefu ambayo hayangeonekana kwenye kurasa chache za kwanza katika utafutaji wa jadi, maelezo ya kipindi maalum cha kipindi cha televisheni kisichojulikana, na kadhalika. Katika swali kuhusu jenerali wa Austria, ChatGPT iliwahi kutoa jibu lisilo sahihi, wakati Deep Research ilifanikiwa kupata jibu sahihi.
Deep Research ni nzuri sana katika kuunganisha habari, haswa katika kupata habari maalum, ngumu kupata. Hata hivyo, Deep Research si nzuri sana katika kutoa maarifa mapya kutoka kwa habari iliyopo na bado haiwezi kufanya uvumbuzi mpya wa kisayansi.
Matumizi ya Deep Research
Watumiaji Lengo
Deep Research imeundwa kwa ajili ya mtu yeyote anayefanya kazi ya maarifa katika kazi yake ya kila siku au maisha, haswa wale wanaohitaji kukusanya kiasi kikubwa cha habari, kuchambua data, na kufanya maamuzi. Watumiaji wengi hutumia Deep Research kwa kazi zao, kama vile katika utafiti, kuelewa hali katika maeneo kama masoko, kampuni, na mali isiyohamishika.
Matumizi
OpenAI inatumai Deep Research inaweza kutumika kwa matukio ya biashara na maisha ya kibinafsi, kwani kwa kweli ni uwezo unaoweza kutumika kwa kazi na maisha ya kibinafsi. Rufaa ya Deep Research iko katika uwezo wake wa kuokoa muda mwingi. Baadhi ya kazi ambazo zingeweza kuchukua masaa au hata siku sasa zinaweza kujibiwa kwa 90% na Deep Research. OpenAI inaamini kutakuwa na kazi nyingi zinazofanana katika matukio ya biashara, lakini Deep Research pia itakuwa sehemu ya maisha ya kibinafsi ya watu.
Deep Research si kuhusu kuchukua nafasi ya wafanyakazi. Kwa kazi ya maarifa, haswa kazi zinazohitaji muda mwingi kupata habari na kufikia hitimisho, Deep Research itawawezesha watu kwa nguvu kubwa, ikiruhusu kazi ambazo zingeweza kuchukua masaa 4 au 8 kukamilika kwa dakika 5, ikiruhusu watumiaji kufikia zaidi.
Mahojiano yalitaja matumizi ikiwa ni pamoja na: matibabu, uwekezaji, na matukio mengine ya kazi ya kitaaluma; ununuzi, usafiri, na matukio mengine ya familia; upangaji programu na elimu ya kibinafsi.
Matibabu, Uwekezaji, na Matukio Mengine ya Kazi ya Kitaaluma
Katika dawa, Deep Research inaweza kusaidia kupata fasihi zote au kesi za hivi karibuni za ugonjwa fulani, na hivyo kuokoa muda.
Katika uwekezaji, kwa msaada wa Deep Research, wawekezaji wanaweza kuchagua kufanya utafiti kwa kila kampuni changa inayoweza kuwekeza, sio tu zile ambazo wana muda wa kukutana nazo.
Katika uendeshaji wa kampuni, mtumiaji anayefikiria kuanzisha kampuni ya bidhaa za watumiaji amekuwa akitumia Deep Research sana kuamua ikiwa majina maalum ya chapa tayari yamesajiliwa, ikiwa majina ya kikoa yamechukuliwa, ukubwa wa soko, na habari nyingine mbalimbali.
Ununuzi, Usafiri, na Matukio Mengine ya Familia
Mtumiaji anayefikiria kununua gari jipya alitaka kujua ni lini mtindo unaofuata utatolewa. Kulikuwa na makala nyingi za kubahatisha mtandaoni, kwa hivyo mtumiaji aliuliza Deep Research kukusanya uvumi wote husika. Deep Research ilitoa ripoti bora, ikimjulisha mtumiaji kuwa gari jipya linaweza kutolewa katika miezi michache ijayo.
Wakati Deep Research ilizinduliwa nchini Japani, watumiaji waliona kuwa inasaidia sana katika kupata mikahawa inayokidhi mahitaji maalum na pia inaweza kusaidia watumiaji kugundua vitu ambavyo labda hawangevipata vinginevyo.
Wakati watumiaji wanahitaji kununua bidhaa ya gharama kubwa, kupanga safari maalum, au kutumia muda mwingi kufikiria juu ya tatizo, wanaweza kutumia masaa mengi mtandaoni wakitafuta habari husika, wakivinjari hakiki zote, nk. Deep Research inaweza kupanga habari hii haraka, kuunda ripoti ya muhtasari, na kutoa ushauri wa kina na wa kibinafsi.
Akina mama wenye shughuli nyingi za kazi mara nyingi hawana muda wa kupanga sherehe za siku ya kuzaliwa kwa watoto wao, lakini sasa wanaweza kuifanya haraka kwa msaada wa Deep Research.
Deep Research pia ni bora katika kufuata maagizo. Ikiwa watumiaji hawataki tu kujua kuhusu bidhaa bali pia wanataka kuilinganisha na bidhaa nyingine zote, au hata wanataka kuona hakiki kutoka kwa tovuti kama Reddit, wanaweza kufanya maombi mengi tofauti kwa Deep Research, na itakamilisha kazi hizi zote mara moja. Watumiaji wanaweza pia kuuliza Deep Research kuweka habari katika jedwali.
Upangaji Programu
Watu wengi hutumia Deep Research kwa upangaji programu. Tukio hili halikuzingatiwa hapo awali na OpenAI, lakini watu wengi wanaitumia kuandika msimbo, kutafuta msimbo, hata kupata nyaraka za hivi karibuni za kifurushi, au kuandika hati, na matokeo ya kuvutia.
Elimu
Elimu ya kibinafsi ni tukio la matumizi la kuvutia sana. Ikiwa watumiaji wana mada wanayotaka kujifunza, kama vile kukagua biolojia au kuelewa matukio ya sasa, wanahitaji tu kutoa sehemu ambazo hawaelewi au habari wanayotaka kuchunguza, na Deep Research inaweza kukusanya ripoti ya kina. Labda katika siku zijazo, itawezekana kutoa elimu ya kibinafsi kulingana na kile Deep Research inajifunza kuhusu mtumiaji.
Mawakala Wataibuka mnamo 2025
Mielekeo ya Maendeleo ya Baadaye ya Deep Research
Kwa upande wa fomu ya bidhaa, OpenAI inatumai kuwa Deep Research itaweza kupachika picha katika siku zijazo, kupata picha za bidhaa, kutoa chati, na kupachika chati hizi katika majibu.
Kwa upande wa vyanzo vya habari, OpenAI inatumai kupanua vyanzo vya data ambavyo mfumo unaweza kufikia. Wanatumai mfumo utaweza kutafuta data ya kibinafsi katika siku zijazo. OpenAI itaongeza zaidi uwezo wa mfumo, na kuifanya iwe bora katika kuvinjari na uchambuzi.
Kwa upande wa usahihi wa habari, ili kuwawezesha watumiaji kuamini matokeo ya Deep Research, watumiaji wanaweza kuona vyanzo vya habari vilivyotajwa na mfumo. Wakati wa mchakato wa mafunzo ya mfumo, OpenAI pia inajitahidi kuhakikisha usahihi wa marejeleo, lakini mfumo bado unaweza kufanya makosa, kuona ndoto, au hata kuamini chanzo ambacho kinaweza kuwa si cha kuaminika zaidi. Kwa hivyo, hili ni eneo ambalo OpenAI inatumai kuendelea kuboresha.
Ili kuunganisha kwa upana zaidi katika ramani ya barabara ya OpenAI Agent, OpenAI inatumai kuwa Deep Research inaweza kupanuliwa kwa matukio mengi tofauti ya matumizi, ikichanganya mifumo ya juu zaidi ya kufikiri na zana ambazo wanadamu wanaweza kutumia kukamilisha kazi au kazi za maisha ya kila siku, na kisha kuboresha moja kwa moja mfumo ili kufikia matokeo ambayo watumiaji wanataka wakala afikie.
Katika hatua hii, kwa kweli hakuna kinachozuia Deep Research kupanuka hadi matukio magumu zaidi ya kazi. AGI sasa ni suala la uendeshaji, na kutakuwa na maendeleo mengi ya kusisimua ya kutazamia katika siku zijazo.
Sam Altman anaamini kuwa kazi ambazo Deep Research inaweza kukamilisha zitachangia asilimia chache ya kazi zote zenye faida kiuchumi ulimwenguni. Josh Tobin anaamini kuwa Deep Research haiwezi kufanya kazi yote kwa watumiaji, lakini inaweza kuokoa watumiaji masaa kadhaa au hata siku. OpenAI inatumai kuwa lengo la karibu ni kwa Deep Research na mawakala waliojengwa baadaye, pamoja na mawakala wengine waliojengwa juu ya msingi huu, kuokoa watumiaji 1%, 5%, 10%, au 25% ya muda wao, kulingana na aina ya kazi wanayofanya.
Wakala & RL
Isa Fulford na Josh Tobin wanakubali kuwa mawakala wataibuka mwaka huu.
RL ilipata kilele, kisha ikaonekana kuwa na shimo kidogo, na sasa inapata umakini tena. Yann LeCun aliwahi kuwa na mlinganisho: ikiwa watu wanatengeneza keki, nyingi itakuwa keki, kutakuwa na icing kidogo, na hatimaye cherries chache juu. Kujifunza bila kusimamiwa ni kama keki, kujifunza kwa kusimamiwa ni icing, na RL ni cherry.
Josh Tobin anaamini kuwa wakati wa kufanya RL mnamo 2015-2016, kwa kutumia mlinganisho wa keki, inaweza kuwa ilikuwa ikijaribu kuongeza cherry bila keki. Lakini sasa, kuna mifumo ya lugha iliyofunzwa mapema juu ya kiasi kikubwa cha data, mifumo hii ni yenye nguvu sana, na tunajua jinsi ya kufanya uboreshaji wa kusimamiwa kwenye mifumo hii ya lugha ili kuifanya iwe nzuri katika kutekeleza maagizo na kufanya kile watu wanataka. Sasa kila kitu kinafanya kazi vizuri sana, na inafaa sana kurekebisha mifumo hii kulingana na kazi za malipo zilizofafanuliwa na mtumiaji kwa kesi yoyote ya matumizi.