OpenAI Lancar o1-pro: Model Penaakulan Berkuasa

Keupayaan Penaakulan yang Dipertingkatkan

Model o1-pro membezakan dirinya daripada model o1 asal dengan memanfaatkan kuasa pengkomputeran yang jauh lebih besar. Menurut OpenAI, peningkatan keupayaan pemprosesan ini menghasilkan ‘respons yang lebih baik secara konsisten’. Model penaakulan, seperti o1-pro, direka untuk mencapai ketepatan yang lebih tinggi daripada model bahasa besar (LLM) standard seperti GPT-4 OpenAI. Mereka mencapai ini dengan memperuntukkan lebih banyak masa untuk menganalisis dan merumuskan respons kepada gesaan pengguna.

Akses Terhad dan Kos Tinggi

Pada masa ini, akses kepada o1-pro adalah terhad kepada sekumpulan pembangun terpilih. Hanya mereka yang telah membelanjakan sekurang-kurangnya $5 untuk perkhidmatan API OpenAI layak. Tambahan pula, kos penggunaan o1-pro adalah besar.

OpenAI telah menetapkan harga pada $150 bagi setiap juta token input (kira-kira 750,000 perkataan diproses) dan $600 bagi setiap juta token output yang dijana. Struktur harga ini menjadikan o1-pro dua kali lebih mahal daripada GPT-4.5, model biasa OpenAI yang paling berkuasa, dan sepuluh kali lebih mahal daripada model o1 asal. Berbanding dengan model OpenAI yang paling berpatutan, GPT-4o-mini, o1-pro adalah 10,000 kali lebih mahal.

Membenarkan Premium

Justifikasi utama untuk harga premium ini ialah peningkatan kuasa pengkomputeran, yang membawa kepada kualiti respons yang lebih baik. Spesifikasi lain sebahagian besarnya mencerminkan model o1. Ini termasuk tetingkap konteks 200,000 token, had 100,000 token pada output, dan tarikh pemotongan pengetahuan pada 30 September 2023. O1-pro juga menyokong input imej dan pemanggilan fungsi, membolehkan sambungan ke sumber data luaran. Selain itu, ia menawarkan output berstruktur, ciri yang membolehkan pembangun memastikan respons dijana dalam format data tertentu.

Fokus pada Ejen AI

Ketersediaan awal o1-pro secara eksklusif melalui Responses API mencadangkan fokus utama pada ejen AI. Ejen ini ialah aplikasi yang direka untuk melaksanakan tugas secara autonomi bagi pihak pengguna. Pembangun yang telah membina aplikasi menggunakan API Chat Completions OpenAI pada masa ini tidak dapat mengakses o1-pro.

Memenuhi Permintaan Pembangun?

Walaupun kosnya jauh lebih tinggi berbanding o1, OpenAI menjangkakan bahawa sesetengah pembangun akan mendapati peningkatan prestasi itu berbaloi dengan pelaburan.

Jurucakap OpenAI menjelaskan kepada TechCrunch, ‘O1-pro dalam API ialah versi o1 yang menggunakan lebih banyak pengkomputeran untuk berfikir lebih keras dan memberikan jawapan yang lebih baik kepada masalah yang paling sukar. Selepas mendapat banyak permintaan daripada komuniti pembangun kami, kami teruja untuk membawanya ke API untuk menawarkan respons yang lebih dipercayai.’

OpenAI berkongsi tangkapan skrin di X yang mempamerkan banyak permintaan daripada komuniti pembangun untuk versi o1 yang lebih berkuasa dengan akses API. Walau bagaimanapun, masih belum dapat dipastikan sama ada pengguna ini akan berpuas hati sepenuhnya dengan tawaran tersebut.

Prestasi Lalu dan Potensi Masa Depan

Lelaran o1-pro sebelum ini, yang disediakan kepada pelanggan ChatGPT Pro pada bulan Disember, menerima ulasan bercampur-campur. Pengguna melaporkan bahawa model itu bergelut dengan tugas tertentu, seperti teka-teki Sudoku dan melihat ilusi optik.

Keputusan ujian penanda aras yang diterbitkan pada bulan Disember menunjukkan bahawa o1-pro memberikan hasil yang hanya sedikit lebih baik daripada o1 apabila dibentangkan dengan masalah matematik dan tugas pengekodan.

OpenAI juga telah membangunkan model penaakulan yang lebih maju, o3, tetapi ia belum dikeluarkan lagi. Kewujudan o3 mencadangkan komitmen berterusan untuk menolak sempadan keupayaan penaakulan AI, walaupun model o1-pro semasa mempunyai had. Strategi penetapan harga untuk o1-pro juga mungkin merupakan petunjuk bagaimana OpenAI berhasrat untuk meletakkan dan mengewangkan model masa depannya yang lebih maju. Kos yang tinggi boleh menjadi cara untuk mengurus permintaan sambil turut menandakan nilai yang ketara dan sumber pengkomputeran yang berkaitan dengan teknologi AI termaju ini.

Menyelidiki Lebih Dalam Model Penaakulan

Konsep ‘penaakulan’ dalam AI adalah rumit. Tidak seperti LLM standard yang memfokuskan terutamanya pada pengecaman corak dan penjanaan teks berdasarkan set data yang luas, model penaakulan bertujuan untuk meniru proses kognitif seperti manusia. Ini melibatkan bukan sahaja mengingat semula maklumat tetapi juga menganalisisnya, membuat inferens dan membuat potongan logik.

Peningkatan kuasa pengkomputeran yang diperuntukkan kepada o1-pro bertujuan untuk memudahkan pemprosesan yang lebih mendalam ini. Daripada hanya meramalkan perkataan seterusnya yang paling mungkin dalam urutan, model itu direka untuk mempertimbangkan pelbagai kemungkinan, menilai perkaitannya, dan membina respons berdasarkan pemahaman yang lebih bernuansa tentang input.

Cabaran Menilai Penaakulan

Menilai keupayaan penaakulan sebenar model AI adalah usaha yang mencabar. Penanda aras tradisional, yang sering tertumpu pada ketepatan dalam tugas tertentu, mungkin tidak dapat menangkap sepenuhnya nuansa penaakulan. Model mungkin berprestasi baik pada ujian piawai tetapi masih bergelut dengan senario dunia sebenar yang memerlukan akal atau kebolehsuaian.

Maklum balas bercampur-campur pada versi o1-pro yang lebih awal menyerlahkan kesukaran ini. Walaupun ia mungkin menunjukkan sedikit peningkatan dalam ujian penanda aras tertentu, perjuangannya dengan tugas seperti Sudoku dan ilusi optik mencadangkan had dalam keupayaannya untuk menggunakan logik dan penaakulan spatial dengan cara yang benar-benar seperti manusia.

Peranan Responses API

Keputusan untuk mengeluarkan o1-pro secara eksklusif melalui Responses API pada mulanya adalah satu keputusan yang strategik. API ini direka khusus untuk membina ejen AI, iaitu aplikasi yang boleh mengautomasikan tugas yang kompleks. Dengan memfokuskan pada kes penggunaan ini, OpenAI boleh menyasarkan pembangun yang paling mungkin mendapat manfaat daripada keupayaan penaakulan o1-pro yang dipertingkatkan dan berpotensi sanggup membayar harga premium.

Ejen AI selalunya memerlukan lebih daripada sekadar menjana teks. Mereka perlu berinteraksi dengan sistem lain, membuat keputusan berdasarkan keadaan yang berubah-ubah, dan melaksanakan tindakan secara terkoordinasi. Responses API, ditambah dengan keupayaan o1-pro, menyediakan rangka kerja untuk membina ejen pintar sedemikian.

Masa Depan Penaakulan dalam AI

Pembangunan o1-pro, dan kewujudan model o3 yang lebih maju, menandakan trend yang ketara dalam bidang AI. Memandangkan LLM menjadi semakin mahir dalam menjana teks berkualiti manusia, tumpuan beralih ke arah kebolehan kognitif peringkat tinggi seperti penaakulan.

Matlamat jangka panjang adalah untuk mencipta sistem AI yang bukan sahaja dapat memahami dan bertindak balas terhadap maklumat tetapi juga menyelesaikan masalah, menyesuaikan diri dengan situasi baharu, dan juga mempamerkan satu bentuk kreativiti. Ini memerlukan peralihan melangkaui padanan corak mudah dan ke arah model yang benar-benar boleh menaakul dan membuat pertimbangan termaklum.

Implikasi Ekonomi

Kos tinggi o1-pro juga menimbulkan persoalan penting tentang ekonomi AI termaju. Jika model berkuasa ini kekal sangat mahal untuk diakses, ia boleh mewujudkan jurang dalam landskap AI. Syarikat yang lebih besar dan penyelidik yang dibiayai dengan baik mungkin mempunyai kelebihan yang ketara, manakala organisasi yang lebih kecil dan pembangun individu mungkin tidak mampu.

Ini boleh memberi implikasi kepada inovasi dan persaingan dalam bidang tersebut. Ia juga menimbulkan persoalan tentang pengagihan saksama faedah AI. Memandangkan teknologi ini menjadi semakin berkuasa, memastikan akses yang luas dan kemampuan akan menjadi penting untuk mengelakkan penumpuan kuasa dan peluang. Penetapan harga o1-pro berfungsi sebagai petunjuk awal cabaran yang berpotensi ini dan keperluan untuk pertimbangan yang teliti terhadap kesan ekonomi dan masyarakat AI termaju. Evolusi model penetapan harga, dan potensi untuk pilihan yang lebih berpatutan pada masa hadapan, akan menjadi faktor utama dalam membentuk kebolehcapaian dan pendemokrasian teknologi berkuasa ini.