OpenAI meluncurkan model AI mayor terbarunya, yang dikenal secara internal sebagai Orion. Meskipun secara resmi bernama GPT-4.5, rilis ini tidak dikategorikan sebagai model “frontier” oleh perusahaan.
Langkah Kecil, Bukan Lompatan Besar
GPT-4.5 sedang disediakan untuk pengguna ChatGPT Pro sebagai pratinjau penelitian. OpenAI menggembar-gemborkannya sebagai “model paling berpengetahuan” mereka, tetapi komunikasi awal memperingatkan bahwa itu mungkin tidak sesuai dengan kinerja model seperti o1 atau o3-mini. Ini menunjukkan fokus pada penyempurnaan dan efisiensi daripada kemajuan yang inovatif.
Peningkatan Kemampuan, Interaksi yang Lebih Baik
Apa yang dapat diharapkan pengguna dari GPT-4.5? OpenAI menyoroti peningkatan di beberapa area utama:
- Kecakapan Menulis: Model ini dirancang untuk menjadi asisten menulis yang lebih mumpuni.
- Pengetahuan Dunia yang Diperluas: GPT-4.5 memiliki pemahaman yang lebih luas tentang konsep dan informasi dunia nyata.
- ‘Kepribadian yang Lebih Halus’: OpenAI mengklaim interaksi dengan model ini akan terasa lebih alami dan intuitif.
Perusahaan menekankan kemampuan GPT-4.5 untuk mengenali pola dan menarik koneksi, membuatnya sangat cocok untuk tugas-tugas seperti menulis, pemrograman, dan menangani masalah praktis.
Bukan Model Frontier: Memahami Perbedaannya
Terlepas dari peningkatan ini, OpenAI jelas bahwa GPT-4.5 tidak mewakili lompatan ke kemampuan yang sama sekali baru. Sebuah dokumen yang bocor, yang kemudian direvisi, memberikan konteks lebih lanjut:
“‘GPT-4.5 bukanlah model frontier, tetapi ini adalah LLM terbesar OpenAI, meningkatkan efisiensi komputasi GPT-4 lebih dari 10x lipat,’” kata dokumen itu. “‘Ini tidak memperkenalkan 7 kemampuan frontier baru dibandingkan dengan rilis penalaran sebelumnya, dan kinerjanya di bawah o1, o3-mini, dan penelitian mendalam pada sebagian besar evaluasi kesiapan.’”
Perbedaan ini penting. Ini menunjukkan bahwa meskipun GPT-4.5 merupakan peningkatan yang signifikan dalam hal skala dan efisiensi, ia tidak mendorong batas kemampuan AI dengan cara yang sama seperti model “frontier”.
Pelatihan dan Pengembangan
Laporan menunjukkan bahwa OpenAI menggunakan model penalaran o1 (dengan nama kode Strawberry) dan data sintetis untuk melatih GPT-4.5. Perusahaan mengkonfirmasi kombinasi teknik supervisi baru dan metode yang sudah mapan:
- Supervised Fine-Tuning (SFT)
- Reinforcement Learning from Human Feedback (RLHF)
Ini mirip dengan pendekatan yang digunakan dalam mengembangkan GPT-4o.
Mengatasi Halusinasi dan Meningkatkan Kolaborasi
Salah satu peningkatan penting adalah pengurangan halusinasi. Menurut OpenAI, GPT-4.5 lebih jarang berhalusinasi daripada GPT-4o dan bahkan sedikit kurang dari model o1.
Raphael Gontijo Lopes, seorang peneliti OpenAI, menekankan fokus pada kolaborasi: “‘Kami menyelaraskan GPT-4.5 untuk menjadi kolaborator yang lebih baik, membuat percakapan terasa lebih hangat, lebih intuitif, dan bernuansa emosional.’” Dia mencatat bahwa penguji manusia menilai GPT-4.5 lebih tinggi daripada GPT-4o di berbagai kategori.
Perspektif CEO: Mengakui Keterbatasan
CEO OpenAI Sam Altman, dalam sebuah postingan di X, mengakui sifat GPT-4.5: “‘model raksasa, mahal’” yang “‘tidak akan menghancurkan tolok ukur.’” Penilaian jujur ini memperkuat gagasan bahwa rilis ini adalah tentang kemajuan bertahap daripada terobosan revolusioner.
Rencana Peluncuran
Peluncuran GPT-4.5 mengikuti pendekatan bertingkat:
- Pengguna Pro: Akses langsung sebagai pratinjau penelitian.
- Pengguna Plus dan Tim: Ketersediaan diharapkan minggu depan.
- Pengguna Enterprise dan Edu: Akses akan menyusul setelah pengguna Plus dan Tim.
Model ini juga tersedia melalui platform AI Foundry Microsoft Azure, bersama dengan penawaran dari Stability, Cohere, dan Microsoft sendiri.
Akurasi dan Pengurangan Halusinasi
OpenAI menyoroti peningkatan akurasi GPT-4.5, mengklaim bahwa model ini menghasilkan respons yang lebih akurat dan lebih sedikit berhalusinasi dibandingkan dengan model lainnya. Ini adalah langkah maju yang krusial, karena halusinasi (menghasilkan informasi palsu atau tidak masuk akal) telah menjadi tantangan yang terus-menerus dalam model bahasa besar.
Melihat ke Depan: GPT-5 dan Jalan Menuju AGI
Pelaporan sebelumnya menyarankan jadwal waktu untuk rilis OpenAI: GPT-4.5 pada akhir Februari dan GPT-5 paling cepat akhir Mei. Altman telah menggambarkan GPT-5 sebagai “‘sistem yang mengintegrasikan banyak teknologi kami.’” Diharapkan untuk menggabungkan model penalaran o3 baru OpenAI, yang diisyaratkan selama pengumuman “‘12 hari Natal’” perusahaan pada bulan Desember.
Sementara o3-mini dirilis lebih awal, model o3 lengkap dicadangkan untuk sistem GPT-5. Ini sejalan dengan visi OpenAI yang lebih luas untuk menggabungkan model bahasa besar untuk menciptakan sistem yang lebih mumpuni, yang berpotensi mendekati ranah artificial general intelligence (AGI).
Menyelami Lebih Dalam Arsitektur GPT-4.5
Meskipun OpenAI belum merilis detail teknis yang lengkap, beberapa kesimpulan dapat ditarik tentang arsitektur GPT-4.5 berdasarkan informasi yang tersedia:
Jumlah Parameter yang Lebih Besar: Digambarkan sebagai “LLM terbesar OpenAI,” masuk akal untuk berasumsi bahwa GPT-4.5 memiliki jumlah parameter yang jauh lebih tinggi daripada pendahulunya. Peningkatan kapasitas ini kemungkinan berkontribusi pada peningkatan basis pengetahuan dan kemampuan penalarannya.
Efisiensi Komputasi yang Dioptimalkan: Dokumen yang bocor menyebutkan peningkatan “lebih dari 10x” dalam efisiensi komputasi dibandingkan dengan GPT-4. Ini menunjukkan penyempurnaan arsitektur yang memungkinkan model untuk memproses informasi secara lebih efektif, yang berpotensi menghasilkan waktu respons yang lebih cepat dan pengurangan konsumsi energi.
Mekanisme Perhatian yang Ditingkatkan: Mengingat penekanan pada pengenalan pola dan menarik koneksi, kemungkinan GPT-4.5 menggabungkan kemajuan dalam mekanisme perhatian. Mekanisme ini memungkinkan model untuk fokus pada bagian yang paling relevan dari teks input, yang mengarah ke respons yang lebih koheren dan sesuai konteks.
Data Pelatihan yang Disempurnakan: Penggunaan “teknik supervisi baru” mengisyaratkan peningkatan kualitas dan keragaman data pelatihan. Ini dapat melibatkan penggabungan kumpulan data yang lebih khusus, memanfaatkan pembuatan data sintetis, atau menggunakan metode yang lebih canggih untuk memfilter dan membersihkan data yang ada.
Peran Data Sintetis
Penggunaan data sintetis yang dilaporkan dalam pelatihan GPT-4.5 sangat penting. Data sintetis, yang dihasilkan oleh model AI itu sendiri, menawarkan beberapa keuntungan potensial:
Mengatasi Kelangkaan Data: Dapat digunakan untuk menambah kumpulan data yang ada, terutama di domain di mana data dunia nyata terbatas atau sulit diperoleh.
Mengatasi Bias: Data sintetis dapat dibuat dengan hati-hati untuk mengurangi bias yang ada dalam kumpulan data dunia nyata, yang mengarah ke model AI yang lebih adil dan setara.
Menjelajahi Skenario Hipotetis: Memungkinkan peneliti untuk melatih model pada skenario yang mungkin jarang atau tidak mungkin diamati di dunia nyata, meningkatkan kemampuan mereka untuk menangani situasi yang tidak terduga.
Namun, penggunaan data sintetis juga menimbulkan kekhawatiran:
Potensi untuk Memperkuat Bias: Jika tidak dikontrol dengan hati-hati, data sintetis dapat secara tidak sengaja memperkuat bias yang ada atau memperkenalkan yang baru.
Risiko Overfitting: Model yang dilatih terutama pada data sintetis mungkin berkinerja baik pada data sintetis serupa tetapi kesulitan untuk menggeneralisasi ke input dunia nyata.
Pendekatan OpenAI untuk menggunakan data sintetis kemungkinan melibatkan validasi dan pengujian yang cermat untuk mengurangi risiko ini.
‘Kepribadian yang Lebih Halus’: Tinjauan Lebih Dekat
Klaim OpenAI bahwa GPT-4.5 memiliki ‘kepribadian yang lebih halus’ sangat menarik. Ini menunjukkan upaya untuk membuat interaksi model lebih menarik, alami, dan cerdas secara emosional. Ini dapat melibatkan beberapa teknik:
Penyetelan Halus pada Data Percakapan: Melatih model pada kumpulan data besar percakapan manusia untuk lebih memahami nuansa bahasa, nada, dan isyarat sosial.
Menggabungkan Model Kecerdasan Emosional: Mengintegrasikan model khusus yang dirancang untuk mengenali dan merespons emosi manusia, memungkinkan GPT-4.5 untuk menyesuaikan gaya komunikasinya.
Reinforcement Learning dengan Umpan Balik Manusia: Menggunakan umpan balik manusia untuk menghargai respons yang dianggap lebih alami, menarik, dan empatik.
Tujuannya adalah untuk menciptakan pengalaman percakapan yang lebih mirip manusia, bergerak melampaui interaksi yang murni fungsional untuk menumbuhkan rasa koneksi dan hubungan baik.
Implikasi untuk Kelompok Pengguna yang Berbeda
Peluncuran bertahap GPT-4.5 menunjukkan implikasi yang berbeda untuk berbagai kelompok pengguna:
Pengguna Pro: Sebagai pengadopsi awal, pengguna Pro akan memiliki kesempatan untuk bereksperimen dengan kemampuan model dan memberikan umpan balik kepada OpenAI. Umpan balik ini akan sangat penting dalam membentuk pengembangan model lebih lanjut.
Pengguna Plus dan Tim: Pengguna ini kemungkinan akan mendapat manfaat dari peningkatan kinerja dan gaya interaksi GPT-4.5 yang lebih baik dalam tugas sehari-hari mereka, seperti menulis, coding, dan penelitian.
Pengguna Enterprise dan Edu: Untuk pengguna ini, peningkatan akurasi dan pengurangan halusinasi dapat sangat berharga, memastikan hasil yang lebih andal dan dapat dipercaya dalam pengaturan profesional dan pendidikan.
Pengguna Microsoft Azure AI Foundry: Ketersediaan GPT-4.5 di platform ini memperluas akses ke model untuk pengembang dan peneliti, mendorong inovasi dan penciptaan aplikasi bertenaga AI baru.
Konteks yang Lebih Luas: Strategi OpenAI
Peluncuran GPT-4.5, meskipun bukan model frontier, cocok dengan strategi OpenAI yang lebih luas tentang pengembangan iteratif dan kemajuan bertahap menuju AGI. Dengan merilis peningkatan bertahap, OpenAI dapat:
Mengumpulkan Umpan Balik Pengguna: Terus menyempurnakan modelnya berdasarkan penggunaan dan umpan balik dunia nyata.
Mengelola Ekspektasi: Hindari overhyping dan tetapkan ekspektasi yang realistis untuk setiap rilis.
Mempertahankan Keunggulan Kompetitif: Tetap terdepan dalam bidang AI yang berkembang pesat.
Mempersiapkan Terobosan Masa Depan: Meletakkan dasar untuk kemajuan yang lebih signifikan, seperti GPT-5.
Pendekatan ini berbeda dengan rilis “big bang” dari beberapa perusahaan AI lainnya, yang menunjukkan pendekatan yang lebih hati-hati dan terukur untuk mengembangkan dan menerapkan sistem AI yang semakin kuat. Fokusnya tidak hanya pada mendorong batas-batas dari apa yang mungkin, tetapi juga pada memastikan keamanan, keandalan, dan kepuasan pengguna.
Pengembangan dan penerapan model seperti GPT-4.5 menimbulkan banyak pertanyaan:
- Bagaimana kita dapat mengukur apakah model tersebut memiliki “kepribadian yang lebih halus”?
- Apa implikasi dari model yang lebih sedikit berhalusinasi?
- Apa pentingnya merilis model yang bukan model frontier?
Ini semua adalah pertanyaan bagus, dan tidak ada jawaban pasti.