OpenAI sedang melancarkan model AI utama terbarunya, yang dikenali secara dalaman sebagai Orion. Walaupun dinamakan secara rasmi sebagai GPT-4.5, keluaran ini tidak dikategorikan sebagai model “frontier” oleh syarikat itu.
Batu Loncatan, Bukan Lompatan Besar
GPT-4.5 sedang disediakan kepada pengguna ChatGPT Pro sebagai pratonton penyelidikan. OpenAI menggembar-gemburkannya sebagai “model paling berpengetahuan setakat ini,” tetapi komunikasi awal memberi amaran bahawa ia mungkin tidak sepadan dengan prestasi model seperti o1 atau o3-mini. Ini menunjukkan tumpuan pada penghalusan dan kecekapan dan bukannya kemajuan yang terobosan.
Keupayaan Dipertingkat, Interaksi Diperhalusi
Apakah yang boleh dijangkakan oleh pengguna daripada GPT-4.5? OpenAI menyerlahkan peningkatan dalam beberapa bidang utama:
- Kehebatan Menulis: Model ini direka untuk menjadi pembantu penulisan yang lebih berkebolehan.
- Pengetahuan Dunia yang Diperluas: GPT-4.5 mempunyai pemahaman yang lebih luas tentang konsep dan maklumat dunia sebenar.
- ‘Personaliti Diperhalusi’: OpenAI mendakwa interaksi dengan model ini akan berasa lebih semula jadi dan intuitif.
Syarikat itu menekankan keupayaan GPT-4.5 untuk mengenal pasti corak dan membuat perkaitan, menjadikannya sangat sesuai untuk tugas seperti menulis, pengaturcaraan dan menangani masalah praktikal.
Bukan Model Frontier: Memahami Perbezaannya
Walaupun terdapat peningkatan ini, OpenAI jelas bahawa GPT-4.5 tidak mewakili lonjakan ke dalam keupayaan yang sama sekali baharu. Dokumen yang bocor, kemudian disemak, memberikan konteks selanjutnya:
“GPT-4.5 bukan model frontier, tetapi ia adalah LLM terbesar OpenAI, meningkatkan kecekapan pengiraan GPT-4 lebih daripada 10x,” kata dokumen itu. “Ia tidak memperkenalkan 7 keupayaan frontier bersih baharu berbanding keluaran penaakulan sebelumnya, dan prestasinya adalah di bawah o1, o3-mini, dan penyelidikan mendalam pada kebanyakan penilaian kesediaan.”
Perbezaan ini adalah penting. Ia menunjukkan bahawa walaupun GPT-4.5 merupakan peningkatan yang ketara dari segi skala dan kecekapan, ia tidak menolak sempadan keupayaan AI dengan cara yang sama seperti model “frontier”.
Latihan dan Pembangunan
Laporan menunjukkan bahawa OpenAI menggunakan model penaakulan o1 (nama kod Strawberry) dan data sintetik untuk melatih GPT-4.5. Syarikat itu mengesahkan gabungan teknik penyeliaan novel dan kaedah yang mantap:
- Supervised Fine-Tuning (SFT)
- Reinforcement Learning from Human Feedback (RLHF)
Ini adalah serupa dengan pendekatan yang digunakan dalam membangunkan GPT-4o.
Menangani Halusinasi dan Meningkatkan Kerjasama
Satu peningkatan ketara ialah pengurangan halusinasi. Menurut OpenAI, GPT-4.5 kurang berhalusinasi berbanding GPT-4o dan malah sedikit kurang daripada model o1.
Raphael Gontijo Lopes, seorang penyelidik OpenAI, menekankan tumpuan kepada kerjasama: “Kami menjajarkan GPT-4.5 untuk menjadi rakan usaha sama yang lebih baik, menjadikan perbualan berasa lebih mesra, lebih intuitif dan bernuansa emosi.” Beliau menyatakan bahawa penguji manusia menilai GPT-4.5 lebih tinggi daripada GPT-4o merentasi pelbagai kategori.
Perspektif CEO: Mengakui Batasan
Ketua Pegawai Eksekutif OpenAI Sam Altman, dalam catatan di X, mengakui sifat GPT-4.5: “model gergasi, mahal” yang “tidak akan menghancurkan penanda aras.” Penilaian yang jujur ini mengukuhkan idea bahawa keluaran ini adalah mengenai kemajuan berperingkat dan bukannya kejayaan revolusioner.
Pelan Pelancaran
Pelancaran GPT-4.5 mengikut pendekatan berperingkat:
- Pengguna Pro: Akses segera sebagai pratonton penyelidikan.
- Pengguna Plus dan Team: Ketersediaan dijangka minggu depan.
- Pengguna Enterprise dan Edu: Akses untuk mengikuti selepas pengguna Plus dan Team.
Model ini juga tersedia melalui platform AI Foundry Microsoft Azure, bersama-sama dengan tawaran daripada Stability, Cohere dan Microsoft sendiri.
Ketepatan dan Pengurangan Halusinasi
OpenAI menyerlahkan ketepatan GPT-4.5 yang dipertingkatkan, mendakwa ia menjana respons yang lebih tepat dan kurang berhalusinasi berbanding modelnya yang lain. Ini adalah langkah penting ke hadapan, kerana halusinasi (menjana maklumat palsu atau tidak masuk akal) telah menjadi cabaran berterusan dalam model bahasa yang besar.
Memandang Ke Hadapan: GPT-5 dan Laluan ke AGI
Pelaporan terdahulu mencadangkan garis masa untuk keluaran OpenAI: GPT-4.5 menjelang akhir Februari dan GPT-5 seawal akhir Mei. Altman telah menyifatkan GPT-5 sebagai “sistem yang menyepadukan banyak teknologi kami.” Ia dijangka menggabungkan model penaakulan o3 baharu OpenAI, yang telah diusik semasa pengumuman “12 hari Krismas” syarikat itu pada bulan Disember.
Walaupun o3-mini telah dikeluarkan lebih awal, model o3 penuh dikhaskan untuk sistem GPT-5. Ini sejajar dengan visi OpenAI yang lebih luas untuk menggabungkan model bahasa besarnya untuk mencipta sistem yang lebih berkebolehan, yang berpotensi menghampiri alam kecerdasan am buatan (AGI).
Menyelidiki Lebih Dalam Seni Bina GPT-4.5
Walaupun OpenAI tidak mengeluarkan butiran teknikal yang lengkap, beberapa kesimpulan boleh dibuat tentang seni bina GPT-4.5 berdasarkan maklumat yang tersedia:
Kiraan Parameter Lebih Besar: Digambarkan sebagai “LLM terbesar OpenAI,” adalah munasabah untuk menganggap bahawa GPT-4.5 mempunyai kiraan parameter yang jauh lebih tinggi daripada pendahulunya. Peningkatan kapasiti ini berkemungkinan menyumbang kepada peningkatan asas pengetahuan dan kebolehan penaakulannya.
Kecekapan Pengiraan Dioptimumkan: Dokumen yang bocor menyebut peningkatan “lebih daripada 10x” dalam kecekapan pengiraan berbanding GPT-4. Ini menunjukkan penghalusan seni bina yang membolehkan model memproses maklumat dengan lebih berkesan, yang berpotensi membawa kepada masa tindak balas yang lebih pantas dan mengurangkan penggunaan tenaga.
Mekanisme Perhatian Dipertingkat: Memandangkan penekanan pada pengecaman corak dan membuat perkaitan, berkemungkinan GPT-4.5 menggabungkan kemajuan dalam mekanisme perhatian. Mekanisme ini membolehkan model memfokuskan pada bahagian yang paling relevan bagi teks input, yang membawa kepada respons yang lebih koheren dan sesuai dengan konteks.
Data Latihan Diperhalusi: Penggunaan “teknik penyeliaan baharu” membayangkan peningkatan dalam kualiti dan kepelbagaian data latihan. Ini boleh melibatkan penggabungan set data yang lebih khusus, memanfaatkan penjanaan data sintetik, atau menggunakan kaedah yang lebih canggih untuk menapis dan membersihkan data sedia ada.
Peranan Data Sintetik
Penggunaan data sintetik yang dilaporkan dalam latihan GPT-4.5 amat ketara. Data sintetik, yang dijana oleh model AI itu sendiri, menawarkan beberapa potensi kelebihan:
Mengatasi Kekurangan Data: Ia boleh digunakan untuk menambah set data sedia ada, terutamanya dalam domain di mana data dunia sebenar adalah terhad atau sukar diperoleh.
Menangani Bias: Data sintetik boleh direka dengan teliti untuk mengurangkan bias yang terdapat dalam set data dunia sebenar, yang membawa kepada model AI yang lebih adil dan saksama.
Meneroka Senario Hipotesis: Ia membolehkan penyelidik melatih model pada senario yang mungkin jarang berlaku atau mustahil untuk diperhatikan di dunia nyata, meningkatkan keupayaan mereka untuk mengendalikan situasi yang tidak dijangka.
Walau bagaimanapun, penggunaan data sintetik juga menimbulkan kebimbangan:
Potensi untuk Menguatkan Bias: Jika tidak dikawal dengan teliti, data sintetik secara tidak sengaja boleh menguatkan bias sedia ada atau memperkenalkan yang baharu.
Risiko Terlebih Muat: Model yang dilatih terutamanya pada data sintetik mungkin berprestasi baik pada data sintetik yang serupa tetapi bergelut untuk menjana kepada input dunia sebenar.
Pendekatan OpenAI untuk menggunakan data sintetik berkemungkinan melibatkan pengesahan dan ujian yang teliti untuk mengurangkan risiko ini.
‘Personaliti Diperhalusi’: Pandangan Lebih Dekat
Dakwaan OpenAI bahawa GPT-4.5 mempunyai ‘personaliti yang diperhalusi’ adalah menarik. Ini menunjukkan usaha untuk menjadikan interaksi model lebih menarik, semula jadi dan bijak dari segi emosi. Ini boleh melibatkan beberapa teknik:
Penalaan Halus pada Data Perbualan: Melatih model pada set data besar perbualan manusia untuk lebih memahami nuansa bahasa, nada dan isyarat sosial.
Menggabungkan Model Kecerdasan Emosi: Mengintegrasikan model khusus yang direka untuk mengenali dan bertindak balas terhadap emosi manusia, membolehkan GPT-4.5 menyesuaikan gaya komunikasinya dengan sewajarnya.
Pembelajaran Pengukuhan dengan Maklum Balas Manusia: Menggunakan maklum balas manusia untuk memberi ganjaran kepada respons yang dianggap lebih semula jadi, menarik dan empati.
Matlamatnya adalah untuk mencipta pengalaman perbualan yang lebih seperti manusia, bergerak melangkaui interaksi yang purely functional untuk memupuk rasa hubungan dan rapport.
Implikasi untuk Kumpulan Pengguna yang Berbeza
Pelancaran berperingkat GPT-4.5 mencadangkan implikasi yang berbeza untuk pelbagai kumpulan pengguna:
Pengguna Pro: Sebagai pengguna awal, pengguna Pro akan berpeluang untuk bereksperimen dengan keupayaan model dan memberikan maklum balas kepada OpenAI. Maklum balas ini akan menjadi penting dalam membentuk pembangunan model selanjutnya.
Pengguna Plus dan Team: Pengguna ini berkemungkinan akan mendapat manfaat daripada prestasi yang dipertingkatkan dan gaya interaksi GPT-4.5 yang diperhalusi dalam tugas harian mereka, seperti menulis, pengekodan dan penyelidikan.
Pengguna Enterprise dan Edu: Bagi pengguna ini, ketepatan yang dipertingkatkan dan pengurangan halusinasi boleh menjadi sangat berharga, memastikan hasil yang lebih dipercayai dan boleh dipercayai dalam tetapan profesional dan pendidikan.
Pengguna Microsoft Azure AI Foundry: Ketersediaan GPT-4.5 pada platform ini meluaskan akses kepada model untuk pembangun dan penyelidik, memupuk inovasi dan penciptaan aplikasi berkuasa AI baharu.
Konteks yang Lebih Luas: Strategi OpenAI
Keluaran GPT-4.5, walaupun bukan model frontier, sesuai dengan strategi OpenAI yang lebih luas iaitu pembangunan berulang dan kemajuan beransur-ansur ke arah AGI. Dengan mengeluarkan peningkatan tambahan, OpenAI boleh:
Mengumpul Maklum Balas Pengguna: Terus memperhalusi modelnya berdasarkan penggunaan dan maklum balas dunia sebenar.
Mengurus Jangkaan: Elakkan gembar-gembur yang berlebihan dan tetapkan jangkaan yang realistik untuk setiap keluaran.
Mengekalkan Kelebihan Daya Saing: Kekal di hadapan dalam bidang AI yang berkembang pesat.
Bersedia untuk Kejayaan Masa Depan: Meletakkan asas untuk kemajuan yang lebih ketara, seperti GPT-5.
Pendekatan ini berbeza dengan keluaran “big bang” beberapa syarikat AI lain, mencadangkan pendekatan yang lebih berhati-hati dan terukur untuk membangunkan dan menggunakan sistem AI yang semakin berkuasa. Tumpuan bukan sahaja pada menolak sempadan apa yang mungkin tetapi juga pada memastikan keselamatan, kebolehpercayaan dan kepuasan pengguna.
Pembangunan dan penggunaan model seperti GPT-4.5 menimbulkan banyak persoalan:
- Bagaimanakah kita boleh mengukur sama ada model itu mempunyai ‘personaliti yang diperhalusi’?
- Apakah implikasi model yang kurang berhalusinasi?
- Apakah kepentingan mengeluarkan model yang bukan model frontier?
Ini semua adalah soalan yang baik, dan tiada jawapan yang pasti.