OpenAI baru-baru ini melancarkan GPT-4.5, yang pada mulanya dibentangkan sebagai pratonton penyelidikan. Iterasi baharu model bahasa yang berkuasa ini telah disediakan secara terhad, dengan tanda harga yang tinggi: Pengguna Pro menghadapi bayaran bulanan $200, manakala pengguna Plus boleh mengaksesnya dengan harga $20 sebulan. Walaupun CEO OpenAI, Sam Altman, telah menggembar-gemburkan GPT-4.5 sebagai model yang lebih semula jadi dan perbualan, pelancaran itu telah disambut dengan sambutan yang pelbagai, terutamanya mengenai keupayaan penaakulan terasnya.
Peningkatan Tambahan, Kos Astronomi
GPT-4.5 mempunyai penambahbaikan dalam beberapa bidang utama. OpenAI mendakwa peningkatan dalam ketepatan, pengurangan kecenderungan untuk ‘berhalusinasi’ (menjana maklumat palsu), dan keupayaan yang dipertingkatkan untuk memujuk. Walau bagaimanapun, peningkatan ini datang pada kos yang tinggi. Struktur harga untuk menggunakan GPT-4.5 ditetapkan pada $75 bagi setiap juta token input dan $150 yang mengejutkan bagi setiap juta token output. Penetapan harga ini telah mencetuskan perdebatan hangat dalam komuniti AI, dengan pakar-pakar berpecah pendapat sama ada peningkatan tambahan itu mewajarkan perbelanjaan kewangan yang begitu ketara.
Persoalan teras berkisar pada proposisi nilai sebenar GPT-4.5. Walaupun perbualan yang lebih lancar dan ketepatan yang sedikit lebih baik dialu-alukan, persoalan asas kekal: adakah ia mewakili lonjakan ketara ke hadapan dalam keupayaan AI, atau adakah ia hanyalah penghalusan teknologi sedia ada yang mahal?
Ujian Dunia Sebenar: Terputus daripada Dakwaan OpenAI?
Penilaian bebas GPT-4.5 telah memarakkan lagi perdebatan. Andrej Karpathy, tokoh terkemuka dalam bidang AI, menjalankan eksperimen perbandingan yang mengadu GPT-4 menentang GPT-4.5. Lima tugasan penulisan kreatif telah dibentangkan kepada pengguna, yang kemudiannya diminta untuk menilai kualiti output. Anehnya, keputusan memihak kepada model GPT-4 yang lebih lama dalam empat daripada lima tugasan. Hasil ini secara langsung mencabar tanggapan bahawa GPT-4.5 mewakili lelaran yang lebih unggul secara universal.
Penilaian teknikal Dr. Raj Dandeker menghasilkan keputusan yang sama membimbangkan. Ujiannya tertumpu pada bidang yang didakwa oleh OpenAI secara eksplisit, seperti penaakulan matematik dan potongan logik. Walau bagaimanapun, GPT-4.5 dilaporkan bergelut dalam bidang ini, menunjukkan sedikit atau tiada kelebihan berbanding pendahulunya. Penemuan ini secara langsung bercanggah dengan dakwaan OpenAI dan menimbulkan persoalan serius tentang ketelusan dan ketepatan dakwaan pemasaran syarikat.
Reaksi Media dan Industri: Spektrum Pendapat
Respons media terhadap GPT-4.5 telah mencerminkan pendapat yang berbelah bahagi dalam komuniti AI. Majalah Wired, suara terkemuka dalam kewartawanan teknologi, menawarkan perspektif kritikal, mempersoalkan usaha OpenAI yang tidak henti-henti untuk mencapai Artificial General Intelligence (AGI) dan mencirikan GPT-4.5 sebagai peningkatan yang mahal dengan hanya keuntungan marginal. Futurism, satu lagi penerbitan berpengaruh, mencatatkan penurunan dalam gembar-gembur awal sekitar pelancaran itu, menunjukkan keraguan yang semakin meningkat tentang potensi sebenar teknologi itu.
Walau bagaimanapun, tidak semua reaksi adalah negatif. Jacob Rintamaki, yang bergabung dengan Stanford University, menawarkan penilaian yang lebih positif, khususnya memuji deria humor GPT-4.5 yang lebih baik. Beliau berhujah bahawa ini merupakan satu langkah penting ke hadapan dalam keupayaan AI untuk memahami dan terlibat dalam interaksi sosial. Ini menyerlahkan potensi niche untuk GPT-4.5: cemerlang dalam bidang di mana komunikasi bernuansa dan rasa humor adalah yang terpenting.
Pertandingan Menimbang
Malah model AI yang bersaing, dalam erti kata lain, telah ‘mengulas’ mengenai pelancaran GPT-4.5. Grok xAI, model bahasa saingan, mengakui peningkatan GPT-4.5 dalam kebolehan perbualan tetapi juga menunjukkan sifatnya yang intensif sumber. Ini menggariskan kebimbangan kritikal: kuasa pengiraan semata-mata yang diperlukan untuk menjalankan GPT-4.5, yang diterjemahkan secara langsung kepada kos operasi yang lebih tinggi dan jejak alam sekitar yang lebih besar.
ChatGPT sendiri, apabila digesa, menekankan pengekalan konteks, kreativiti dan ketepatan GPT-4.5 yang dipertingkatkan. Walau bagaimanapun, ia juga mengakui bahawa model itu masih mempamerkan kelemahan, terutamanya dalam perbualan lanjutan, di mana ia kadangkala boleh kehilangan jejak dialog yang berterusan atau menjana respons yang tidak konsisten. Penilaian kendiri ini, walaupun kelihatan objektif, mengukuhkan lagi persepsi bahawa GPT-4.5, walaupun kemajuannya, kekal sebagai teknologi yang tidak sempurna.
Menyelidiki Lebih Dalam tentang Spesifik
Untuk memahami penerimaan yang bercampur-campur, adalah penting untuk mengkaji tuntutan dan tuntutan balas khusus yang menyelubungi GPT-4.5 dengan lebih terperinci.
1. Dakwaan Ketepatan Dipertingkatkan:
OpenAI menegaskan bahawa GPT-4.5 adalah lebih tepat daripada pendahulunya. Walaupun ini mungkin benar dalam tugasan tertentu yang ditakrifkan secara sempit, ujian bebas oleh Karpathy dan Dandeker menimbulkan keraguan tentang kebolehgeneralisasian tuntutan ini. Nampaknya peningkatan dalam ketepatan tidak seragam merentas semua domain dan mungkin kurang ketara daripada yang diiklankan pada mulanya.
2. Janji Pengurangan Halusinasi:
‘Halusinasi,’ kecenderungan model bahasa untuk menjana maklumat palsu atau tidak masuk akal, telah menjadi cabaran berterusan dalam bidang tersebut. OpenAI mendakwa bahawa GPT-4.5 telah mencapai kemajuan dalam mengurangkan isu ini. Walau bagaimanapun, laporan pengguna dan bukti anekdot menunjukkan bahawa halusinasi, walaupun mungkin kurang kerap, tetap menjadi masalah. Model itu masih boleh menghasilkan ketidaktepatan yang dinyatakan dengan yakin, terutamanya apabila berurusan dengan topik yang kompleks atau bernuansa.
3. Seni Pujukan:
OpenAI menyerlahkan keupayaan persuasif GPT-4.5 yang dipertingkatkan. Ini menimbulkan kebimbangan etika, kerana AI yang lebih meyakinkan boleh digunakan untuk tujuan manipulatif, seperti menyebarkan maklumat yang salah atau mempengaruhi pendapat dengan cara yang tidak diingini. Sejauh mana daya pujuk GPT-4.5 mewakili peningkatan tulen atau potensi risiko kekal menjadi subjek perdebatan yang berterusan.
4. Kelebihan Perbualan:
GPT-4.5 sudah pasti merupakan perbualan yang lebih fasih dan menarik daripada GPT-4. Ini mungkin merupakan peningkatan yang paling ketara dan mudah dilihat. Model ini menjana teks yang mengalir dengan lebih semula jadi, meniru corak pertuturan seperti manusia dengan lebih berkesan, dan mempamerkan pemahaman yang lebih besar tentang nuansa perbualan. Ini menjadikannya lebih sesuai untuk aplikasi seperti chatbot, pembantu maya dan alat penulisan kreatif.
5. Defisit Penaakulan:
Di sebalik peningkatan perbualan, kekurangan kemajuan yang ketara dalam kebolehan menaakul adalah titik utama bagi ramai pengkritik. GPT-4.5 masih bergelut dengan tugasan yang memerlukan potongan logik, penaakulan matematik dan pemahaman akal. Pengehadan ini menghalang kebolehgunaannya dalam domain yang menuntut pemikiran yang tepat dan analitikal, seperti penyelidikan saintifik, pemodelan kewangan dan analisis undang-undang.
6. Faktor Kos:
Kos yang terlalu tinggi untuk menggunakan GPT-4.5 merupakan penghalang penting untuk kemasukan bagi ramai pengguna yang berpotensi. Struktur harga, berdasarkan token input dan output, menjadikannya sangat mahal untuk aplikasi berskala besar atau penggunaan berterusan. Ini menimbulkan kebimbangan tentang kebolehcapaian dan ekuiti, kerana hanya organisasi dan individu yang dibiayai dengan baik mampu memanfaatkan teknologi tersebut.
7. Label ‘Pratonton Penyelidikan’:
Keputusan OpenAI untuk mengeluarkan GPT-4.5 sebagai ‘pratonton penyelidikan’ adalah penting. Ini menunjukkan bahawa model itu masih dalam pembangunan dan mungkin menjalani penambahbaikan selanjutnya. Ia juga membayangkan bahawa OpenAI menyedari had dan sedang mendapatkan maklum balas daripada pengguna untuk membimbing penambahbaikan masa hadapan. Walau bagaimanapun, label ‘pratonton penyelidikan’ tidak memaafkan sepenuhnya kos yang tinggi atau percanggahan antara tuntutan OpenAI dan prestasi sebenar model.
Konteks yang Lebih Luas: Perlumbaan Senjata AI
Pelancaran GPT-4.5 mesti difahami dalam konteks yang lebih luas iaitu ‘perlumbaan senjata AI’ yang berterusan. Syarikat seperti OpenAI, Google dan Anthropic terlibat dalam persaingan sengit untuk membangunkan model AI yang paling maju dan berkebolehan. Tekanan persaingan ini boleh membawa kepada keluaran tergesa-gesa, tuntutan yang dibesar-besarkan, dan tumpuan pada peningkatan tambahan dan bukannya penemuan asas.
Usaha AGI, AI hipotesis dengan kecerdasan peringkat manusia dan kebolehan menyelesaikan masalah am, kekal menjadi penggerak di sebalik kebanyakan penyelidikan dan pembangunan dalam bidang tersebut. Walau bagaimanapun, GPT-4.5, walaupun kemajuannya, jauh daripada matlamat bercita-cita tinggi ini. Ia berfungsi sebagai peringatan bahawa laluan ke AGI mungkin panjang dan sukar, dan kejayaan tulen adalah jarang dan sukar dicapai.
Masa Depan GPT-4.5
Nasib muktamad GPT-4.5 masih tidak menentu. Sebagai ‘pratonton penyelidikan’, ia mungkin berkembang dari semasa ke semasa. OpenAI boleh menangani kritikan dan menambah baik kebolehan penaakulan model, mengurangkan kosnya, atau memperhalusi prestasinya dalam domain tertentu.
Walau bagaimanapun, penerimaan bercampur-campur terhadap GPT-4.5 menyerlahkan kepentingan penilaian kritikal dan ujian bebas dalam bidang AI. Ia juga menekankan keperluan untuk ketelusan yang lebih besar daripada syarikat seperti OpenAI, terutamanya mengenai keupayaan dan had model mereka.
Buat masa ini, GPT-4.5 berdiri sebagai bukti kepada kemajuan berterusan dalam AI, tetapi juga sebagai kisah amaran tentang bahaya gembar-gembur, cabaran untuk mencapai kejayaan tulen, dan kepentingan mengimbangi inovasi dengan pertimbangan etika dan realiti praktikal. Tanda harga yang tinggi, ditambah dengan pulangan pelaburan yang boleh dipersoalkan, menjadikannya kemewahan yang tidak mampu dimiliki oleh ramai orang, dan lebih sedikit lagi yang boleh mewajarkannya. Ia berfungsi sebagai peringatan yang kuat bahawa kemajuan dalam AI tidak selalunya linear, dan model yang lebih besar dan lebih mahal tidak selalunya lebih baik.