Peningkatan Bertahap, Biaya Meroket
GPT-4.5 menawarkan penyempurnaan di beberapa area utama. OpenAI mengklaim peningkatan akurasi, pengurangan tendensi untuk ‘berhalusinasi’ (menghasilkan informasi palsu), dan peningkatan kemampuan untuk meyakinkan. Namun, peningkatan ini datang dengan biaya yang mahal. Struktur harga untuk menggunakan GPT-4.5 ditetapkan sebesar $75 per juta token input dan $150 per juta token output. Harga ini memicu perdebatan sengit dalam komunitas AI, dengan para ahli terbagi tajam mengenai apakah peningkatan bertahap tersebut sepadan dengan pengeluaran finansial yang signifikan.
Pertanyaan intinya berkisar pada proposisi nilai aktual dari GPT-4.5. Meskipun percakapan yang lebih lancar dan akurasi yang sedikit meningkat disambut baik, pertanyaan mendasarnya tetap: apakah ini merupakan lompatan maju yang signifikan dalam kemampuan AI, atau apakah ini hanya penyempurnaan mahal dari teknologi yang ada?
Pengujian Dunia Nyata: Kesenjangan dari Klaim OpenAI?
Evaluasi independen terhadap GPT-4.5 semakin memicu perdebatan. Andrej Karpathy, tokoh terkemuka di bidang AI, melakukan eksperimen komparatif yang mengadu GPT-4 melawan GPT-4.5. Lima tugas menulis kreatif disajikan kepada pengguna, yang kemudian diminta untuk menilai kualitas output. Anehnya, hasilnya lebih menyukai model GPT-4 yang lebih lama dalam empat dari lima tugas. Hasil ini secara langsung menantang gagasan bahwa GPT-4.5 mewakili iterasi yang unggul secara universal.
Penilaian teknis Dr. Raj Dandeker menghasilkan hasil yang sama mengkhawatirkannya. Tesnya berfokus pada area di mana OpenAI secara eksplisit mengklaim peningkatan, seperti penalaran matematis dan deduksi logis. Namun, GPT-4.5 dilaporkan kesulitan di area ini, menunjukkan sedikit atau tidak ada keuntungan dibandingkan pendahulunya. Temuan ini secara langsung bertentangan dengan pernyataan OpenAI dan menimbulkan pertanyaan serius tentang transparansi dan keakuratan klaim pemasaran perusahaan.
Reaksi Media dan Industri: Spektrum Opini
Tanggapan media terhadap GPT-4.5 mencerminkan perbedaan pendapat dalam komunitas AI. Majalah Wired, suara terkemuka dalam jurnalisme teknologi, menawarkan perspektif kritis, mempertanyakan upaya OpenAI yang tak henti-hentinya untuk mencapai Artificial General Intelligence (AGI) dan mengkarakterisasi GPT-4.5 sebagai peningkatan mahal dengan hanya keuntungan marjinal. Futurism, publikasi berpengaruh lainnya, mencatat penurunan hype awal seputar rilis, menunjukkan skeptisisme yang berkembang tentang potensi sebenarnya dari teknologi tersebut.
Namun, tidak semua reaksi negatif. Jacob Rintamaki, yang berafiliasi dengan Stanford University, menawarkan penilaian yang lebih positif, secara khusus memuji peningkatan selera humor GPT-4.5. Dia berpendapat bahwa ini merupakan langkah maju yang signifikan dalam kemampuan AI untuk memahami dan terlibat dalam interaksi sosial. Ini menyoroti ceruk potensial untuk GPT-4.5: unggul dalam area di mana komunikasi yang bernuansa dan selera humor sangat penting.
Kompetisi Ikut Berbicara
Bahkan model AI yang bersaing, dalam arti tertentu, telah ‘mengomentari’ rilis GPT-4.5. Grok dari xAI, model bahasa saingan, mengakui peningkatan kemampuan percakapan GPT-4.5 tetapi juga menunjukkan sifatnya yang intensif sumber daya. Ini menggarisbawahi kekhawatiran kritis: kekuatan komputasi yang dibutuhkan untuk menjalankan GPT-4.5, yang secara langsung diterjemahkan ke dalam biaya operasional yang lebih tinggi dan jejak lingkungan yang lebih besar.
ChatGPT sendiri, ketika diminta, menekankan retensi konteks, kreativitas, dan akurasi GPT-4.5 yang ditingkatkan. Namun, ia juga mengakui bahwa model tersebut masih menunjukkan kekurangan, terutama dalam percakapan yang diperpanjang, di mana ia terkadang dapat kehilangan jejak dialog yang sedang berlangsung atau menghasilkan respons yang tidak konsisten. Penilaian diri ini, meskipun tampak objektif, semakin memperkuat persepsi bahwa GPT-4.5, terlepas dari kemajuannya, tetap merupakan teknologi yang tidak sempurna.
Menggali Lebih Dalam ke Spesifik
Untuk memahami penerimaan yang beragam, penting untuk memeriksa klaim dan klaim balik spesifik seputar GPT-4.5 secara lebih rinci.
1. Klaim Peningkatan Akurasi:
OpenAI menegaskan bahwa GPT-4.5 lebih akurat daripada pendahulunya. Meskipun ini mungkin benar dalam tugas-tugas tertentu yang didefinisikan secara sempit, tes independen oleh Karpathy dan Dandeker meragukan generalisasi klaim ini. Tampaknya peningkatan akurasi tidak seragam di semua domain dan mungkin kurang signifikan daripada yang diiklankan sebelumnya.
2. Janji Pengurangan Halusinasi:
‘Halusinasi,’ kecenderungan model bahasa untuk menghasilkan informasi palsu atau tidak masuk akal, telah menjadi tantangan yang terus-menerus di lapangan. OpenAI mengklaim bahwa GPT-4.5 telah membuat langkah dalam mengurangi masalah ini. Namun, laporan pengguna dan bukti anekdotal menunjukkan bahwa halusinasi, meskipun mungkin lebih jarang, tetap menjadi masalah. Model ini masih dapat menghasilkan ketidakakuratan yang dinyatakan dengan percaya diri, terutama ketika berhadapan dengan topik yang kompleks atau bernuansa.
3. Seni Persuasi:
OpenAI menyoroti kemampuan persuasif GPT-4.5 yang ditingkatkan. Hal ini menimbulkan masalah etika, karena AI yang lebih persuasif dapat digunakan untuk tujuan manipulatif, seperti menyebarkan informasi yang salah atau memengaruhi opini dengan cara yang tidak diinginkan. Sejauh mana persuasif GPT-4.5 mewakili peningkatan yang tulus atau risiko potensial tetap menjadi subjek perdebatan yang sedang berlangsung.
4. Keunggulan Percakapan:
GPT-4.5 tidak diragukan lagi merupakan pembicara yang lebih fasih dan menarik daripada GPT-4. Ini mungkin merupakan peningkatan yang paling signifikan dan mudah terlihat. Model ini menghasilkan teks yang mengalir lebih alami, meniru pola bicara seperti manusia secara lebih efektif, dan menunjukkan pemahaman yang lebih besar tentang nuansa percakapan. Ini membuatnya lebih cocok untuk aplikasi seperti chatbot, asisten virtual, dan alat tulis kreatif.
5. Defisit Penalaran:
Terlepas dari peningkatan percakapan, kurangnya kemajuan substansial dalam kemampuan penalaran merupakan poin penting bagi banyak kritikus. GPT-4.5 masih berjuang dengan tugas-tugas yang membutuhkan deduksi logis, penalaran matematis, dan pemahaman akal sehat. Keterbatasan ini menghambat penerapannya dalam domain yang menuntut pemikiran analitis yang tepat, seperti penelitian ilmiah, pemodelan keuangan, dan analisis hukum.
6. Faktor Biaya:
Biaya selangit untuk menggunakan GPT-4.5 merupakan penghalang masuk yang signifikan bagi banyak calon pengguna. Struktur harga, berdasarkan token input dan output, membuatnya sangat mahal untuk aplikasi skala besar atau penggunaan berkelanjutan. Hal ini menimbulkan kekhawatiran tentang aksesibilitas dan kesetaraan, karena hanya organisasi dan individu yang didanai dengan baik yang mampu memanfaatkan teknologi tersebut.
7. Label ‘Pratinjau Penelitian’:
Keputusan OpenAI untuk merilis GPT-4.5 sebagai ‘pratinjau penelitian’ patut diperhatikan. Ini menunjukkan bahwa model tersebut masih dalam pengembangan dan dapat mengalami penyempurnaan lebih lanjut. Ini juga menyiratkan bahwa OpenAI menyadari keterbatasan dan mencari umpan balik dari pengguna untuk memandu peningkatan di masa mendatang. Namun, label ‘pratinjau penelitian’ tidak sepenuhnya memaafkan biaya tinggi atau perbedaan antara klaim OpenAI dan kinerja aktual model.
Konteks yang Lebih Luas: Perlombaan Senjata AI
Peluncuran GPT-4.5 harus dipahami dalam konteks yang lebih luas dari ‘perlombaan senjata AI’ yang sedang berlangsung. Perusahaan seperti OpenAI, Google, dan Anthropic terlibat dalam persaingan ketat untuk mengembangkan model AI yang paling canggih dan mumpuni. Tekanan kompetitif ini dapat menyebabkan rilis yang terburu-buru, klaim yang berlebihan, dan fokus pada peningkatan bertahap daripada terobosan mendasar.
Pengejaran AGI, AI hipotetis dengan kecerdasan tingkat manusia dan kemampuan pemecahan masalah umum, tetap menjadi kekuatan pendorong di balik banyak penelitian dan pengembangan di lapangan. Namun, GPT-4.5, terlepas dari kemajuannya, jauh dari tujuan ambisius ini. Ini berfungsi sebagai pengingat bahwa jalan menuju AGI kemungkinan akan panjang dan sulit, dan bahwa terobosan yang tulus jarang terjadi dan sulit dicapai.
Masa Depan GPT-4.5
Nasib akhir GPT-4.5 masih belum pasti. Sebagai ‘pratinjau penelitian’, kemungkinan akan berkembang seiring waktu. OpenAI dapat mengatasi kritik dan meningkatkan kemampuan penalaran model, mengurangi biayanya, atau menyempurnakan kinerjanya dalam domain tertentu.
Namun, penerimaan yang beragam terhadap GPT-4.5 menyoroti pentingnya evaluasi kritis dan pengujian independen di bidang AI. Ini juga menggarisbawahi perlunya transparansi yang lebih besar dari perusahaan seperti OpenAI, terutama mengenai kemampuan dan keterbatasan model mereka.
Untuk saat ini, GPT-4.5 berdiri sebagai bukti kemajuan yang sedang berlangsung dalam AI, tetapi juga sebagai kisah peringatan tentang bahaya hype, tantangan untuk mencapai terobosan yang tulus, dan pentingnya menyeimbangkan inovasi dengan pertimbangan etis dan realitas praktis. Label harga yang tinggi, ditambah dengan laba atas investasi yang dipertanyakan, menjadikannya kemewahan yang hanya sedikit orang yang mampu, dan bahkan lebih sedikit lagi yang dapat membenarkannya. Ini berfungsi sebagai pengingat kuat bahwa kemajuan dalam AI tidak selalu linier, dan bahwa model yang lebih besar dan lebih mahal tidak selalu lebih baik.