GPT-4.5: Penyempurnaan, Bukan Revolusi
OpenAI baru-baru ini menyediakan GPT-4.5 untuk pengguna ChatGPT Pro, dengan akun Plus, Team, enterprise, dan education menyusul. Dikenal secara internal sebagai ‘Orion’, model ini menawarkan “pemahaman yang lebih baik tentang maksud manusia, menafsirkan isyarat halus dan harapan implisit dengan nuansa dan kecerdasan emosional yang lebih besar,” menurut OpenAI. Model ini memanfaatkan teknik supervisi baru bersama dengan fine-tuning tradisional dan reinforcement learning dari umpan balik manusia, yang mencerminkan proses pengembangan GPT-4o. GPT-4.5 menawarkan kemampuan pencarian real-time, mendukung unggahan file dan gambar, dan terintegrasi dengan kanvas untuk menulis dan coding. Namun, saat ini model ini tidak memiliki fitur multimodal seperti mode suara, video, atau berbagi layar yang ditemukan di ChatGPT.
OpenAI menekankan bahwa unsupervised learning meningkatkan akurasi dan intuisi model. Pendekatan ini telah menjadi kekuatan pendorong di balik kemajuan dalam model seperti GPT-3.5, GPT-4, dan sekarang, GPT-4.5. Secara terpisah, penskalaan penalaran melatih model untuk memproses informasi secara sistematis, menghasilkan rantai pemikiran sebelum merespons. Pendekatan metodis ini meningkatkan kemampuan mereka untuk mengatasi tantangan STEM dan logika yang rumit, seperti yang ditunjukkan oleh model seperti OpenAI o1 dan OpenAI o3-mini. GPT-4.5 disajikan sebagai contoh utama penskalaan unsupervised learning, memanfaatkan peningkatan daya komputasi, dataset yang lebih besar, dan inovasi arsitektur. Dilatih pada superkomputer Microsoft Azure AI, model ini konon memiliki pengetahuan yang lebih luas dan pemahaman yang lebih dalam tentang dunia, mengurangi halusinasi dan meningkatkan keandalan.
Terlepas dari kemajuan ini, GPT-4.5 belum menghasilkan antusiasme yang signifikan. Model ini dianggap sebagai peningkatan bertahap daripada lompatan yang inovatif. Sementara OpenAI menggembar-gemborkan peningkatan kecerdasan emosional, nuansa, dan kreativitas, banyak pengguna belum mengamati perbedaan substansial dibandingkan dengan GPT-4o. Tidak adanya kemajuan multimodal, fitur utama GPT-4o, semakin memperkuat persepsi ini.
Selain itu, GPT-4.5 telah menunjukkan kecenderungan untuk menghasilkan output yang tidak masuk akal. Alat benchmarking faktualitas internal OpenAI, SimpleQA, mengungkapkan bahwa GPT-4.5 berhalusinasi (menyajikan fabrikasi sebagai fakta dengan percaya diri) 37,1% dari waktu. Ini adalah masalah yang signifikan, bahkan jika dibandingkan dengan GPT-4o, model “penalaran” canggih lainnya, yang berhalusinasi 61,8% dari waktu pada benchmark yang sama. Model o3-mini yang lebih kecil dan lebih murah menunjukkan tingkat halusinasi yang lebih tinggi yaitu 80,3%.
Lanskap AI saat ini, yang menampilkan pesaing seperti Anthropic dengan Claude 3.7 dan kemajuan Google dengan Gemini, telah meningkatkan ekspektasi untuk peningkatan yang signifikan. Pengguna mencari terobosan, bukan hanya penyempurnaan, dan GPT-4.5, dalam bentuknya saat ini, tampaknya tidak memenuhi harapan ini.
Kebangkitan Model Penalaran dan Keyakinan Investor
Elon Musk baru-baru ini menyarankan di X bahwa Artificial General Intelligence (AGI) sudah di depan mata. Pernyataan ini muncul di tengah perlombaan yang sengit di antara raksasa teknologi seperti OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic, dan xAI milik Musk sendiri untuk mengembangkan model penalaran – sistem AI yang dirancang untuk meniru pemikiran seperti manusia.
Investor jelas menunjukkan antusiasme untuk pengejaran ini. Tak lama setelah meluncurkan Claude 3.7 Sonnet dengan penalaran hybrid, Anthropic mendapatkan pendanaan Seri E sebesar $3,5 miliar. Ini melipatgandakan valuasinya menjadi $61,5 miliar, memantapkan posisinya sebagai pesaing utama OpenAI. Investasi tersebut, yang dipimpin oleh Lightspeed Venture Partners dan termasuk Salesforce Ventures, Cisco, Fidelity, Jane Street, dan lainnya, akan digunakan untuk memperluas daya komputasi untuk pengembangan AI, meningkatkan penelitian keselamatan, dan mempercepat pertumbuhan global.
Mendorong Batas Penalaran: Benchmark BBEH
Large Language Models (LLMs) semakin terintegrasi ke dalam aplikasi sehari-hari, menuntut kemampuan penalaran yang kuat di berbagai domain. Namun, benchmark yang ada sering memprioritaskan matematika dan coding, mengabaikan jenis penalaran penting lainnya. Sementara dataset BIG-Bench telah banyak digunakan untuk menilai LLM pada tugas penalaran yang kompleks, model telah membuat kemajuan yang signifikan sehingga mereka sekarang mencapai skor yang hampir sempurna pada BIG-Bench dan variannya yang lebih menantang, BIG-Bench Hard (BBH). Kejenuhan ini membuat benchmark ini kurang efektif untuk mengukur kemajuan lebih lanjut.
Untuk mengatasi keterbatasan ini, para peneliti telah memperkenalkan BIG-Bench Extra Hard (BBEH). Benchmark baru ini menggantikan setiap tugas di BBH dengan versi yang jauh lebih sulit, sambil tetap mengevaluasi keterampilan penalaran yang serupa. Tes pada BBEH mengungkapkan bahwa bahkan model tujuan umum terbaik hanya mencapai skor 9,8%, sedangkan model teratas yang dirancang khusus untuk penalaran mencapai 44,8%. Hasil ini menyoroti tantangan berkelanjutan yang dihadapi LLM dengan penalaran yang kompleks, yang menunjukkan ruang substansial untuk perbaikan. Makalah penelitian lengkap memberikan rincian lebih lanjut tentang benchmark baru ini.
Satelit Bertenaga AI: Era Baru dalam Eksplorasi dan Operasi Luar Angkasa
TakeMe2Space, sebuah startup spacetech berbasis di Hyderabad, baru-baru ini mendapatkan Rs 5,5 crore dalam putaran pendanaan pra-seed yang dipimpin oleh Seafund, dengan partisipasi dari Blume Ventures, Artha Venture Fund, AC Ventures, dan investor angel lainnya. Pendanaan ini, meskipun sederhana, menandakan langkah signifikan menuju pendirian lab AI pertama India di luar angkasa. TakeMe2Space berencana untuk menggunakan dana tersebut untuk mengembangkan MOI-1 (My Orbital Infrastructure–Technology Demonstrator), sebuah platform yang akan memungkinkan pengguna untuk mengunggah model AI observasi bumi atau eksperimen luar angkasa lainnya langsung ke satelit orbital melalui konsol web yang disebut Orbitlab. Pengguna hanya akan membayar waktu penggunaan satelit, dengan tarif $2 per menit.
Platform MOI-TD perusahaan dilaporkan telah menunjukkan kemampuan untuk mengunggah model AI besar dari stasiun bumi, mengeksekusi kode eksternal pada satelit, dan mengunduh hasil yang dienkode dan dienkripsi dengan aman. Ini merupakan langkah menuju operasi satelit yang lebih otonom dan efisien.
TakeMe2Space tidak sendirian dalam upaya ini. Organisasi seperti ESA (dengan OPS-SAT) dan Globalstar juga memelopori aplikasi dunia nyata dari teknologi satelit bertenaga AI, mulai dari komunikasi IoT yang aman hingga eksekusi model AI di orbit. Seiring kemajuan teknologi, satelit yang digerakkan oleh AI siap untuk menjadi semakin otonom, yang mengarah ke operasi luar angkasa yang lebih efisien dan membuka kemungkinan baru untuk penelitian, keamanan, dan konektivitas global.
Secara tradisional, satelit sangat bergantung pada stasiun bumi untuk pemrosesan data, pengambilan keputusan, dan eksekusi perintah. Data harus diunduh, dianalisis di Bumi, dan kemudian wawasan yang diproses diunggah kembali ke satelit – sebuah proses yang memakan waktu dan intensif bandwidth. Namun, kemajuan dalam AI dan edge computing (memproses data pada perangkat itu sendiri daripada di cloud) sekarang memungkinkan satelit untuk memproses data onboard, membuat keputusan otonom, dan mengirimkan hanya wawasan yang paling penting dengan aman. Ini menghasilkan operasi yang lebih cepat, lebih cerdas, dan lebih efisien.
Pengoperasian satelit modern bertenaga AI biasanya melibatkan tiga langkah kunci:
- Uplink Algoritma AI: Algoritma AI ditransmisikan dari stasiun bumi ke satelit, memberi mereka kemampuan pemrosesan data yang canggih.
- Analisis Data Onboard: Model AI menganalisis gambar, data sensor, dan input lainnya langsung di orbit, meminimalkan kebutuhan intervensi ground yang konstan.
- Downlink Wawasan yang Aman: Alih-alih mengirimkan data mentah, satelit mengirimkan wawasan terenkripsi, menghemat bandwidth dan meningkatkan keamanan.
Pendekatan yang digerakkan oleh AI ini menawarkan beberapa keuntungan. Ini secara signifikan mengurangi latensi dengan memungkinkan satelit untuk memproses data di luar angkasa, memungkinkan respons yang lebih cepat terhadap kondisi real-time tanpa menunggu instruksi dari stasiun bumi. Penggunaan bandwidth dioptimalkan, karena hanya wawasan yang paling relevan yang ditransmisikan, bukan volume besar data mentah. Keamanan juga ditingkatkan melalui komunikasi terenkripsi, mengurangi risiko ancaman siber dan pelanggaran data. Manfaat ini sangat berharga dalam aplikasi seperti tanggap bencana, operasi militer, dan eksplorasi ruang angkasa.
Aplikasi dunia nyata dari satelit bertenaga AI beragam dan berdampak:
- Manajemen Bencana: Satelit yang dilengkapi dengan AI dapat mendeteksi kebakaran hutan, banjir, dan badai secara real-time, memungkinkan tindakan cepat oleh tim tanggap darurat.
- Pertanian Presisi: Model AI menganalisis kesehatan tanaman dan kondisi tanah untuk meningkatkan praktik pertanian presisi.
- Pemantauan Lingkungan: Badan lingkungan menggunakan data satelit untuk melacak tingkat polusi udara dan air.
- Navigasi Otonom dan Operasi Luar Angkasa: AI meningkatkan penghindaran tabrakan dengan memprediksi dan bereaksi terhadap potensi ancaman, memastikan keamanan satelit. Ini juga memfasilitasi koordinasi konstelasi satelit, meningkatkan jangkauan dan efisiensi. Selain itu, AI memainkan peran penting dalam melacak dan memprediksi pergerakan puing-puing orbital, mengurangi risiko kerusakan infrastruktur luar angkasa.
- Pertahanan dan Keamanan: Sistem pengawasan bertenaga AI mendeteksi aktivitas tidak sah dan pergerakan militer dengan akurasi yang meningkat.
- Telekomunikasi dan IoT: Satelit yang digerakkan oleh AI berkontribusi pada perutean lalu lintas yang lebih cerdas, meningkatkan konektivitas internet satelit dan memastikan komunikasi global yang lancar.
- Eksplorasi Luar Angkasa: AI meningkatkan efisiensi teleskop luar angkasa dalam mendeteksi asteroid dan exoplanet, secara signifikan memajukan upaya penemuan luar angkasa.
Terlepas dari banyak keuntungan, tantangan tetap ada dalam pengembangan dan penerapan satelit bertenaga AI:
- Daya Komputasi Terbatas: Satelit harus beroperasi pada chip berdaya rendah dan tahan radiasi, yang membatasi kemampuan AI.
- Lingkungan Luar Angkasa yang Keras: Paparan radiasi menimbulkan risiko kerusakan perangkat keras.
- Ancaman Keamanan: Mengunggah dan mengeksekusi kode eksternal di luar angkasa memerlukan manajemen yang cermat untuk mencegah serangan siber.
- Biaya dan Waktu Pengembangan: Membangun, menguji, dan memvalidasi perangkat keras satelit yang kompatibel dengan AI adalah proses yang mahal dan memakan waktu.
- Persyaratan Adaptabilitas: Model AI yang digunakan di orbit harus sangat mudah beradaptasi, berfungsi dengan pembaruan minimal dan menyesuaikan diri secara otonom dengan skenario baru.
AI Unlocked: Menghilangkan Frasa Berulang di ChatGPT
AI dapat menjadi alat yang berharga dalam pembuatan konten, membantu dalam menulis, brainstorming, meningkatkan kejelasan, menyempurnakan struktur, dan meningkatkan keterbacaan secara keseluruhan. Namun, masalah umum dengan teks yang dihasilkan AI adalah kecenderungannya terhadap bahasa formula karena pilihan kata yang berulang. Alih-alih menyampaikan pesan yang segar dan berdampak, AI seringkali bergantung pada pola yang familiar, mengurangi efektivitas dan orisinalitas.
Kata dan frasa yang terlalu sering digunakan, seperti “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” dan “A testament to…,” dapat secara signifikan mengurangi kualitas konten yang dihasilkan AI. Bagi pemasar produk, pengulangan ini dapat membuat pesan menjadi kurang menarik, mengurangi keterlibatan audiens, melemahkan diferensiasi merek, dan mencegah wawasan dan pesan strategis menonjol di pasar yang ramai.
Dengan memanfaatkan fitur memori ChatGPT, dimungkinkan untuk mengurangi masalah ini dan menghilangkan kata dan frasa yang terlalu sering digunakan. Berikut cara efektif memanfaatkan fitur ini:
Akses: ChatGPT dapat diakses melalui situs web atau aplikasi selulernya.
Manfaat:
- Peningkatan Orisinalitas: Memastikan konten yang dihasilkan AI terasa kurang robotik dan lebih manusiawi.
- Pesan Merek yang Ditingkatkan: Menghindari ungkapan generik yang melemahkan diferensiasi merek.
- Peningkatan Keterlibatan: Mendorong komunikasi yang lebih efektif dengan mengurangi redundansi.
Contoh: Pembuatan Konten Pemasaran Produk
Pertimbangkan seorang pemasar produk yang ditugaskan untuk menyusun konten untuk peluncuran produk baru. Permintaan awal ke ChatGPT mungkin menghasilkan respons yang penuh dengan frasa berulang dan generik seperti “delving into an intricate landscape of innovation…,” membuat pesan terasa tidak bersemangat.
Untuk membuat konten yang lebih menarik dan unik, pemasar dapat mengikuti langkah-langkah berikut:
- Menyiapkan Prompt: Pemasar secara eksplisit menginstruksikan ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” Ini menginstruksikan ChatGPT untuk secara aktif menyaring istilah-istilah ini dalam responsnya.
- Menggunakan Memori Persisten: Frasa “Commit this to memory” memastikan bahwa ChatGPT menyimpan instruksi khusus ini di berbagai interaksi. Ini memungkinkan penghindaran persisten dari kata dan frasa yang ditentukan. ChatGPT akan memeriksa memorinya sebelum menghasilkan teks dan mematuhi instruksi untuk menghindari istilah yang ditentukan.
- Tinjauan Manual: Setelah menghasilkan respons, pemasar meninjau konten untuk setiap redundansi yang tersisa dan menyempurnakan bahasa untuk kejelasan dan dampak.
Efektivitas:
- Kustomisasi Prompt: Instruksi khusus membantu membentuk output AI.
- Retensi Memori: ChatGPT dapat menyimpan dan mengikuti aturan penghindaran kata di seluruh percakapan.
- Penyempurnaan Manual: Pengeditan manusia terakhir memastikan kejelasan dan keaslian.
Catatan: Alat dan analisis yang disajikan di bagian ini didasarkan pada pengujian internal dan menunjukkan nilai yang jelas. Rekomendasi bersifat independen dan tidak dipengaruhi oleh pembuat alat.
Berita dan Perkembangan AI Tambahan
Smartphone Bertenaga AI Meningkat: Deutsche Telekom mengumumkan rencana di Mobile World Congress 2025 di Barcelona untuk meluncurkan smartphone bertenaga AI yang menampilkan asisten Perplexity. Asisten ini dirancang untuk menyederhanakan tugas sehari-hari seperti memesan taksi, memesan meja, menerjemahkan bahasa secara real-time, dan menjawab pertanyaan pengguna. Perusahaan membayangkan ini sebagai asisten virtual yang akan mendukung jutaan pelanggan dengan menulis email, memulai panggilan, meringkas teks, dan mengelola kalender. AI Phone akan mengintegrasikan Google Cloud AI, ElevenLabs, dan Picsart untuk meningkatkan fungsinya, dan dijadwalkan untuk diluncurkan akhir tahun ini. Glance, unit InMobi, dan Google Cloud juga mengumumkan kolaborasi untuk memanfaatkan model AI Google untuk mengembangkan aplikasi AI yang berhadapan dengan konsumen untuk meningkatkan pengalaman pengguna di layar kunci smartphone dan layar TV ambient. Glance saat ini memberdayakan lebih dari 450 juta smartphone berbasis Android di seluruh dunia.
Sektor Pemerintah Mengalami Penurunan Insiden Siber Kritis: Industri pemerintah dan pembangunan mengalami penurunan signifikan dalam insiden dengan tingkat keparahan tinggi yang melibatkan keterlibatan manusia langsung pada tahun 2024, menurut laporan analis Kaspersky Managed Detection and Response (MDR) terbaru. Namun, sektor makanan, TI, telekomunikasi, dan industri menunjukkan peningkatan insiden tersebut.
OpenAI Berencana Mengintegrasikan Sora ke ChatGPT: OpenAI sedang berupaya mengintegrasikan alat pembuatan video AI-nya, Sora, langsung ke ChatGPT. Saat ini, Sora hanya tersedia melalui aplikasi web khusus, yang memungkinkan pengguna untuk menghasilkan klip sinematik hingga 20 detik. OpenAI juga sedang mengembangkan generator gambar AI yang didukung oleh Sora.