Analisis GPT-4.5, AI di Angkasa | ms

GPT-4.5: Penambahbaikan, Bukan Revolusi

OpenAI baru-baru ini melancarkan GPT-4.5 kepada pengguna ChatGPT Pro, dengan akaun Plus, Team, perusahaan, dan pendidikan akan menyusul. Dikenali secara dalaman sebagai ‘Orion’, model ini mempunyai “pemahaman yang lebih baik tentang niat manusia, mentafsir isyarat halus dan jangkaan tersirat dengan nuansa dan kecerdasan emosi yang lebih tinggi,” menurut OpenAI. Ia memanfaatkan teknik penyeliaan baharu di samping penalaan halus tradisional dan pembelajaran pengukuhan daripada maklum balas manusia, mencerminkan proses pembangunan GPT-4o. GPT-4.5 menawarkan keupayaan carian masa nyata, menyokong muat naik fail dan imej, dan berintegrasi dengan kanvas untuk menulis dan pengekodan. Walau bagaimanapun, ia kini tidak mempunyai ciri multimodal seperti mod suara, video, atau perkongsian skrin yang terdapat dalam ChatGPT.

OpenAI menekankan bahawa pembelajaran tanpa penyeliaan meningkatkan ketepatan dan intuisi model. Pendekatan ini telah menjadi penggerak di sebalik kemajuan dalam model seperti GPT-3.5, GPT-4, dan kini, GPT-4.5. Secara berasingan, penaakulan berskala melatih model untuk memproses maklumat secara sistematik, menjana rantaian pemikiran sebelum bertindak balas. Pendekatan teratur ini meningkatkan keupayaan mereka untuk menangani cabaran STEM dan logik yang rumit, seperti yang ditunjukkan oleh model seperti OpenAI o1 dan OpenAI o3-mini. GPT-4.5 dibentangkan sebagai contoh utama penskalaan pembelajaran tanpa penyeliaan, memanfaatkan kuasa pengkomputeran yang meningkat, set data yang lebih besar dan inovasi seni bina. Dilatih pada superkomputer Microsoft Azure AI, ia dikatakan mempunyai pengetahuan yang lebih luas dan pemahaman yang lebih mendalam tentang dunia, mengurangkan halusinasi dan meningkatkan kebolehpercayaan.

Walaupun terdapat kemajuan ini, GPT-4.5 tidak menjana semangat yang ketara. Ia dianggap sebagai peningkatan tambahan dan bukannya lonjakan yang inovatif. Walaupun OpenAI mendakwa kecerdasan emosi, nuansa dan kreativiti yang dipertingkatkan, ramai pengguna tidak melihat perbezaan yang ketara berbanding GPT-4o. Ketiadaan kemajuan multimodal, ciri utama GPT-4o, seterusnya menyumbang kepada persepsi ini.

Tambahan pula, GPT-4.5 telah menunjukkan kecenderungan untuk menghasilkan output yang tidak masuk akal. Alat penanda aras fakta dalaman OpenAI, SimpleQA, mendedahkan bahawa GPT-4.5 berhalusinasi (membentangkan rekaan sebagai fakta dengan yakin) 37.1% daripada masa. Ini adalah kebimbangan yang ketara, walaupun dibandingkan dengan GPT-4o, satu lagi model “penaakulan” lanjutan, yang berhalusinasi 61.8% daripada masa pada penanda aras yang sama. Model o3-mini yang lebih kecil dan lebih murah mempamerkan kadar halusinasi yang lebih tinggi iaitu 80.3%.

Landskap AI semasa, yang menampilkan pesaing seperti Anthropic dengan Claude 3.7 dan kemajuan Google dengan Gemini, telah meningkatkan jangkaan untuk peningkatan yang ketara. Pengguna sedang mencari kejayaan, bukan hanya penambahbaikan, dan GPT-4.5, dalam bentuk semasanya, nampaknya tidak mencapai tahap ini.

Kebangkitan Model Penaakulan dan Keyakinan Pelabur

Elon Musk baru-baru ini mencadangkan di X bahawa Kepintaran Am Buatan (AGI) semakin hampir. Kenyataan ini datang di tengah-tengah perlumbaan yang ghairah di kalangan gergasi teknologi seperti OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic, dan xAI milik Musk sendiri untuk membangunkan model penaakulan – sistem AI yang direka untuk meniru pemikiran seperti manusia.

Pelabur jelas menunjukkan semangat untuk usaha ini. Tidak lama selepas melancarkan Claude 3.7 Sonnet dengan penaakulan hibrid, Anthropic memperoleh pusingan pembiayaan Siri E yang besar sebanyak $3.5 bilion. Ini meningkatkan nilai pasarannya tiga kali ganda kepada $61.5 bilion, mengukuhkan kedudukannya sebagai pesaing utama kepada OpenAI. Pelaburan itu, yang diketuai oleh Lightspeed Venture Partners dan termasuk Salesforce Ventures, Cisco, Fidelity, Jane Street, dan lain-lain, akan digunakan untuk mengembangkan kuasa pengkomputeran untuk pembangunan AI, meningkatkan penyelidikan keselamatan, dan mempercepat pertumbuhan global.

Mendorong Sempadan Penaakulan: Penanda Aras BBEH

Model Bahasa Besar (LLM) semakin disepadukan ke dalam aplikasi harian, menuntut keupayaan penaakulan yang teguh merentasi pelbagai domain. Walau bagaimanapun, penanda aras sedia ada sering mengutamakan matematik dan pengekodan, mengabaikan jenis penaakulan penting yang lain. Walaupun set data BIG-Bench telah digunakan secara meluas untuk menilai LLM pada tugas penaakulan yang kompleks, model telah mencapai kemajuan yang ketara sehingga kini mencapai skor hampir sempurna pada kedua-dua BIG-Bench dan variannya yang lebih mencabar, BIG-Bench Hard (BBH). Ketepuan ini menjadikan penanda aras ini kurang berkesan untuk mengukur kemajuan selanjutnya.

Untuk menangani had ini, penyelidik telah memperkenalkan BIG-Bench Extra Hard (BBEH). Penanda aras baharu ini menggantikan setiap tugas dalam BBH dengan versi yang jauh lebih sukar, sambil tetap menilai kemahiran penaakulan yang serupa. Ujian pada BBEH mendedahkan bahawa walaupun model tujuan umum yang terbaik hanya mencapai skor 9.8%, manakala model teratas yang direka khusus untuk penaakulan mencapai 44.8%. Keputusan ini menyerlahkan cabaran berterusan yang dihadapi LLM dengan penaakulan yang kompleks, menunjukkan ruang yang besar untuk penambahbaikan. Kertas penyelidikan penuh menyediakan butiran lanjut mengenai penanda aras baharu ini.

Satelit Berkuasa AI: Era Baharu dalam Penerokaan dan Operasi Angkasa

TakeMe2Space, sebuah syarikat permulaan teknologi angkasa yang berpangkalan di Hyderabad, baru-baru ini memperoleh Rs 5.5 crore dalam pusingan pembiayaan pra-benih yang diketuai oleh Seafund, dengan penyertaan daripada Blume Ventures, Artha Venture Fund, AC Ventures, dan pelabur malaikat lain. Pembiayaan ini, walaupun sederhana, menandakan langkah penting ke arah mewujudkan makmal AI pertama India di angkasa. TakeMe2Space merancang untuk menggunakan dana tersebut untuk membangunkan MOI-1 (My Orbital Infrastructure–Technology Demonstrator), sebuah platform yang akan membolehkan pengguna memuat naik model AI pemerhatian Bumi atau eksperimen angkasa lain terus ke satelit orbit melalui konsol web yang dipanggil Orbitlab. Pengguna hanya akan membayar untuk masa penggunaan satelit, pada kadar $2 seminit.

Platform MOI-TD syarikat itu dilaporkan telah menunjukkan keupayaan untuk memaut naik model AI yang besar dari stesen bumi, melaksanakan kod luaran pada satelit, dan memaut turun hasil yang dikodkan dan disulitkan dengan selamat. Ini mewakili satu langkah ke arah operasi satelit yang lebih autonomi dan cekap.

TakeMe2Space tidak bersendirian dalam usaha ini. Organisasi seperti ESA (dengan OPS-SAT) dan Globalstar juga mempelopori aplikasi dunia sebenar teknologi satelit berkuasa AI, daripada komunikasi IoT yang selamat kepada pelaksanaan model AI dalam orbit. Memandangkan teknologi terus maju, satelit dipacu AI bersedia untuk menjadi semakin autonomi, membawa kepada operasi angkasa yang lebih cekap dan membuka kemungkinan baharu untuk penyelidikan, keselamatan dan ketersambungan global.

Secara tradisinya, satelit sangat bergantung pada stesen bumi untuk pemprosesan data, membuat keputusan dan pelaksanaan arahan. Data terpaksa dipaut turun, dianalisis di Bumi, dan kemudian cerapan yang diproses dipaut naik semula ke satelit – satu proses yang memakan masa dan intensif lebar jalur. Walau bagaimanapun, kemajuan dalam AI dan pengkomputeran pinggir (memproses data pada peranti itu sendiri dan bukannya dalam awan) kini membolehkan satelit memproses data di atas kapal, membuat keputusan autonomi dan menghantar hanya cerapan yang paling penting dengan selamat. Ini menghasilkan operasi yang lebih pantas, lebih pintar dan lebih cekap.

Operasi satelit berkuasa AI moden biasanya melibatkan tiga langkah utama:

Pautan Naik Algoritma AI: Algoritma AI dihantar dari stesen bumi ke satelit, memberikan mereka keupayaan pemprosesan data lanjutan.
Analisis Data Atas Kapal: Model AI menganalisis imej, data sensor dan input lain secara langsung di orbit, meminimumkan keperluan untuk campur tangan darat yang berterusan.
Pautan Turun Cerapan Selamat: Daripada menghantar data mentah, satelit menghantar cerapan yang disulitkan, menjimatkan lebar jalur dan meningkatkan keselamatan.

Pendekatan dipacu AI ini menawarkan beberapa kelebihan. Ia mengurangkan kependaman dengan ketara dengan membolehkan satelit memproses data di angkasa, membolehkan tindak balas yang lebih pantas kepada keadaan masa nyata tanpa menunggu arahan daripada stesen bumi. Penggunaan lebar jalur dioptimumkan, kerana hanya cerapan yang paling relevan dihantar dan bukannya sejumlah besar data mentah. Keselamatan juga dipertingkatkan melalui komunikasi yang disulitkan, mengurangkan risiko ancaman siber dan pelanggaran data. Faedah ini amat berharga dalam aplikasi seperti tindak balas bencana, operasi ketenteraan dan penerokaan angkasa.

Aplikasi dunia sebenar satelit berkuasa AI adalah pelbagai dan memberi kesan:

Pengurusan Bencana: Satelit yang dilengkapi dengan AI boleh mengesan kebakaran hutan, banjir dan taufan dalam masa nyata, membolehkan tindakan pantas oleh pasukan tindak balas kecemasan.
Pertanian Tepat: Model AI menganalisis kesihatan tanaman dan keadaan tanah untuk meningkatkan amalan pertanian tepat.
Pemantauan Alam Sekitar: Agensi alam sekitar menggunakan data satelit untuk mengesan tahap pencemaran udara dan air.
Navigasi Autonomi dan Operasi Angkasa: AI meningkatkan pengelakan perlanggaran dengan meramalkan dan bertindak balas terhadap potensi ancaman, memastikan keselamatan satelit. Ia juga memudahkan penyelarasan buruj satelit, meningkatkan liputan dan kecekapan. Tambahan pula, AI memainkan peranan penting dalam menjejak dan meramalkan pergerakan serpihan orbit, mengurangkan risiko kerosakan pada infrastruktur angkasa.
Pertahanan dan Keselamatan: Sistem pengawasan berkuasa AI mengesan aktiviti yang tidak dibenarkan dan pergerakan tentera dengan ketepatan yang lebih tinggi.
Telekomunikasi dan IoT: Satelit dipacu AI menyumbang kepada penghalaan trafik yang lebih pintar, meningkatkan sambungan internet satelit dan memastikan komunikasi global yang lancar.
Penerokaan Angkasa: AI meningkatkan kecekapan teleskop angkasa dalam mengesan asteroid dan eksoplanet, memajukan usaha penemuan angkasa dengan ketara.

Walaupun banyak kelebihan, cabaran kekal dalam pembangunan dan penggunaan satelit berkuasa AI:

Kuasa Pengkomputeran Terhad: Satelit mesti beroperasi pada cip berkuasa rendah dan dikeraskan sinaran, yang menyekat keupayaan AI.
Persekitaran Angkasa yang Keras: Pendedahan sinaran menimbulkan risiko kerosakan perkakasan.
Ancaman Keselamatan: Memaut naik dan melaksanakan kod luaran di angkasa memerlukan pengurusan yang teliti untuk mencegah serangan siber.
Kos dan Masa Pembangunan: Membina, menguji dan mengesahkan perkakasan satelit yang serasi dengan AI adalah proses yang mahal dan memakan masa.
Keperluan Kebolehsuaian: Model AI yang digunakan dalam orbit mestilah sangat mudah disesuaikan, berfungsi dengan kemas kini yang minimum dan menyesuaikan diri secara autonomi kepada senario baharu.

AI Dibuka Kunci: Menghapuskan Frasa Berulang dalam ChatGPT

AI boleh menjadi alat yang berharga dalam penciptaan kandungan, membantu dengan penulisan, sumbang saran, meningkatkan kejelasan, memperhalusi struktur dan meningkatkan kebolehbacaan keseluruhan. Walau bagaimanapun, isu biasa dengan teks yang dijana AI ialah kecenderungannya ke arah bahasa formula kerana pilihan perkataan yang berulang. Daripada menyampaikan mesej yang segar dan berkesan, AI sering bergantung pada corak yang biasa, mengurangkan keberkesanan dan keaslian.

Perkataan dan frasa yang terlalu kerap digunakan, seperti ‘delve,’ ‘tapestry,’ ‘vibrant,’ ‘landscape,’ ‘realm,’ ‘embark,’ ‘excels,’ ‘It’s important to note…,’ dan ‘A testament to…,’ boleh menjejaskan kualiti kandungan yang dijana AI dengan ketara. Bagi pemasar produk, pengulangan ini boleh menjadikan pemesejan kurang menarik, mengurangkan penglibatan khalayak, melemahkan pembezaan jenama dan menghalang cerapan dan pemesejan strategik daripada menonjol dalam pasaran yang sesak.

Dengan memanfaatkan ciri memori ChatGPT, adalah mungkin untuk mengurangkan isu ini dan menghapuskan perkataan dan frasa yang terlalu kerap digunakan. Berikut ialah cara menggunakan ciri ini dengan berkesan:

Akses: ChatGPT boleh diakses melalui laman web atau aplikasi mudah alihnya.

Faedah:

Keaslian Dipertingkat: Memastikan kandungan yang dijana AI berasa kurang robotik dan lebih manusiawi.
Pemesejan Jenama Dipertingkat: Mengelakkan ungkapan generik yang melemahkan pembezaan jenama.
Penglibatan Ditingkatkan: Menggalakkan komunikasi yang lebih berkesan dengan mengurangkan lebihan.

Contoh: Penjanaan Kandungan Pemasaran Produk

Pertimbangkan pemasar produk yang ditugaskan untuk merangka kandungan untuk pelancaran produk baharu. Permintaan awal kepada ChatGPT mungkin menghasilkan respons yang dipenuhi dengan frasa berulang dan generik seperti ‘delving into an intricate landscape of innovation…,’ menjadikan pemesejan berasa tidak bersemangat.

Untuk mencipta kandungan yang lebih menarik dan unik, pemasar boleh mengikuti langkah berikut:

Menyediakan Gesaan: Pemasar secara eksplisit mengarahkan ChatGPT: ‘Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.’ Ini mengarahkan ChatGPT untuk menapis istilah ini secara aktif dalam responsnya.
Menggunakan Memori Berterusan: Frasa ‘Commit this to memory’ memastikan bahawa ChatGPT mengekalkan arahan khusus ini merentas berbilang interaksi. Ini membolehkan pengelakan berterusan bagi perkataan dan frasa yang ditentukan. ChatGPT akan menyemak memorinya sebelum menjana teks dan mematuhi arahan untuk mengelakkan istilah yang ditetapkan.
Semakan Manual: Selepas menjana respons, pemasar menyemak kandungan untuk sebarang lebihan yang tinggal dan memperhalusi bahasa untuk kejelasan dan impak.

Keberkesanan:

Penyesuaian Gesaan: Arahan khusus membantu membentuk output AI.
Pengekalan Memori: ChatGPT boleh menyimpan dan mengikuti peraturan pengelakan perkataan merentas perbualan.
Penambahbaikan Manual: Pengeditan manusia terakhir memastikan kejelasan dan ketulenan.

Nota: Alat dan analisis yang dibentangkan dalam bahagian ini adalah berdasarkan ujian dalaman dan menunjukkan nilai yang jelas. Cadangan adalah bebas dan tidak dipengaruhi oleh pencipta alat.

Berita dan Perkembangan AI Tambahan

Telefon Pintar Berkuasa AI Meningkat: Deutsche Telekom mengumumkan rancangan di Kongres Dunia Mudah Alih 2025 di Barcelona untuk melancarkan telefon pintar berkuasa AI yang menampilkan pembantu Perplexity. Pembantu ini direka untuk memudahkan tugas harian seperti memesan teksi, menempah meja, menterjemah bahasa dalam masa nyata dan menjawab pertanyaan pengguna. Syarikat itu membayangkan ini sebagai pembantu maya yang akan menyokong berjuta-juta pelanggan dengan menulis e-mel, memulakan panggilan, meringkaskan teks dan mengurus kalendar. Telefon AI akan menyepadukan Google Cloud AI, ElevenLabs dan Picsart untuk meningkatkan fungsinya, dan ia dijadualkan dilancarkan pada akhir tahun ini. Glance, unit InMobi, dan Google Cloud juga mengumumkan kerjasama untuk memanfaatkan model AI Google untuk membangunkan aplikasi AI yang dihadapi pengguna untuk meningkatkan pengalaman pengguna pada skrin kunci telefon pintar dan skrin TV ambien. Glance kini menjana kuasa lebih 450 juta telefon pintar berasaskan Android di seluruh dunia.
Sektor Kerajaan Menyaksikan Penurunan Insiden Siber Kritikal: Industri kerajaan dan pembangunan mengalami penurunan ketara dalam insiden keterukan tinggi yang melibatkan penglibatan manusia secara langsung pada tahun 2024, menurut laporan penganalisis Pengesanan dan Respons Terurus (MDR) Kaspersky terkini. Walau bagaimanapun, sektor makanan, IT, telekomunikasi dan perindustrian menunjukkan peningkatan dalam insiden sedemikian.
OpenAI Merancang untuk Mengintegrasikan Sora ke dalam ChatGPT: OpenAI sedang berusaha untuk menyepadukan alat penjanaan video AInya, Sora, terus ke dalam ChatGPT. Pada masa ini, Sora hanya tersedia melalui aplikasi web khusus, membolehkan pengguna menjana klip sinematik sehingga 20 saat panjang. OpenAI juga sedang membangunkan penjana imej AI yang dikuasakan oleh Sora.

dikemaskinikan pada 2025-03-08

# OpenAI # GPT # AGI