xAI, usaha kecerdasan buatan Elon Musk, telah melancarkan model AI terbarunya, Grok 3. Pelancaran ini menandakan kemajuan besar dalam pembangunan AI syarikat, disertai dengan fungsi yang dipertingkatkan dalam aplikasi Grok, yang tersedia di platform iOS dan web. Grok 3 mewakili langkah utama ke hadapan, yang bertujuan untuk bersaing dengan model yang telah mantap dalam bidang kecerdasan buatan yang berkembang pesat.
Evolusi Grok dan Landskap Persaingan
Grok, yang diposisikan sebagai tindak balas xAI kepada model terkemuka seperti GPT-4o OpenAI dan Gemini Google, mempunyai keupayaan untuk memproses maklumat visual dan menjawab pertanyaan. Ia juga berfungsi sebagai teknologi asas untuk pelbagai ciri di X, rangkaian sosial Musk. Pembangunan Grok 3 merangkumi beberapa bulan, dan walaupun sasaran keluaran awal untuk 2024 terlepas, pelancaran akhirnya menunjukkan komitmen berterusan xAI untuk menolak sempadan keupayaan AI.
Penciptaan Grok 3 melibatkan pelaburan infrastruktur yang ketara. Dilaporkan, xAI menggunakan pusat data besar yang terletak di Memphis, dilengkapi dengan kira-kira 200,000 GPU. Musk menyatakan bahawa pembangunan Grok 3 memanfaatkan kira-kira sepuluh kali ganda kuasa pengkomputeran pendahulunya, Grok 2. Peningkatan kuasa pemprosesan ini digabungkan dengan set data latihan yang diperluaskan. Set data komprehensif ini adalah penting untuk meningkatkan ketepatan model, pemahaman kontekstual dan prestasi keseluruhan.
Grok 3: Keluarga Model
Grok 3 bukanlah entiti monolitik tetapi keluarga model, yang mempamerkan pendekatan bernuansa kepada reka bentuk AI. Varian yang lebih kecil, Grok 3 mini, mengutamakan kelajuan dalam menjawab pertanyaan, dengan pertukaran dalam ketepatan mutlak. Pilihan reka bentuk ini mencerminkan pelbagai keperluan pengguna, ada yang mengutamakan respons pantas manakala yang lain memerlukan ketepatan yang paling tinggi. Adalah penting untuk ambil perhatian bahawa tidak semua model dan ciri yang berkaitan dengan Grok 3 boleh diakses serta-merta; ada yang dalam ujian beta, menonjolkan pendekatan berulang xAI.
Penanda Aras Grok 3: Berusaha untuk Prestasi Unggul
xAI telah membentangkan hasil penanda aras yang menunjukkan keunggulan Grok 3 berbanding GPT-4o dalam ujian tertentu. Ini termasuk AIME, penanda aras yang memfokuskan pada penyelesaian masalah matematik, dan GPQA, yang menilai model menggunakan soalan lanjutan dalam fizik, biologi dan kimia. Selain itu, lelaran awal Grok 3 menunjukkan prestasi yang kompetitif dalam Chatbot Arena, platform penyumberan ramai di mana model AI yang berbeza dibandingkan berdasarkan keutamaan pengguna. Penanda aras ini, walaupun tidak menyeluruh, menawarkan gambaran sekilas tentang potensi Grok 3.
Pengenalan Model Penaakulan
Inovasi utama dalam keluarga Grok 3 ialah pengenalan model “penaakulan”, iaitu Grok 3 Reasoning dan Grok 3 mini Reasoning. Model ini direka untuk menganalisis masalah dengan teliti, meniru proses penaakulan. Pendekatan ini mencerminkan perkembangan serupa dalam bidang AI, seperti o3-mini OpenAI dan R1 DeepSeek. Model penaakulan bertujuan untuk meningkatkan kebolehpercayaan mereka dengan memasukkan mekanisme semakan kendiri sebelum menyampaikan hasil. Proses pengesahan dalaman ini bertujuan untuk mengurangkan ralat dan ketidakkonsistenan biasa yang boleh menghantui model AI.
xAI menegaskan bahawa Grok 3 Reasoning mengatasi o3-mini-high, versi o3-mini yang paling maju, pada beberapa penanda aras yang ditetapkan, termasuk penanda aras matematik AIME 2025 baru-baru ini. Dakwaan ini menggariskan cita-cita xAI untuk meletakkan Grok 3 di barisan hadapan keupayaan penaakulan AI.
Interaksi Pengguna yang Dipertingkatkan: Mod “Think” dan “Big Brain”
Pengguna boleh berinteraksi dengan model penaakulan ini melalui aplikasi Grok. Aplikasi ini menawarkan dua mod yang berbeza: “Think” untuk pertanyaan standard dan “Big Brain” untuk pertanyaan yang lebih kompleks yang memerlukan sumber pengkomputeran yang lebih besar. xAI menekankan bahawa model penaakulan ini amat sesuai untuk tugas yang melibatkan matematik, sains dan pengaturcaraan. Tumpuan ini mencadangkan penyasaran strategik domain di mana penaakulan logik dan pengiraan yang tepat adalah terpenting.
Menariknya, Musk menyatakan bahawa beberapa proses dalaman model penaakulan sengaja dikaburkan dalam aplikasi Grok. Langkah ini bertujuan untuk mencegah “penyulingan,” teknik yang digunakan oleh pembangun AI untuk mengekstrak pengetahuan daripada model sedia ada. Isu ini telah menjadi isu pertikaian dalam komuniti AI, dengan tuduhan baru-baru ini terhadap DeepSeek kerana didakwa menyuling model OpenAI. Keputusan xAI untuk mengaburkan proses ini mencerminkan kebimbangan yang semakin meningkat tentang harta intelek dan kelebihan daya saing dalam landskap AI yang berkembang pesat.
DeepSearch: Keupayaan Penyelidikan Berkuasa AI
Model penaakulan juga menjana ciri baharu dalam aplikasi Grok yang dipanggil DeepSearch, yang diposisikan sebagai rakan sejawat xAI kepada alat penyelidikan dipacu AI seperti penyelidikan mendalam OpenAI. DeepSearch memanfaatkan internet dan platform X untuk menganalisis maklumat dan memberikan ringkasan ringkas sebagai respons kepada pertanyaan pengguna. Fungsi ini bertujuan untuk menyelaraskan proses penyelidikan, menawarkan pengguna cara yang cepat dan cekap untuk mengumpul maklumat daripada pelbagai sumber.
Tahap Langganan dan Akses kepada Grok 3
Akses kepada Grok 3 dan ciri yang berkaitan akan distrukturkan melalui tahap langganan. Pelanggan kepada tahap Premium+ X, pada kos bulanan $50, akan diberikan akses awal kepada Grok 3. Ciri tambahan akan dibundel dalam pelan baharu yang dipanggil SuperGrok. Dilaporkan berharga $30 sebulan atau $300 setiap tahun, SuperGrok akan membuka lebih banyak penaakulan dan keupayaan DeepSearch yang luas, bersama dengan penjanaan imej tanpa had. Pendekatan bertingkat ini mencerminkan strategi biasa dalam industri AI, mengimbangi akses kepada fungsi asas dengan ciri premium untuk pengguna kuasa.
Pembangunan Masa Depan: Mod Suara dan API Perusahaan
Melangkah ke hadapan, Musk menunjukkan bahawa aplikasi Grok tidak lama lagi akan menggabungkan “mod suara,” menyediakan model Grok dengan suara yang disintesis. Penambahan ini bertujuan untuk meningkatkan interaksi pengguna, menjadikannya lebih semula jadi dan intuitif. Tambahan pula, dalam masa beberapa minggu, model Grok 3 akan disediakan melalui API perusahaan xAI, bersama dengan keupayaan DeepSearch. Pengembangan ini menunjukkan niat xAI untuk memenuhi keperluan pengguna perniagaan, menawarkan model AInya sebagai alat untuk pelbagai aplikasi perusahaan.
Sumber Terbuka Grok 2: Komitmen kepada Ketelusan?
xAI juga merancang untuk sumber terbuka Grok 2 dalam beberapa bulan akan datang, menurut Musk. Beliau menyatakan bahawa pendekatan umum syarikat adalah untuk mengeluarkan versi Grok sebelumnya sebagai sumber terbuka setelah versi berikutnya beroperasi sepenuhnya. Komitmen ini, jika dipenuhi, mencadangkan tahap ketelusan dan kesediaan untuk menyumbang kepada komuniti AI yang lebih luas. Walau bagaimanapun, masa pelepasan sumber terbuka, bergantung pada kematangan dan kestabilan Grok 3, kekal sebagai faktor utama.
Pendekatan, Nada dan Kontroversi Unik Grok
Apabila Grok diumumkan pada mulanya, Musk menyifatkannya sebagai model AI yang akan menjadi tegang, tidak ditapis dan tahan terhadap “wokeness,” mencadangkan kesediaan untuk menangani topik kontroversi yang mungkin dielakkan oleh sistem AI lain. Sehingga tahap tertentu, janji ini telah direalisasikan. Grok dan Grok 2 menunjukkan kapasiti untuk menggunakan bahasa yang kuat apabila digesa, ciri yang membezakannya daripada model yang lebih terkawal seperti ChatGPT.
Walau bagaimanapun, model pra-Grok 3 mempamerkan beberapa batasan. Mereka cenderung untuk mengelak isu-isu sensitif politik dan mengelakkan daripada melintasi sempadan tertentu. Beberapa analisis malah mencadangkan bahawa Grok cenderung ke arah kiri politik mengenai topik seperti hak transgender, inisiatif kepelbagaian dan ketidaksamaan.
Musk mengaitkan tingkah laku ini dengan data latihan Grok, terutamanya terdiri daripada halaman web yang tersedia untuk umum, dan berikrar untuk mengemudi Grok ke arah pendirian yang lebih neutral dari segi politik. Setakat mana xAI telah mencapai objektif ini dengan Grok 3, dan implikasi yang berpotensi daripada perubahan sedemikian, kekal sebagai soalan terbuka. Keseimbangan antara memberikan respons yang tidak berat sebelah dan mengelakkan penguatan maklumat yang berbahaya atau mengelirukan adalah cabaran berterusan dalam pembangunan model AI.