Dunia kecerdasan buatan (AI) seolah-olah tidak pernah berhenti seketika. Hampir setiap minggu pasti ada pengumuman penting yang menjanjikan keupayaan yang dipertingkatkan, aplikasi baharu, atau penyusunan semula strategik dalam industri. Baru-baru ini, beberapa pemain utama, daripada gergasi teknologi sedia ada hingga syarikat pemula yang bercita-cita tinggi, telah mendedahkan perkembangan yang menekankan evolusi pesat dan pengkhususan yang semakin meningkat dalam domain AI. Kemajuan ini merangkumi keupayaan penaakulan yang dipertingkatkan dalam model bahasa besar, kebangkitan AI multimodal dan kompak, pembangunan terfokus sistem agentik, dan perkongsian perkakasan inovatif yang bertujuan untuk meluaskan pilihan penggunaan. Memahami langkah-langkah individu ini memberikan gambaran yang lebih jelas tentang arus persaingan dan teknologi yang lebih luas yang membentuk masa depan kita.
Google Mensasarkan Lebih Tinggi dengan Gemini 2.5: Era ‘Model Berfikir’?
Google, pemain gergasi yang sentiasa dominan dalam arena AI, baru-baru ini melancarkan cabaran baharu dengan pengumuman Gemini 2.5. Diposisikan dengan berani sebagai ‘model AI paling pintar’ syarikat setakat ini, pelancaran ini menandakan dorongan berterusan Google ke arah penaakulan AI yang lebih canggih. Pelancaran awal menampilkan Gemini 2.5 Pro Experimental, yang disebut-sebut sebagai peneraju terdepan untuk menangani cabaran kompleks. Apa yang membezakan lelaran ini, menurut Google, adalah sifatnya sebagai ‘model berfikir’. Penamaan yang menarik ini mencadangkan peralihan daripada model yang terutamanya mendapatkan semula dan mensintesis maklumat ke arah sistem yang mampu melakukan proses analisis yang lebih mendalam.
Idea teras di sebalik ‘model berfikir’ ini, yang dibina berdasarkan konsep yang diperkenalkan dalam versi terdahulu seperti Gemini 2.0 Flash Thinking, melibatkan AI menjalankan satu bentuk pertimbangan dalaman atau urutan penaakulan sebelum menjana respons. Ini membayangkan pendekatan yang lebih berstruktur untuk penyelesaian masalah, berpotensi mencerminkan langkah kognitif manusia dengan lebih dekat. Google mengaitkan keupayaan yang dipertingkatkan ini kepada gabungan seni bina model asas yang diperbaiki dan teknik penapisan pasca latihan lanjutan. Antara teknik ini ialah pembelajaran pengukuhan (reinforcement learning), di mana model belajar daripada maklum balas, dan gesaan rantaian pemikiran (chain-of-thought prompting), kaedah yang menggalakkan AI untuk memecahkan masalah kompleks kepada langkah-langkah perantaraan, dengan itu meningkatkan ketelusan dan ketepatan proses penaakulannya.
Metrik prestasi awal kelihatan memberangsangkan. Google menekankan bahawa Gemini 2.5 Pro Experimental telah pun mendaki ke puncak kedudukan Chatbot Arena, platform sumber khalayak di mana model AI yang berbeza dilagakan secara anonim antara satu sama lain dan dinilai oleh pengguna manusia. Ini menunjukkan prestasi praktikal yang kukuh dalam interaksi pengguna. Tambahan pula, syarikat itu menekankan kehebatannya dalam tugas penaakulan dan pengekodan, bidang kritikal untuk kedua-dua aplikasi analitikal dan automasi pembangunan perisian. Ketersediaan model canggih ini kepada pelanggan Gemini Advanced menandakan strategi Google untuk menperingkatkan penawaran AI-nya, menyediakan keupayaan terkini kepada pengguna berbayar sambil kemungkinan menggabungkan versi yang diperhalusi ke dalam ekosistem produknya yang lebih luas dari semasa ke semasa. Pelancaran ini jelas meningkatkan persaingan yang sedang berlangsung dengan pesaing seperti siri GPT OpenAI dan model Claude Anthropic, menolak sempadan apa yang boleh dicapai oleh model bahasa besar dari segi penyelesaian tugas kompleks dan pemahaman bernuansa. Penekanan pada ‘berfikir’ dan ‘penaakulan’ boleh menandakan fasa baharu di mana model AI dinilai bukan sahaja berdasarkan ingatan pengetahuan mereka, tetapi juga pada kepintaran penyelesaian masalah mereka.
Alibaba Cloud Membalas dengan Qwen2.5: Kuasa Multimodal dalam Pakej Kompak
Tidak mahu ketinggalan, Alibaba Cloud, tulang belakang teknologi digital dan kecerdasan Alibaba Group, memperkenalkan kemajuan pentingnya sendiri dengan pelancaran model AI Qwen2.5-Omni-7B. Pelancaran ini menekankan kepentingan AI multimodal yang semakin meningkat, iaitu sistem yang mampu memahami dan memproses maklumat merentasi pelbagai format – bukan sahaja teks, tetapi juga imej, audio, dan juga video. Model Qwen2.5 direka untuk menerima input pelbagai ini dan bertindak balas dengan teks yang dijana atau pertuturan yang berbunyi semula jadi yang luar biasa.
Pembeza utama yang diketengahkan oleh Alibaba ialah sifat kompak model tersebut. Walaupun banyak model terkini mempunyai kiraan parameter yang sangat besar, sering kali berkorelasi dengan kos pengkomputeran yang tinggi dan kerumitan penggunaan, Qwen2.5-Omni-7B menyasarkan kecekapan. Alibaba mencadangkan jejak yang lebih kecil ini menjadikannya asas yang ideal untuk membina agen AI yang tangkas dan kos efektif. Agen AI, yang direka untuk melaksanakan tugas secara autonomi, mendapat manfaat yang ketara daripada model yang berkuasa namun cekap sumber, membolehkan penggunaan yang lebih luas pada perkakasan yang pelbagai, berpotensi termasuk peranti pinggir (edge devices). Fokus pada kecekapan ini menangani halangan kritikal dalam penggunaan AI – kos dan keperluan infrastruktur yang sering kali terlalu mahal yang berkaitan dengan menjalankan model terbesar.
Meluaskan lagi jangkauan dan impaknya, Alibaba telah menjadikan model Qwen2.5 sumber terbuka (open-source), menjadikannya tersedia untuk pembangun dan penyelidik di seluruh dunia melalui platform popular seperti Hugging Face dan GitHub. Strategi ini berbeza dengan pendekatan yang lebih proprietari yang diambil oleh sesetengah pesaing dan mempunyai beberapa tujuan. Ia memupuk penglibatan komuniti, membolehkan penelitian dan penambahbaikan bebas terhadap model, dan berpotensi mempercepatkan inovasi dengan membolehkan rangkaian pembangun yang lebih luas membina berdasarkan teknologi Alibaba. Bagi Alibaba Cloud, ia juga boleh mendorong penggunaan perkhidmatan awannya yang lebih luas apabila pembangun bereksperimen dan menggunakan aplikasi berdasarkan model sumber terbuka. Pelancaran model yang berkuasa, kompak, multimodal, dan sumber terbuka seperti Qwen2.5 meletakkan Alibaba sebagai pemain global yang penting dalam landskap AI, terutamanya memenuhi keperluan pembangun yang mencari penyelesaian yang fleksibel dan cekap untuk mencipta aplikasi AI interaktif yang canggih.
DeepSeek Mempertingkatkan Model V3: Menajamkan Penaakulan dan Kemahiran Praktikal
Inovasi tidak hanya terhad kepada gergasi teknologi. DeepSeek, sebuah syarikat pemula AI China yang terkenal, turut mencipta gelombang dengan mengeluarkan versi dinaik taraf model bahasa besar V3 mereka. Kemas kini ini, khususnya DeepSeek-V3-0324, memberi tumpuan kepada peningkatan keupayaan praktikal yang penting untuk aplikasi dunia sebenar. Menurut syarikat pemula itu, versi baharu ini memberikan peningkatan yang ketara dalam beberapa bidang utama.
Pertama, terdapat ‘peningkatan besar dalam prestasi penaakulan.’ Seperti Gemini 2.5 Google, ini menunjukkan trend industri yang jelas ke arah menghargai kebolehan analitikal yang lebih mendalam berbanding pemadanan corak mudah atau pengambilan maklumat. Penaakulan yang dipertingkatkan membolehkan model menangani masalah logik yang lebih kompleks, memahami konteks bernuansa, dan memberikan pandangan yang lebih dipercayai.
Kedua, DeepSeek menonjolkan ‘kemahiran pembangunan front-end yang lebih kuat.’ Ini adalah pengkhususan yang menarik, mencadangkan model itu sedang diperhalusi untuk membantu atau bahkan mengautomasikan aspek penciptaan antara muka web dan aplikasi. LLM yang mahir dalam menjana kod untuk antara muka pengguna boleh mempercepatkan kitaran pembangunan perisian dengan ketara.
Ketiga, naik taraf ini mempunyai ‘keupayaan penggunaan alat (tool-use) yang lebih pintar.’ Ini merujuk kepada keupayaan model untuk menggunakan alat luaran atau API secara berkesan untuk mengakses maklumat masa nyata, melakukan pengiraan, atau berinteraksi dengan sistem perisian lain. Meningkatkan penggunaan alat menjadikan LLM jauh lebih berkuasa dan serba boleh, membolehkan mereka melepaskan diri daripada batasan data latihan mereka dan berinteraksi secara dinamik dengan dunia digital.
Sama seperti strategi Alibaba, DeepSeek telah menjadikan model yang dinaik taraf ini boleh diakses oleh komuniti global melalui Hugging Face. Pendekatan terbuka ini membolehkan penyelidik dan pembangun memanfaatkan kemajuan DeepSeek, menyumbang kepada pertumbuhan ekosistem yang lebih luas. Fokus pada kemahiran praktikal yang khusus seperti pembangunan front-end dan penggunaan alat menunjukkan kematangan bidang ini, bergerak melangkaui model tujuan umum ke arah pembantu AI yang lebih khusus yang disesuaikan untuk domain profesional tertentu. Kemajuan DeepSeek juga menekankan sumbangan penting yang berasal dari senario penyelidikan dan pembangunan AI China yang bertenaga.
Landbase Melancarkan Makmal AI Gunaan: Fokus pada AI Agentik untuk Perniagaan
Beralih daripada pembangunan model kepada aplikasi khusus, Landbase, yang memperkenalkan dirinya sebagai ‘Syarikat AI Agentik,’ mengumumkan penubuhan Makmal AI Gunaan (Applied AI Lab) baharu yang terletak secara strategik di Silicon Valley. Langkah ini menandakan usaha terfokus untuk menolak sempadan AI agentik, bidang yang berpusat pada penciptaan sistem AI autonomi (agen) yang boleh merancang, membuat keputusan, dan melaksanakan tugas kompleks dengan campur tangan manusia yang minimum.
Pengumpulan pasukan makmal itu menunjukkan cita-citanya. Landbase menonjolkan pengambilan bakat daripada institusi dan syarikat berprestij, termasuk Stanford University, Meta (dahulunya Facebook), dan NASA. Penumpuan kepakaran ini mencadangkan komitmen untuk menangani cabaran penyelidikan asas di samping pembangunan aplikasi praktikal dalam ruang AI agentik. Misi makmal yang dinyatakan adalah untuk mempercepatkan inovasi dalam tiga bidang teras:
- Automasi Aliran Kerja (Workflow Automation): Membangunkan agen AI yang mampu mengambil alih proses perniagaan yang kompleks dan berbilang langkah, berpotensi menyelaraskan operasi dan membebaskan pekerja manusia untuk tugas peringkat lebih tinggi.
- Kecerdasan Data (Data Intelligence): Mencipta agen yang boleh menganalisis data secara proaktif, mengenal pasti corak, menjana pandangan, dan mungkin juga membuat cadangan berdasarkan data secara autonomi.
- Pembelajaran Pengukuhan (Reinforcement Learning): Menggunakan teknik pembelajaran pengukuhan bukan sahaja untuk latihan model, tetapi berpotensi untuk membolehkan agen belajar dan menyesuaikan strategi mereka berdasarkan hasil dunia sebenar dan maklum balas dalam konteks perniagaan tertentu.
Landbase menghubungkan inisiatif ini dengan model GTM-1 Omni sedia ada, yang didakwanya sebagai model AI agentik pertama dan satu-satunya yang dibina khusus untuk tujuan go-to-market (GTM). Ini membayangkan fokus untuk menerapkan AI agentik pada jualan, pemasaran, dan pengurusan perhubungan pelanggan – bidang yang matang untuk automasi dan pengoptimuman dipacu data. Daniel Saks, CEO Landbase, menekankan kepentingan pasukan pakar dalam memacu inovasi untuk model khusus ini.
Makmal AI Gunaan akan menumpukan usahanya untuk membangunkan jenis model yang berbeza yang penting untuk sistem agentik yang berkesan:
- Model Perancangan dan Pembuatan Keputusan: Kecerdasan teras yang membolehkan agen menetapkan matlamat, merangka strategi, dan memilih tindakan yang sesuai.
- Model Penjanaan Pemesejan: AI yang mampu menghasilkan komunikasi yang relevan secara kontekstual dan berkesan untuk tugas seperti jangkauan jualan atau sokongan pelanggan.
- Model Ramalan dan Ganjaran: Sistem yang membantu agen menjangka hasil, menilai potensi kejayaan tindakan yang berbeza, dan belajar daripada pengalaman mereka.
Penubuhan makmal khusus ini menekankan trend yang semakin meningkat ke arah syarikat AI khusus yang memberi tumpuan kepada aplikasi perniagaan bernilai tinggi, terutamanya memanfaatkan potensi agen autonomi untuk mengubah fungsi operasi teras.
Merapatkan Jurang Perkakasan: webAI dan MacStadium Bekerjasama untuk Penggunaan Apple Silicon
Akhir sekali, menangani lapisan infrastruktur kritikal yang menjadi sandaran semua pembangunan AI, syarikat penyelesaian AI webAI dan penyedia awan perusahaan MacStadium mengumumkan perkongsian strategik. Kerjasama mereka bertujuan untuk menangani cabaran penting: menggunakan model AI yang besar dan berkuasa dengan cekap, terutamanya untuk perniagaan yang menghadapi batasan perkakasan atau mencari alternatif kepada infrastruktur awan tradisional yang berpusatkan GPU.
Perkongsian ini memperkenalkan platform baharu yang direka untuk menggunakan model AI besar dengan memanfaatkan teknologi Apple silicon. MacStadium pakar dalam menyediakan infrastruktur awan berdasarkan perkakasan Mac Apple, termasuk mesin yang dilengkapi dengan cip siri-M yang berkuasa (Apple silicon). Cip ini, yang terkenal dengan seni bina bersepadunya yang menggabungkan CPU, GPU, dan Neural Engine, menawarkan prestasi per watt yang mengagumkan, berpotensi menyediakan platform yang lebih cekap dari segi pengkomputeran untuk beban kerja AI tertentu berbanding perkakasan pelayan tradisional.
Kerjasama ini bertujuan untuk membuka potensi ini untuk penggunaan AI. Dengan menggabungkan kepakaran MacStadium dalam persekitaran awan macOS dengan ‘pendekatan model saling berhubung’ (interconnected model approach) webAI (butiran lanjut mengenainya memerlukan perincian tetapi kemungkinan merujuk kepada teknik untuk mengoptimumkan atau mengagihkan beban kerja model), rakan kongsi ini berhasrat untuk mencipta platform yang mengubah cara organisasi membangun dan menggunakan sistem AI termaju, khususnya pada perkakasan Apple. Ini boleh menjadi sangat menarik kepada organisasi yang sudah banyak melabur dalam ekosistem Apple atau mereka yang mencari alternatif yang kos efektif dan cekap kuasa untuk menyewa kapasiti GPU yang mahal daripada penyedia awan utama.
Ken Tacelli, CEO di MacStadium, merangka perkongsian itu sebagai ‘pencapaian penting’ dalam membawa keupayaan AI kepada perusahaan melalui infrastruktur perkakasan Apple. Inisiatif ini menjanjikan kecekapan dan prestasi pengkomputeran yang lebih besar, berpotensi mendemokrasikan akses kepada penggunaan model AI besar untuk perniagaan yang sebelum ini dikekang oleh kos atau ketersediaan perkakasan. Perkongsian ini menonjolkan pencarian berterusan untuk penyelesaian perkakasan yang pelbagai dan cekap untuk menggerakkan keperluan pengkomputeran kecerdasan buatan moden yang semakin menuntut, meneroka seni bina di luar paradigma GPU yang dominan. Ia menandakan bahawa masa depan infrastruktur AI mungkin lebih heterogen daripada yang diandaikan sebelum ini, menggabungkan silikon khusus seperti Apple bersama perkakasan pusat data tradisional.