Arsip: 2025/3 | id | 40/62

Menguji Batas: Evolusi Tolok Ukur AI

Model bahasa besar telah berkembang pesat, tetapi evaluasi yang spesifik dan mendalam tetap penting. Tolok ukur baru muncul untuk domain khusus, keamanan, dan agen AI, memastikan sistem AI dapat diandalkan dan aman dalam berbagai aplikasi. Tolok ukur yang adaptif adalah kunci untuk memahami kinerja dunia nyata.

2025-03-14

# Agent # OpenAI # GPT

Menguji Batas: Evolusi Tolok Ukur AI

Pencarian AI Berbohong, Kian Parah

Mesin pencari AI semakin sering memberikan informasi yang salah dan menyesatkan, mengikis kepercayaan dan mengancam sumber informasi yang kredibel. Studi menunjukkan tingkat kesalahan yang mengkhawatirkan, sitasi palsu, dan pengabaian terhadap protokol eksklusi robot, menimbulkan pertanyaan serius tentang masa depan informasi online.

2025-03-14

# Google # Gemini # Chatbot

Pencarian AI Berbohong, Kian Parah

Mengapa Video AI Kadang Terbalik

Model AI video terkadang menghasilkan gerakan yang melawan hukum fisika, seperti batu yang bergulir ke atas. Sebuah studi baru mengeksplorasi masalah ini dan memperkenalkan tolok ukur baru, VideoPhy-2, untuk mengevaluasi akal sehat fisik dalam video yang dihasilkan AI. Model-model dari Tiongkok memimpin dalam mengatasi konsistensi temporal, tetapi fisika yang akurat tetap menjadi tantangan.

2025-03-14

# AIGC # Hunyuan # Alibaba

Mengapa Video AI Kadang Terbalik

Alibaba Luncurkan Asisten AI Unggulan Quark

Alibaba meluncurkan versi baru aplikasi Quark, asisten AI komprehensif yang didukung oleh model penalaran Qwen. Quark adalah platform pertama Alibaba yang memanfaatkan sepenuhnya model fondasi miliknya, menawarkan fitur-fitur canggih seperti chatbot AI, pemikiran mendalam, penelitian mendalam, dan eksekusi tugas, merevolusi pengalaman pencarian.

2025-03-14

# Qwen # Assistant # Alibaba

Alibaba Luncurkan Asisten AI Unggulan Quark

Model AI Baru Alibaba Diklaim Membaca Emosi

Raksasa teknologi Tiongkok, Alibaba, meluncurkan model AI *open-source* R1-Omni, yang dirancang untuk mengamati ekspresi wajah, bahasa tubuh, dan konteks lingkungan untuk menyimpulkan emosi. Ini merupakan langkah maju yang signifikan, menawarkan pengenalan emosi yang dapat diakses secara bebas, dan bersaing dengan model seperti GPT-4.5 dari OpenAI, tetapi dengan kemampuan visual.

2025-03-14

# AIGC # Qwen # Alibaba

Model AI Baru Alibaba Diklaim Membaca Emosi

Claude AI Anthropic: Obrolan Suara

Anthropic akan meningkatkan chatbot AI-nya, Claude, dengan interaksi suara dua arah dan kemampuan memori. Peningkatan ini dirancang untuk pengalaman pengguna yang lebih alami dan personal, menjadikan Claude sebagai asisten yang serbaguna dan adaptif dalam lanskap AI yang berkembang pesat. Fitur-fitur baru ini akan merevolusi cara kita berinteraksi dengan AI.

2025-03-14

# Chatbot # Anthropic # Claude

Claude AI Anthropic: Obrolan Suara

Command A Cohere: Lompatan Kecepatan & Efisiensi LLM

Cohere meluncurkan Command A, model bahasa besar (LLM) yang diklaim lebih cepat dan efisien secara komputasi dibandingkan pesaingnya. Model ini menawarkan panjang konteks dua kali lipat, membutuhkan GPU lebih sedikit, dan unggul dalam efisiensi inferensi dan tugas RAG, menjadikannya solusi ideal untuk klien perusahaan yang mencari kinerja maksimal dengan komputasi minimal.

2025-03-14

# LLM # RAG # Cohere

Command A Cohere: Lompatan Kecepatan & Efisiensi LLM

Gemma 3 Google: LLM Ringkas & Kuat

Gemma 3 Google adalah model bahasa besar sumber terbuka yang efisien, mengungguli pesaing dengan sumber daya komputasi yang lebih sedikit. Model ini mendukung multibahasa, pemrosesan gambar/video, dan memiliki jendela konteks 128.000 token. Gemma 3 juga menawarkan 'function calling' dan 'structured inference' untuk otomatisasi tugas dan sistem berbasis agen.

2025-03-14

# Google # Agent # Gemma

Gemma 3 Google: LLM Ringkas & Kuat

Pembaruan Fitur Grok: Chatbot AI Membaca URL

Grok, chatbot AI Elon Musk, kini dapat mendeteksi dan membaca URL secara otomatis, meningkatkan interaksi dengan situs web eksternal. Pengguna dapat mengaktifkan atau menonaktifkan fitur ini di pengaturan 'Behavior', memungkinkan integrasi informasi yang lancar ke dalam percakapan, menawarkan ringkasan, penelitian yang efisien, dan banyak lagi.

2025-03-14

# Chatbot # Grok # xAI

Pembaruan Fitur Grok: Chatbot AI Membaca URL

Meta & SG Luncurkan Inkubator Llama

Meta dan Pemerintah Singapura berkolaborasi meluncurkan Program Inkubator Llama. Inisiatif ini dirancang untuk menumbuhkan inovasi AI *open-source*. Program ini memberdayakan *startup*, UKM, dan lembaga sektor publik di Singapura untuk memanfaatkan potensi AI, khususnya model Llama Meta, untuk menciptakan solusi yang berdampak bagi perekonomian dan masyarakat.

2025-03-14

# AIGC # Llama # Meta

Meta & SG Luncurkan Inkubator Llama

Archives: 3

Menguji Batas: Evolusi Tolok Ukur AI

Pencarian AI Berbohong, Kian Parah

Mengapa Video AI Kadang Terbalik

Alibaba Luncurkan Asisten AI Unggulan Quark

Model AI Baru Alibaba Diklaim Membaca Emosi

Claude AI Anthropic: Obrolan Suara

Command A Cohere: Lompatan Kecepatan & Efisiensi LLM

Gemma 3 Google: LLM Ringkas & Kuat

Pembaruan Fitur Grok: Chatbot AI Membaca URL

Meta & SG Luncurkan Inkubator Llama