DeepSeek, perusahaan rintisan AI asal Tiongkok, telah membuat langkah penting dalam lanskap kompetitif kecerdasan buatan dengan iterasi yang ditingkatkan dari model fondasinya. Alih-alih meluncurkan DeepSeek R2 yang diperkirakan, perusahaan malah memperkenalkan DeepSeek-R1-0528 pada 28 Mei, yang menampilkan kemajuan dalam penalaran, logika, matematika, dan pemrograman. Model sumber terbuka (open-source) yang disempurnakan ini, yang beroperasi di bawah lisensi MIT, sekarang menunjukkan metrik kinerja yang menyaingi model-model terkemuka seperti GPT-3 dari OpenAI dan Gemini 2.5 Pro dari Google.
Peningkatan Penanganan Tugas Penalaran yang Rumit
Peningkatan pada DeepSeek-R1-0528 dapat dikaitkan dengan alokasi sumber daya komputasi yang lebih bijaksana, ditambah dengan optimasi algoritmik yang diterapkan dalam fase pasca-pelatihan. Penyesuaian yang disetel dengan baik ini meningkatkan kedalaman pemikiran model selama proses penalaran. Untuk mengilustrasikan, versi sebelumnya mengonsumsi sekitar 12.000 token per pertanyaan dalam tes American Invitational Mathematics Examination (AIME), sedangkan model yang diperbarui sekarang menggunakan hampir 23.000 token. Peningkatan penggunaan token ini berkorelasi dengan peningkatan substansial dalam akurasi, meningkat dari 70% menjadi 87,5% pada edisi 2025 dari tes AIME.
Dalam domain matematika, skor model yang terdokumentasi telah mencapai tingkat yang mengesankan, mencapai 91,4% pada AIME 2024 dan 79,4% pada Harvard-MIT Mathematics Tournament (HMMT) 2025. Angka-angka ini mendekati atau melampaui tolok ukur kinerja yang ditetapkan oleh beberapa model sumber tertutup, termasuk GPT-3 dan Gemini 2.5 Pro.
Sehubungan dengan kapabilitas pemrograman, indeks LiveCodeBench telah mengalami peningkatan substansial hampir 10 poin, bergerak dari 63,5 menjadi 73,3%. Selain itu, evaluasi SWE-Verified telah menunjukkan peningkatan dalam tingkat keberhasilan, meningkat dari 49,2% menjadi 57,6%.
Dalam ranah penalaran umum, kinerja model pada tes GPQA-Diamond telah meningkat secara signifikan, dengan skor meningkat dari 71,5% menjadi 81,0%. Khususnya, kinerjanya pada tolok ukur “Last Examination of Humanity” telah meningkat lebih dari dua kali lipat, meningkat dari 8,5% menjadi 17,7%.
Peningkatan ini secara kolektif menggarisbawahi kemampuan DeepSeek-R1-0528 yang ditingkatkan untuk mengatasi tugas-tugas penalaran yang kompleks, memposisikannya sebagai pesaing yang tangguh di lanskap AI. Algoritma dan optimasi pemanfaatan sumber daya yang disempurnakannya telah diterjemahkan ke dalam perolehan nyata dalam akurasi dan kapabilitas pemecahan masalah di berbagai domain.
Penurunan Tingkat Kesalahan dan Peningkatan Integrasi Aplikasi
Salah satu kemajuan terkemuka yang diperkenalkan oleh pembaruan ini adalah pengurangan yang nyata dalam tingkat halusinasi, perhatian kritis untuk keandalan model bahasa besar (LLM). Dengan mengurangi insiden respons yang secara faktual tidak akurat, DeepSeek-R1-0528 meningkatkan ketahanannya, khususnya dalam konteks di mana presisi sangat penting. Akurasi yang ditingkatkan ini menumbuhkan kepercayaan yang lebih besar pada keluaran model, menjadikannya alat yang lebih dapat diandalkan untuk berbagai aplikasi.
Selain itu, pembaruan menggabungkan fitur yang dirancang untuk digunakan dalam lingkungan terstruktur, termasuk generasi keluaran JSON langsung dan dukungan yang diperluas untuk panggilan fungsi. Kemajuan teknis ini menyederhanakan integrasi model ke dalam alur kerja otomatis, agen perangkat lunak, atau sistem back-end, menghilangkan kebutuhan akan pemrosesan perantara yang ekstensif. Dengan menyediakan dukungan asli untuk format data terstruktur dan panggilan fungsi, DeepSeek-R1-0528 menyederhanakan pengembangan dan penyebaran aplikasi bertenaga AI, sehingga memudahkan pengembang untuk memanfaatkan kapabilitasnya.
Fokus pada pengurangan kesalahan dan peningkatan integrasi aplikasi mengilustrasikan komitmen DeepSeek untuk meningkatkan kepraktisan dan kegunaan modelnya. Dengan mengatasi tantangan utama yang terkait dengan akurasi dan kemudahan integrasi, perusahaan memposisikan modelnya sebagai aset berharga untuk berbagai industri dan aplikasi.
Peningkatan Fokus pada Distilasi
Sejalan dengan peningkatan yang dilakukan pada DeepSeek-R1-0528, tim DeepSeek telah memulai proses penyulingan rantai pemikiran ke dalam model yang lebih ringan yang dirancang untuk pengembang dan peneliti dengan sumber daya perangkat keras yang terbatas. DeepSeek-R1-0528, yang terdiri dari 685 miliar parameter, telah digunakan untuk melatih pasca Qwen3 8B Base, yang menghasilkan pembuatan DeepSeek-R1-0528-Qwen3-8B.
Hebatnya, model hasil distilasi ini berhasil menyaingi model sumber terbuka yang jauh lebih besar pada tolok ukur tertentu. Dengan skor 86,0% pada AIME 2024, ia tidak hanya melampaui kinerja Qwen3 8B lebih dari 10,0%, tetapi juga menyamai kinerja Qwen3-235B-thinking. Pencapaian ini menggarisbawahi potensi teknik distilasi untuk membuat model yang lebih ringkas dan efisien tanpa mengorbankan kinerja.
Pendekatan ini menantang gagasan lama bahwa model masif pada dasarnya lebih unggul, yang menunjukkan bahwa versi yang lebih hemat tetapi terlatih lebih baik mungkin lebih layak untuk tugas-tugas penalaran tertentu. Dengan berfokus pada distilasi, DeepSeek sedang menjajaki jalur alternatif menuju kemajuan AI, yang berpotensi membuka jalan bagi model yang lebih mudah diakses dan hemat sumber daya.
Model DeepSeek-R1-0528 mewakili lompatan signifikan ke depan di bidang kecerdasan buatan, yang menunjukkan kekuatan optimasi algoritmik dan alokasi sumber daya strategis. Kapabilitasnya yang ditingkatkan dalam penalaran, matematika, pemrograman, dan pengetahuan umum, ditambah dengan penurunan tingkat kesalahan dan fiturnya yang ditingkatkan untuk integrasi, memposisikannya sebagai pesaing yang tangguh terhadap model-model mapan dari raksasa Amerika. Selain itu, eksplorasi teknik distilasi oleh DeepSeek menunjukkan jalur yang menjanjikan menuju solusi AI yang lebih efisien dan mudah diakses. Seiring lanskap AI terus berkembang, komitmen DeepSeek terhadap inovasi dan kepraktisan kemungkinan akan memainkan peran penting dalam membentuk masa depan industri.
Penyulingan dan peningkatan berkelanjutan model AI seperti DeepSeek-R1-0528 sangat penting untuk membuka potensi penuh kecerdasan buatan. Dengan mendorong batas-batas dari apa yang mungkin dan mengatasi tantangan utama yang terkait dengan akurasi, efisiensi, dan aksesibilitas, DeepSeek berkontribusi pada kemajuan AI dan integrasinya ke dalam berbagai aspek kehidupan kita. Seiring AI menjadi semakin luas, pentingnya kemajuan ini hanya akan terus tumbuh, membentuk masa depan teknologi dan masyarakat secara keseluruhan.
Implikasi DeepSeek-R1-0528 untuk Komunitas AI dan Lebih Luas
Peluncuran DeepSeek-R1-0528 dan tolok ukur kinerjanya yang mengesankan memiliki implikasi signifikan bagi komunitas AI dan lebih luas. Pertama, itu menunjukkan bahwa inovasi dalam AI tidak terbatas pada raksasa mapan di Amerika Serikat dan negara-negara Barat lainnya. Perusahaan rintisan Tiongkok seperti DeepSeek mampu mengembangkan model AI mutakhir yang dapat bersaing dengan yang terbaik di dunia. Peningkatan persaingan ini dapat mendorong inovasi lebih lanjut dan mempercepat pengembangan teknologi AI secara global.
Kedua, sifat sumber terbuka dari DeepSeek-R1-0528 memungkinkan para peneliti dan pengembang di seluruh dunia untuk mengakses dan memanfaatkan kapabilitasnya. Demokratisasi teknologi AI ini dapat mendorong kolaborasi, mempercepat penelitian, dan mengarah pada pengembangan aplikasi dan kasus penggunaan baru. Model sumber terbuka juga memungkinkan transparansi dan pengawasan yang lebih besar, yang dapat membantu mengidentifikasi dan mengatasi potensi bias atau batasan dalam model.
Ketiga, peningkatan kinerja DeepSeek-R1-0528 di berbagai domain, seperti matematika, pemrograman, dan penalaran umum, berpotensi memengaruhi berbagai industri dan aplikasi. Di bidang pendidikan, model dapat digunakan untuk menciptakan pengalaman belajar yang dipersonalisasi, memberikan umpan balik otomatis, dan membantu siswa dalam memecahkan masalah. Di dunia bisnis, itu dapat digunakan untuk mengotomatiskan tugas, meningkatkan pengambilan keputusan, dan meningkatkan layanan pelanggan. Dan di komunitas ilmiah, itu dapat digunakan untuk mempercepat penelitian, menganalisis data, dan menghasilkan wawasan baru.
Akhirnya, fokus DeepSeek pada teknik distilasi menunjukkan jalur yang menjanjikan menuju solusi AI yang lebih efisien dan mudah diakses. Dengan menciptakan model yang lebih kecil dan lebih efisien yang mempertahankan kapabilitas rekan-rekan mereka yang lebih besar, DeepSeek membuat teknologi AI lebih mudah diakses oleh pengembang dan peneliti dengan sumber daya perangkat keras yang terbatas. Ini dapat membantu mendemokratisasikan AI dan memastikan bahwa manfaatnya dibagikan secara lebih luas.
Kesimpulannya, DeepSeek-R1-0528 mewakili tonggak penting dalam pengembangan kecerdasan buatan. Kinerja yang mengesankan, sifat sumber terbuka, dan fokus pada distilasi memiliki potensi untuk mendorong inovasi lebih lanjut, mempercepat penelitian, dan mendemokratisasikan akses ke teknologi AI. Seiring lanskap AI terus berkembang, kontribusi DeepSeek kemungkinan akan memainkan peran penting dalam membentuk masa depan industri dan dampaknya pada masyarakat.