Anthropic baru-baru ini telah melancarkan model AI generasi seterusnya mereka, Claude Opus 4 dan Claude Sonnet 4, yang menetapkan penanda aras baharu dalam pengekodan, penaakulan lanjutan, dan keupayaan ejen AI. Model-model ini mewakili lonjakan yang ketara ke hadapan, menawarkan prestasi dan ketepatan yang dipertingkatkan untuk pelbagai tugas kompleks.
Claude Opus 4: Model Pengekodan Utama Dunia
Claude Opus 4 menonjol sebagai model pengekodan terbaik dunia, menunjukkan prestasi yang luar biasa dan konsisten pada tugas-tugas rumit dan berdurasi panjang. Keupayaannya untuk mengendalikan pemikiran lanjutan dan aliran kerja ejen menjadikannya aset yang tidak ternilai bagi pembangun yang menangani cabaran pengekodan yang kompleks. Kehebatan model ini meliputi pemahaman asas kod yang kompleks, membuat perubahan yang tepat merentasi berbilang fail, dan meningkatkan kualiti kod semasa penyuntingan dan penyahpepijatan. Beberapa pemimpin industri telah memuji Claude Opus 4 atas keupayaannya:
- Cursor: Memujinya sebagai yang terkini dalam pengekodan dan kemajuan yang ketara dalam pemahaman asas kod yang kompleks.
- Replit: Menekankan ketepatan yang diperbaik dan peningkatan dramatik untuk perubahan kompleks merentasi banyak fail.
- Block: Mengiktirafnya sebagai model pertama yang meningkatkan kualiti kod semasa penyuntingan dan penyahpepijatan dalam ejennya, berkod nama “goose,” sambil mengekalkan prestasi dan kebolehpercayaan puncak.
- Rakuten: Mengesahkan keupayaannya dengan refaktor sumber terbuka yang mencabar, yang berjalan secara bebas selama 7 jam dengan prestasi yang konsisten.
- Cognition: Mengakui bahawa Opus 4 cemerlang dalam menyelesaikan cabaran rumit yang model lain bergelut dengannya, berjaya mengendalikan tindakan kritikal yang telah diabaikan oleh model sebelumnya.
Claude Sonnet 4: Peningkatan yang Ketara
Claude Sonnet 4 mewakili peningkatan yang besar daripada pendahulunya, Claude Sonnet 3.7. Ia memberikan keupayaan pengekodan dan penaakulan yang unggul sambil bertindak balas dengan lebih tepat kepada arahan pengguna. Model ini mencapai keseimbangan optimum antara prestasi dan kecekapan, menjadikannya sesuai untuk pelbagai kes penggunaan dalaman dan luaran. Walaupun ia mungkin tidak mengatasi Opus 4 dalam semua domain, ia menawarkan gabungan ideal antara keupayaan dan kepraktisan. Sorotan utama Claude Sonnet 4 termasuk:
- GitHub: Menyatakan bahawa Claude Sonnet 4 cemerlang dalam senario agentik dan akan disepadukan sebagai model yang menguasakan ejen pengekodan baharu dalam GitHub Copilot.
- Manus: Menekankan penambahbaikan dalam mengikuti arahan yang kompleks, penaakulan yang jelas, dan output yang menyenangkan dari segi estetik.
- iGent: Melaporkan bahawa Sonnet 4 cemerlang dalam pembangunan aplikasi berbilang ciri autonomi, serta penyelesaian masalah dan navigasi asas kod yang dipertingkatkan dengan ketara, mengurangkan ralat navigasi daripada 20% kepada hampir sifar.
- Sourcegraph: Mencadangkan bahawa model ini menunjukkan janji sebagai lonjakan besar dalam pembangunan perisian, mengekalkan fokus untuk tempoh yang lebih lama, memahami masalah dengan lebih mendalam, dan menyediakan kualiti kod yang lebih elegan.
- Augment Code: Melaporkan kadar kejayaan yang lebih tinggi, suntingan kod yang lebih pembedahan, dan kerja yang lebih berhati-hati melalui tugas yang kompleks, menjadikannya pilihan utama untuk model utama mereka.
Pemikiran Lanjutan dengan Penggunaan Alat
Kedua-dua Claude Opus 4 dan Claude Sonnet 4 menampilkan keupayaan pemikiran lanjutan dengan penggunaan alat, membolehkan mereka memanfaatkan alat luaran untuk meningkatkan penaakulan dan kebolehan menyelesaikan masalah mereka. Ini membolehkan Claude untuk berselang-seli antara penaakulan dan penggunaan alat, yang membawa kepada respons yang diperbaik dan hasil yang lebih tepat. Model ini juga boleh melaksanakan alat secara selari, mengikuti arahan dengan ketepatan yang lebih tinggi, dan menunjukkan keupayaan memori yang dipertingkatkan dengan ketara. Ini dicapai dengan mengekstrak dan menyimpan fakta-fakta utama untuk mengekalkan kesinambungan dan membina pengetahuan terpendam dari masa ke masa.
Kod Claude: Kini Tersedia Secara Umum
Kod Claude, kini tersedia secara umum, menyediakan pembangun dengan peluang yang diperluaskan untuk bekerjasama dengan Claude. Ia menyokong tugas latar belakang melalui GitHub Actions dan integrasi asli dengan VS Code dan JetBrains. Suntingan dipaparkan terus dalam fail anda, memudahkan pengaturcaraan berpasangan yang lancar dan pembangunan kolaboratif. Ciri ini telah menerima maklum balas positif yang meluas semasa pratonton penyelidikan, menonjolkan nilainya dalam memperkemas aliran kerja pembangunan.
Keupayaan API Baharu
Anthropic juga telah mengeluarkan empat keupayaan baharu pada Anthropic API, memperkasakan pembangun untuk membina ejen AI yang lebih berkuasa. Keupayaan ini termasuk:
- Alat Pelaksanaan Kod: Membenarkan ejen melaksanakan coretan kod untuk menyelesaikan masalah kompleks.
- Penyambung MCP: Membolehkan ejen berinteraksi dengan sumber dan perkhidmatan data luaran.
- API Fail: Menyediakan ejen dengan akses kepada sistem fail tempatan untuk pemprosesan data yang dipertingkatkan.
- Caching Prompt: Membenarkan pembangun untuk menyimpan prompt dalam cache sehingga satu jam, mengurangkan kependaman dan meningkatkan prestasi.
Model Hibrid dengan Mod Dwi
Claude Opus 4 dan Sonnet 4 ialah model hibrid yang menawarkan dua mod yang berbeza:
- Respons Hampir Segera: Menyediakan respons yang cepat dan cekap untuk pertanyaan rutin.
- Pemikiran Lanjutan: Membolehkan penaakulan dan penyelesaian masalah yang lebih mendalam untuk tugas yang kompleks.
Pelan Pro, Max, Team dan Enterprise Claude merangkumi kedua-dua model dan keupayaan pemikiran lanjutan. Claude Sonnet 4 juga boleh diakses oleh pengguna percuma. Kedua-dua model tersedia pada Anthropic API, Amazon Bedrock, dan Vertex AI Awan Google, memastikan kebolehaksesan yang luas untuk pembangun dan organisasi.
Ketekalan Harga
Harga untuk Claude Opus 4 dan Sonnet 4 kekal konsisten dengan model Opus dan Sonnet sebelumnya:
- Opus 4: $15/$75 setiap juta token (input/output)
- Sonnet 4: $3/$15 setiap juta token (input/output)
Penambahbaikan Model: Pintasan Terkurang dan Memori yang Dipertingkatkan
Sebagai tambahan kepada pemikiran lanjutan dengan penggunaan alat, pelaksanaan alat selari, dan penambahbaikan memori, Anthropic telah mengurangkan dengan ketara kejadian model menggunakan pintasan atau lubang jalan untuk menyelesaikan tugas. Kedua-dua model adalah 65% kurang berkemungkinan terlibat dalam tingkah laku ini berbanding Sonnet 3.7 pada tugas agentik. Claude Opus 4 juga mengatasi semua model sebelumnya secara dramatik dari segi keupayaan memori. Apabila pembangun membina aplikasi yang menyediakan akses fail tempatan Claude, Opus 4 cemerlang dalam mencipta dan mengekalkan ‘fail memori’ untuk menyimpan maklumat utama. Ini membuka kunci kesedaran tugas jangka panjang, keselarasan dan prestasi yang lebih baik pada tugas ejen, membolehkan senario seperti Opus 4 mencipta ‘Panduan Navigasi’ semasa bermain Pokémon.
Ringkasan Pemikiran
Anthropic telah memperkenalkan ringkasan pemikiran untuk model Claude 4, yang menggunakan model yang lebih kecil untuk memendekkan proses pemikiran yang panjang. Ciri ini hanya digunakan kira-kira 5% daripada masa, kerana kebanyakan proses pemikiran cukup pendek untuk dipaparkan sepenuhnya. Pengguna yang memerlukan rantaian pemikiran mentah untuk kejuruteraan prompt lanjutan boleh menghubungi jualan mengenai Mod Pembangun baharu Anthropic untuk mengekalkan akses penuh.
Integrasi Kod Claude
Kod Claude kini disepadukan ke dalam lebih banyak aliran kerja pembangunan anda, termasuk terminal, IDE pilihan anda, dan pelaksanaan latar belakang dengan Claude Code SDK. Sambungan beta baharu untuk VS Code dan JetBrains menyepadukan Kod Claude secara lancar terus ke dalam IDE anda. Suntingan yang dicadangkan Claude muncul sebaris dalam fail anda, memperkemas semakan dan pengesanan dalam antara muka editor yang biasa. Untuk memasang, hanya jalankan Kod Claude dalam terminal IDE anda.
SDK Kod Claude yang Boleh Dilanjutkan
Di luar IDE, Anthropic mengeluarkan SDK Kod Claude yang boleh dilanjutkan, membolehkan pengguna membina ejen dan aplikasi mereka sendiri menggunakan ejen teras yang sama seperti Kod Claude. Contoh perkara yang mungkin dilakukan dengan SDK ialah Kod Claude di GitHub, kini dalam beta. Tandakan Kod Claude pada PR untuk membalas maklum balas penyemak, membetulkan ralat CI, atau mengubah suai kod. Untuk memasang, jalankan /install-github-app dari dalam Kod Claude.
Satu Langkah Ke Arah Kerjasama Maya
Model-model ini mewakili langkah penting ke arah kolaborator maya, mengekalkan konteks penuh, mengekalkan fokus pada projek yang lebih panjang, dan memacu impak transformasi. Mereka menjalani ujian dan penilaian yang meluas untuk meminimumkan risiko dan memaksimumkan keselamatan, termasuk pelaksanaan langkah-langkah untuk Tahap Keselamatan AI yang lebih tinggi seperti ASL-3.
Kemajuan ini menjanjikan kemungkinan yang menarik untuk pelbagai aplikasi, dengan Opus 4 menolak sempadan dalam pengekodan, penyelidikan, penulisan dan penemuan saintifik, dan Sonnet 4 membawa prestasi sempadan kepada kes penggunaan harian sebagai peningkatan serta-merta daripada Sonnet 3.7.