SK Telecom (SKT) secara diam-diam memperkenalkan model bahasa besar (LLM) mereka, yang dikenal sebagai ‘A.X 4.0.’ Model ini dibuat dengan cermat dengan memasukkan pembelajaran bahasa Korea ke dalam kerangka kerja sumber terbuka. SKT telah mengindikasikan niat mereka untuk segera merilis model tipe inferensi, dengan versi pratinjau bernama AOTX 4.1 yang dijadwalkan untuk dirilis menjelang akhir Mei.
Berita muncul dari sektor telekomunikasi pada tanggal 23 April bahwa SKT telah meluncurkan AOTX 4.0 pada tanggal 30 April, membuatnya dapat diakses di GitHub, sebuah platform yang banyak digunakan untuk pengembangan perangkat lunak. Rincian lebih lanjut tentang kinerja model inferensi yang akan datang, pratinjau AOTX 4.1, juga dibagikan sebelumnya.
AOTX 4.0 merupakan kulminasi dari upaya yang telah diisyaratkan oleh CEO SKT Yoo Young-sang sebelumnya bulan lalu, menyatakan bahwa pengembangan hampir selesai. Setelah itu, model diselesaikan dalam waktu satu bulan dan saat ini sedang dalam proses diintegrasikan ke dalam layanan perusahaan.
Dasar dari model ini memanfaatkan Qwen 2.5 Alibaba, LLM sumber terbuka terkemuka dari China. AOTX 4.0 hadir dalam dua versi: model standar yang menampilkan 72 miliar parameter dan varian yang lebih ringan dengan 7 miliar parameter.
Pengembangan dan Optimalisasi untuk Bahasa Korea
SKT menekankan bahwa mereka telah merekayasa model yang memberikan kinerja yang dioptimalkan dalam konteks Korea. Hal ini dicapai dengan memasukkan data Korea yang ekstensif ke dalam Qwen 2.5 selama kuartal pertama. Untuk meningkatkan kemampuan model dalam memproses informasi Korea secara efisien, tokenizer Korea khusus telah diterapkan.
Tolok ukur kinerja yang dirilis oleh SKT mengungkapkan bahwa AOTX 4.0 mencapai skor 78,3 poin dalam tolok ukur KMMLU. Tolok ukur ini berfungsi untuk mengevaluasi pemahaman model tentang keahlian bahasa Korea. Khususnya, AOTX 4.0 mengungguli GPT-4o OpenAI, yang mencetak 72,5 poin, dan Qwen 1.3 Alibaba, yang mencetak 70,6 poin.
AOTX 4.1 Pratinjau: Model Tipe Inferensi
Model pratinjau AOTX 4.1, yang dijadwalkan untuk dirilis pada akhir Mei, mewakili model inferensial yang sedang aktif dikembangkan oleh SKT. Dengan merilis versi pratinjau, SKT bertujuan untuk menghasilkan minat dan mengevaluasi kinerja model sebelum peluncuran resmi.
SKT menyoroti bahwa model pratinjau AOTX 4.1 menunjukkan tingkat kinerja yang sebanding dengan model inferensi DeepSeek, yang dikenal sebagai ‘DeepSeek R1.’ Model ini mendapat perhatian signifikan sebelumnya di tahun ini.
Hasil tolok ukur yang membandingkan pratinjau AOTX 4.1 dengan DeepSeek R1 menunjukkan bahwa AOTX 4.1 mencapai skor yang sama meskipun ukurannya kira-kira sepersembilan dari DeepSeek R1.
Peningkatan dan Kemampuan Masa Depan
Ke depan, SKT menguraikan rencananya untuk AOTX 4.1, menyatakan bahwa itu akan meningkatkan kemampuan dalam pemecahan masalah matematika dan pengembangan kode. Peningkatan lebih lanjut akan fokus pada kemampuan pengkodean dan keahlian industri tertentu. SKT bermaksud untuk mengembangkan model tipe agen yang secara mandiri dapat menjalankan tugas dan membuat keputusan yang beralasan.
Selami Lebih Dalam Spesifikasi Teknis dan Arsitektur
A.X 4.0 bukan hanya model bahasa lain; itu adalah sistem yang direkayasa dengan cermat yang dirancang untuk kinerja optimal dalam lingkungan bahasa Korea. Untuk sepenuhnya menghargai kemampuannya, kita perlu memeriksa spesifikasi teknis dan pilihan arsitekturnya. Fondasi model pada Qwen 2.5 Alibaba adalah keputusan strategis, memanfaatkan LLM yang kuat dan diakui secara global sebagai titik awal. Fondasi ini kemudian ditambah dengan data Korea yang ekstensif, menyempurnakan model untuk nuansa dan seluk-beluk bahasa Korea.
Pendekatan varian ganda – model standar dengan 72 miliar parameter dan model ringan dengan 7 miliar parameter – memungkinkan SKT untuk memenuhi berbagai aplikasi. Model 72 miliar parameter dirancang untuk tugas yang membutuhkan presisi tinggi dan pemahaman mendalam, sedangkan model 7 miliar parameter dioptimalkan untuk efisiensi dan penyebaran di lingkungan dengan sumber daya terbatas. Kemampuan beradaptasi ini sangat penting untuk aplikasi dunia nyata, di mana sumber daya komputasi dapat sangat bervariasi.
Tokenizer Korea: Pembeda Utama
Salah satu pembeda utama dari A.X 4.0 adalah tokenizer Korea khususnya. Tokenisasi adalah proses memecah teks menjadi unit-unit yang lebih kecil (token) yang dapat dipahami dan diproses oleh model. Tokenizer tradisional, yang sering dilatih dalam bahasa Inggris atau bahasa berbasis Latin lainnya, mungkin tidak cocok untuk bahasa Korea karena sifat linguistiknya yang unik, seperti sifat aglutinatifnya dan struktur karakter yang kompleks (Hangul).
Dengan menerapkan tokenizer khusus Korea, SKT memastikan bahwa A.X 4.0 dapat menangani teks Korea dengan lebih efektif. Tokenizer khusus ini dirancang untuk:
- Menangani Hangul secara efisien: Memproses dan merepresentasikan karakter Korea secara akurat.
- Mengatasi aglutinasi: Menguraikan kata-kata kompleks menjadi morfem konstituen mereka (unit bermakna).
- Meningkatkan pemahaman kontekstual: Lebih baik menangkap hubungan antara kata-kata dalam kalimat Korea.
Proses tokenisasi yang dioptimalkan ini secara langsung diterjemahkan ke peningkatan kinerja dalam tugas-tugas seperti terjemahan mesin, peringkasan teks, dan tanya jawab.
Tolok Ukur A.X 4.0: Melebihi Ekspektasi
Tolok ukur kinerja yang dirilis oleh SKT memberikan bukti kuat tentang kemampuan A.X 4.0. Tolok ukur KMMLU (Pemahaman Bahasa Multitugas Besar-besaran Korea) adalah evaluasi komprehensif tentang kemampuan model untuk memahami dan bernalar tentang berbagai tugas bahasa Korea. Skor 78,3 pada tolok ukur KMMLU menempatkan A.X 4.0 di depan GPT-4o OpenAI (72,5) dan Qwen 1.3 Alibaba (70,6), menunjukkan pemahamannya yang lebih unggul tentang keahlian bahasa Korea.
Hasil ini sangat penting karena mereka menyoroti kemampuan A.X 4.0 untuk tidak hanya memproses teks Korea tetapi juga untuk memahami konteks dan makna yang mendasarinya. Ini penting untuk tugas-tugas yang membutuhkan penalaran mendalam dan pengetahuan tentang budaya dan masyarakat Korea.
AOTX 4.1 Pratinjau: Janji Inferensi
Rilis mendatang dari model pratinjau AOTX 4.1 menghasilkan kegembiraan yang cukup besar di dalam industri. Sebagai model tipe inferensi, AOTX 4.1 dirancang untuk unggul dalam tugas-tugas yang membutuhkan penalaran, deduksi, dan kemampuan untuk menarik kesimpulan dari informasi yang tidak lengkap atau ambigu. Ini sangat penting untuk aplikasi seperti:
- Pengambilan keputusan: Menganalisis data dan memberikan wawasan untuk mendukung keputusan yang tepat.
- Pemecahan masalah: Mengidentifikasi dan menyelesaikan masalah yang kompleks.
- Pemodelan prediktif: Meramalkan hasil masa depan berdasarkan data dan tren historis.
Klaim SKT bahwa AOTX 4.1 menunjukkan kinerja yang sebanding dengan model R1 DeepSeek, meskipun ukurannya jauh lebih kecil, adalah bukti arsitekturnya yang efisien dan proses pelatihan yang dioptimalkan. Ini menunjukkan bahwa AOTX 4.1 dapat memberikan kinerja tinggi dengan biaya komputasi yang lebih rendah, menjadikannya solusi yang lebih praktis untuk banyak aplikasi dunia nyata.
Visi SKT untuk Masa Depan: Model Tipe Agen
Melihat melampaui AOTX 4.1, SKT memiliki rencana ambisius untuk pengembangan model bahasanya di masa depan. Visi perusahaan mencakup penciptaan model tipe agen yang secara mandiri dapat menjalankan tugas dan membuat keputusan rasional. Ini merupakan langkah signifikan menuju kecerdasan umum buatan (AGI), di mana mesin dapat melakukan tugas intelektual apa pun yang dapat dilakukan oleh manusia.
Untuk mencapai tujuan ini, SKT bermaksud untuk fokus pada:
- Memperkuat kemampuan pengkodean: Memungkinkan model untuk menghasilkan dan memahami kode komputer.
- Meningkatkan keahlian industri tertentu: Melatih model pada pengetahuan khusus yang relevan dengan sektor-sektor tertentu, seperti keuangan, perawatan kesehatan, dan manufaktur.
- Mengembangkan penalaran dan pengambilan keputusan: Membekali model dengan kemampuan untuk menganalisis informasi, mengevaluasi opsi, dan membuat penilaian yang baik.
Pengembangan model tipe agen memiliki potensi untuk merevolusi banyak industri, mengotomatiskan tugas-tugas kompleks, meningkatkan efisiensi, dan menciptakan peluang baru untuk inovasi.
Lanskap Kompetitif: Posisi SKT
Masuknya SK Telecom ke ruang LLM dengan A.X 4.0 memposisikannya sebagai pemain signifikan di pasar yang berkembang pesat. Secara global, perusahaan seperti OpenAI, Google, dan Meta berinvestasi besar-besaran dalam mengembangkan dan menyebarkan model bahasa besar. Di Korea, Naver dan Kakao juga merupakan pesaing utama.
Strategi SKT untuk fokus pada optimalisasi bahasa Korea dan mengembangkan model khusus dapat memberikan keunggulan kompetitif. Dengan menyesuaikan modelnya dengan kebutuhan khusus pasar Korea, SKT berpotensi mengungguli LLM generik dalam tugas-tugas yang membutuhkan pemahaman mendalam tentang bahasa, budaya, dan masyarakat Korea.
Implikasi untuk Ekonomi Korea
Pengembangan dan penyebaran A.X 4.0 dan model bahasa canggih lainnya dapat memiliki implikasi signifikan bagi ekonomi Korea. Teknologi ini berpotensi untuk:
- Meningkatkan produktivitas: Mengotomatiskan tugas, meningkatkan efisiensi, dan membebaskan pekerja manusia untuk fokus pada kegiatan yang lebih kreatif dan strategis.
- Mendorong inovasi: Memungkinkan produk, layanan, dan model bisnis baru.
- Meningkatkan daya saing: Membantu perusahaan Korea bersaing lebih efektif di pasar global.
Pemerintah Korea secara aktif mempromosikan pengembangan dan adopsi teknologi AI, mengakui potensi mereka untuk mendorong pertumbuhan ekonomi dan meningkatkan kualitas hidup. Investasi SK Telecom dalam LLM sejalan dengan strategi nasional ini dan dapat berkontribusi pada munculnya Korea sebagai pemimpin di bidang kecerdasan buatan.
Pertimbangan Etis
Seperti halnya teknologi yang kuat, pengembangan dan penyebaran model bahasa besar menimbulkan pertimbangan etis yang penting. Ini termasuk:
- Bias dan keadilan: Memastikan bahwa model dilatih pada dataset yang beragam dan representatif untuk menghindari melanggengkan bias.
- Privasi dan keamanan: Melindungi data sensitif dan mencegah penyalahgunaan model.
- Penggusuran pekerjaan: Mengatasi potensi dampak otomatisasi pada pekerjaan.
- Misinformasi dan manipulasi: Mencegah model digunakan untuk menghasilkan informasi yang salah atau menyesatkan.
Sangat penting bagi perusahaan seperti SK Telecom untuk mengatasi pertimbangan etis ini secara proaktif dan untuk mengembangkan dan menyebarkan model bahasa mereka dengan cara yang bertanggung jawab dan etis. Ini termasuk menerapkan perlindungan untuk mencegah bias, melindungi privasi, dan mempromosikan transparansi.
Kesimpulan
Peluncuran diam-diam SK Telecom dari A.X 4.0 menandai langkah maju yang signifikan dalam pengembangan model bahasa besar yang dioptimalkan bahasa Korea. Dengan fokusnya pada kinerja, efisiensi, dan aplikasi dunia nyata, A.X 4.0 memiliki potensi untuk memberikan kontribusi yang berharga bagi ekonomi dan masyarakat Korea. Saat SKT terus mengembangkan dan menyempurnakan model bahasanya, penting untuk mengatasi pertimbangan etis dan untuk memastikan bahwa teknologi yang kuat ini digunakan untuk kepentingan semua.