Kecerdasan buatan, terutamanya cabang yang berkaitan dengan bahasa, telah didominasi dalam beberapa tahun kebelakangan ini oleh skala dan kuasa Model Bahasa Besar (LLMs). Gergasi ini, yang dilatih menggunakan lautan data yang luas, menunjukkan keupayaan yang luar biasa, menarik imaginasi orang ramai dan dolar pelaburan. Namun, di sebalik tajuk utama yang menggembar-gemburkan model yang semakin besar, revolusi yang lebih senyap tetapi berpotensi lebih transformatif sedang berlaku: kebangkitan Model Bahasa Kecil (SLMs). Sistem AI yang lebih ramping dan lebih fokus ini dengan pantas mengukir niche yang signifikan, menjanjikan untuk membawa keupayaan AI yang canggih ke persekitaran di mana sepupu mereka yang lebih besar tidak dapat beroperasi dengan cekap atau ekonomik.
Minat yang semakin meningkat terhadap SLMs bukan sekadar akademik; ia diterjemahkan kepada momentum pasaran yang ketara. Penganalisis industri meramalkan peningkatan dramatik untuk sektor SLM, mengunjurkan pengembangan daripada saiz pasaran anggaran kira-kira $0.93 bilion pada tahun 2025 kepada $5.45 bilion yang mengejutkan menjelang 2032. Trajektori ini mewakili kadar pertumbuhan tahunan kompaun (CAGR) yang kukuh kira-kira 28.7% sepanjang tempoh ramalan. Pertumbuhan pesat seperti itu tidak berlaku dalam vakum; ia didorong oleh pertemuan kuasa teknologi dan pasaran yang kuat.
Pendorong utama di antaranya ialah permintaan yang tidak henti-henti untuk Edge AI dan kecerdasan pada peranti (on-device intelligence). Perniagaan merentasi pelbagai sektor semakin mencari penyelesaian AI yang boleh berfungsi secara langsung pada telefon pintar, sensor, peralatan industri, dan sistem terbenam lain, tanpa kependaman, kos, atau kebimbangan privasi yang berkaitan dengan sambungan awan yang berterusan. Menjalankan AI secara tempatan membolehkan respons masa nyata yang penting untuk aplikasi daripada sistem kenderaan autonomi kepada pembantu mudah alih interaktif dan automasi kilang pintar. SLMs, dengan jejak pengkomputeran yang jauh lebih kecil berbanding LLMs, sangat sesuai untuk persekitaran yang terhad sumber ini.
Pada masa yang sama, kemajuan signifikan dalam teknik pemampatan model (model compression techniques) telah bertindak sebagai pemecut yang kuat. Inovasi seperti kuantisasi (quantization - mengurangkan ketepatan nombor yang digunakan dalam model) dan pemangkasan (pruning - membuang sambungan yang kurang penting dalam rangkaian neural) membolehkan pembangun mengecilkan saiz model dan meningkatkan kelajuan pemprosesan secara dramatik. Yang penting, teknik ini berkembang untuk mencapai kecekapan yang lebih besar sambil meminimumkan kesan terhadap prestasi dan ketepatan model. Manfaat dwi ini—saiz yang lebih kecil dan keupayaan yang dikekalkan—menjadikan SLMs alternatif yang semakin berdaya maju kepada LLMs untuk pelbagai tugas yang semakin meningkat.
Tambahan pula, perusahaan menyedari nilai pragmatik mengintegrasikan SLMs ke dalam operasi teras mereka. Daripada automasi IT (IT automation), di mana SLMs boleh menganalisis log dan meramalkan kegagalan sistem, kepada keselamatan siber (cybersecurity), di mana mereka boleh mengesan anomali dalam trafik rangkaian, dan pelbagai aplikasi perniagaan (business applications) yang bertujuan untuk meningkatkan produktiviti dan memperhalusi proses membuat keputusan, potensi impaknya sangat luas. SLMs menawarkan laluan untuk menggunakan AI secara lebih meluas, terutamanya dalam senario yang sensitif terhadap kos, privasi, atau memerlukan pemprosesan hampir serta-merta. Pertemuan keperluan pengkomputeran pinggir ini, keuntungan kecekapan melalui pemampatan, dan kes penggunaan perusahaan yang jelas meletakkan SLMs bukan sahaja sebagai versi LLMs yang lebih kecil, tetapi sebagai kategori AI yang berbeza dan penting yang bersedia untuk pengaruh yang signifikan.
Pembahagian Strategik: Kawalan Ekosistem vs. Pengkhususan Niche
Apabila landskap SLM terbentuk, pendekatan strategik yang berbeza muncul di kalangan pemain utama yang bersaing untuk penguasaan. Dinamik persaingan sebahagian besarnya berkisar pada dua falsafah utama, masing-masing mencerminkan model perniagaan yang berbeza dan visi jangka panjang tentang bagaimana nilai AI akan ditangkap.
Satu laluan yang menonjol ialah strategi kawalan ekosistem proprietari (proprietary ecosystem control strategy). Pendekatan ini digemari oleh beberapa gergasi teknologi dan makmal AI yang dibiayai dengan baik yang bertujuan untuk membina taman berdinding di sekeliling tawaran SLM mereka. Syarikat seperti OpenAI, dengan variannya yang berasal dari keturunan GPT (seperti keluarga GPT-4 mini yang dijangkakan), Google dengan model Gemma-nya, Anthropic memperjuangkan Claude Haiku-nya, dan Cohere mempromosikan Command R+, adalah contoh utama. Strategi mereka biasanya melibatkan pengkomersialan SLMs sebagai komponen penting platform yang lebih luas, sering dihantar melalui Antara Muka Pengaturcaraan Aplikasi (APIs) berasaskan langganan, perkhidmatan awan bersepadu (seperti Azure AI atau Google Cloud AI), atau melalui perjanjian pelesenan perusahaan.
Daya tarikan strategi ini terletak pada potensi integrasi yang ketat, prestasi yang konsisten, keselamatan yang dipertingkatkan, dan penggunaan yang dipermudahkan dalam aliran kerja perusahaan yang sedia ada. Dengan mengawal ekosistem, penyedia ini boleh menawarkan jaminan mengenai kebolehpercayaan dan sokongan, menjadikan SLMs mereka menarik untuk perniagaan yang mencari automasi dipacu AI yang mantap, pembantu ‘copilot’ canggih yang tertanam dalam suite perisian, dan alat sokongan keputusan yang boleh dipercayai. Model ini mengutamakan penangkapan nilai melalui penyampaian perkhidmatan dan kunci masuk platform (platform lock-in), memanfaatkan infrastruktur sedia ada dan jangkauan pasaran penyedia. Ia memenuhi keperluan organisasi yang mengutamakan integrasi lancar dan perkhidmatan AI terurus.
Berbeza secara ketara dengan permainan ekosistem ialah strategi model khusus domain (specialized domain-specific model strategy). Pendekatan ini berpusat pada pembangunan SLMs yang disesuaikan dan diperhalusi dengan teliti untuk permintaan unik, kosa kata, dan kekangan peraturan industri tertentu. Daripada bertujuan untuk kebolehgunaan yang luas, model ini diasah untuk prestasi tinggi dalam vertikal seperti kewangan, penjagaan kesihatan, perkhidmatan undang-undang, atau bahkan bidang teknikal khusus seperti pembangunan perisian.
Perintis dalam ruang ini termasuk platform seperti Hugging Face, yang menempatkan model seperti Zephyr 7B yang dioptimumkan secara eksplisit untuk tugas pengekodan, dan pemain perusahaan yang mapan seperti IBM, yang keluarga model Granite-nya direka dengan keperluan AI perusahaan, termasuk tadbir urus data dan pematuhan, sebagai terasnya. Kelebihan strategik di sini terletak pada kedalaman berbanding keluasan. Dengan melatih model pada set data khusus industri dan mengoptimumkannya untuk tugas tertentu (cth., memahami jargon kewangan, mentafsir nota perubatan, merangka klausa undang-undang), SLMs ini boleh mencapai ketepatan dan relevansi kontekstual yang unggul dalam domain yang ditetapkan. Strategi ini sangat bergema dengan organisasi dalam sektor terkawal atau intensif pengetahuan di mana model generik mungkin gagal, membolehkan mereka menggunakan penyelesaian AI yang sangat tepat dan peka konteks untuk kes penggunaan khusus dan kritikal misi. Ia memupuk penggunaan dengan menangani titik kesakitan khusus dan keperluan pematuhan yang mungkin diabaikan oleh model berasaskan luas.
Kedua-dua strategi dominan ini tidak semestinya saling eksklusif untuk keseluruhan pasaran, tetapi ia mewakili ketegangan utama yang membentuk persaingan. Pemain ekosistem bertaruh pada skala, integrasi, dan kekuatan platform, manakala pakar memberi tumpuan kepada kedalaman, ketepatan, dan kepakaran industri. Evolusi pasaran SLM kemungkinan akan melibatkan interaksi dan persaingan antara pendekatan ini, berpotensi membawa kepada model hibrid atau kepelbagaian strategik selanjutnya apabila teknologi matang.
Gergasi Memasuki Gelanggang: Buku Permainan Pemain Sedia Ada
Potensi gangguan dan peluang yang dibentangkan oleh Model Bahasa Kecil tidak terlepas pandang oleh gergasi dunia teknologi yang sedia ada. Memanfaatkan sumber mereka yang luas, hubungan pelanggan sedia ada, dan infrastruktur yang luas, pemain sedia ada ini secara strategik bergerak untuk mendapatkan kedudukan utama dalam bidang yang sedang berkembang ini.
Microsoft
Microsoft, sebuah kuasa besar yang kekal dalam perisian perusahaan dan pengkomputeran awan, secara agresif menganyam SLMs ke dalam fabrik teknologinya. Mengguna pakai strategi kawalan ekosistem proprietari, gergasi Redmond ini mengintegrasikan model yang lebih tangkas ini secara mendalam dalam platform awan Azure dan rangkaian penyelesaian perusahaan yang lebih luas. Tawaran seperti siri Phi (termasuk Phi-2) dan keluarga Orca mewakili SLMs yang tersedia secara komersial yang dioptimumkan secara khusus untuk tugas AI perusahaan, menggerakkan ciri dalam pembantu Copilot-nya dan menyediakan alat yang kuat untuk pembangun yang membina di atas timbunan Microsoft.
Kompetensi teras yang menyokong dorongan Microsoft ialah bahagian penyelidikan AI yang hebat digabungkan dengan infrastruktur awan Azure yang merangkumi seluruh dunia. Gabungan ini membolehkan Microsoft bukan sahaja membangunkan model canggih tetapi juga menyampaikannya sebagai perkhidmatan yang berskala, selamat, dan boleh dipercayai kepada pangkalan pelanggan perusahaannya yang besar. Perkongsian strategik berbilion dolar syarikat dengan OpenAI adalah asas strategi AI-nya, memberikannya akses istimewa kepada model OpenAI (termasuk varian SLM yang berpotensi) dan membolehkan integrasi ketat mereka ke dalam produk Microsoft seperti Office 365, Bing, dan pelbagai perkhidmatan Azure AI. Hubungan simbiotik ini menyediakan Microsoft dengan kedua-dua SLMs yang dibangunkan secara dalaman dan akses kepada jenama yang boleh dikatakan paling dikenali dalam AI generatif.
Tambahan pula, pemerolehan strategik mengukuhkan kedudukan Microsoft. Pembelian Nuance Communications, peneraju dalam AI perbualan dan teknologi dokumentasi penjagaan kesihatan, mengukuhkan keupayaannya dengan ketara dalam aplikasi AI khusus vertikal, terutamanya dalam senario penjagaan kesihatan dan automasi perusahaan di mana pemahaman bahasa khusus adalah penting. Langkah-langkah yang dikira ini – menggabungkan pembangunan dalaman, perkongsian strategik, pemerolehan, dan integrasi mendalam dengan platform awan dan perisian dominannya – meletakkan Microsoft sebagai kuasa yang hebat yang bertujuan untuk menjadikan ekosistemnya pilihan lalai untuk penggunaan SLM perusahaan merentasi pelbagai industri.
IBM
International Business Machines (IBM), dengan sejarah panjangnya yang berakar umbi dalam pengkomputeran perusahaan, mendekati pasaran SLM dengan fokus ciri pada aplikasi berpusatkan perniagaan, kepercayaan, dan tadbir urus. Big Blue secara aktif membangunkan dan mengoptimumkan SLMs dalam platform watsonx.ai-nya, membingkainya sebagai penyelesaian AI yang kos efektif, cekap, dan peka domain yang disesuaikan khusus untuk keperluan organisasi.
Strategi IBM sengaja berbeza dengan pendekatan yang mengutamakan model yang menghadap pengguna atau tujuan umum. Sebaliknya, penekanan diberikan sepenuhnya pada atribut kritikal untuk penggunaan perusahaan: kebolehpercayaan (trustworthiness), tadbir urus data (data governance), dan pematuhan kepada prinsip etika AI (AI ethics principles). Ini menjadikan tawaran SLM IBM, seperti model Granite, sangat sesuai untuk penggunaan dalam persekitaran selamat dan industri yang tertakluk kepada pematuhan peraturan yang ketat. IBM memahami bahawa bagi banyak organisasi besar, terutamanya dalam kewangan dan penjagaan kesihatan, keupayaan untuk mengaudit, mengawal, dan memastikan penggunaan AI yang bertanggungjawab adalah tidak boleh dirunding.
Dengan menggabungkan SLMs yang berfokuskan tadbir urus ini ke dalam penyelesaian awan hibrid dan perkhidmatan perundingannya, IBM bertujuan untuk memberdayakan perniagaan untuk meningkatkan automasi, menambah baik pembuatan keputusan berasaskan data, dan menyelaraskan kecekapan operasi tanpa menjejaskan keselamatan atau standard etika. Hubungan perusahaan mereka yang mendalam dan reputasi untuk kebolehpercayaan berfungsi sebagai aset utama dalam mempromosikan SLMs sebagai alat praktikal dan boleh dipercayai untuk transformasi digital dalam struktur organisasi yang kompleks. IBM bertaruh bahawa bagi banyak perniagaan, ‘bagaimana’ penggunaan AI – secara selamat dan bertanggungjawab – adalah sama pentingnya dengan ‘apa’.
Walaupun mungkin lebih jelas dikaitkan dengan model berskala besar seperti Gemini, Google juga merupakan pemain penting dalam arena SLM, terutamanya memanfaatkan ekosistem dan keupayaan penyelidikan yang luas. Melalui model seperti Gemma (cth., Gemma 7B), Google menawarkan model terbuka yang agak ringan namun berkebolehan, bertujuan untuk memupuk penggunaan pembangun dan integrasi dalam ekosistemnya sendiri, terutamanya Google Cloud Platform (GCP).
Strategi Google nampaknya menggabungkan elemen kawalan ekosistem dan memupuk komuniti yang lebih luas. Dengan mengeluarkan model seperti Gemma, ia menggalakkan eksperimen dan membolehkan pembangun membina aplikasi yang memanfaatkan infrastruktur asas Google (seperti TPUs untuk latihan dan inferens yang cekap). Pendekatan ini membantu mendorong penggunaan perkhidmatan GCP AI dan meletakkan Google sebagai penyedia kedua-dua model asas dan alat untuk menggunakannya dengan berkesan. Kepakaran mendalam mereka dalam carian, mudah alih (Android), dan infrastruktur awan menyediakan banyak jalan untuk mengintegrasikan SLMs untuk meningkatkan produk sedia ada atau mencipta pengalaman pada peranti baharu. Penyertaan Google memastikan bahawa pasaran SLM kekal sangat kompetitif, menolak sempadan kecekapan dan kebolehcapaian.
AWS
Amazon Web Services (AWS), pemain dominan dalam infrastruktur awan, secara semula jadi mengintegrasikan SLMs ke dalam portfolio AI dan pembelajaran mesinnya yang komprehensif. Melalui perkhidmatan seperti Amazon Bedrock, AWS menyediakan perniagaan dengan akses kepada pilihan model asas yang dipilih susun, termasuk SLMs daripada pelbagai penyedia (berpotensi termasuk miliknya sendiri, seperti model Nova konseptual yang disebut dalam beberapa konteks, walaupun butirannya mungkin berbeza).
Strategi AWS sebahagian besarnya berpusat pada menyediakan pilihan dan fleksibiliti dalam persekitaran awannya yang berkuasa. Dengan menawarkan SLMs melalui Bedrock, AWS membolehkan pelanggannya bereksperimen, menyesuaikan, dan menggunakan model ini dengan mudah menggunakan alat dan infrastruktur AWS yang biasa. Pendekatan berpusatkan platform ini memberi tumpuan kepada menjadikan SLMs boleh diakses sebagai perkhidmatan terurus, mengurangkan beban operasi untuk perniagaan yang ingin memanfaatkan AI tanpa mengurus perkakasan asas atau saluran paip penggunaan model yang kompleks. AWS bertujuan untuk menjadi platform asas di mana perusahaan boleh membina dan menjalankan aplikasi AI mereka, tanpa mengira sama ada mereka memilih model besar atau kecil, memanfaatkan skala, keselamatan, dan penawaran perkhidmatan yang luas untuk mengekalkan kepimpinan awannya dalam era AI.
Pengganggu dan Pakar: Membuka Laluan Baharu
Di luar gergasi teknologi yang sedia ada, kohort peserta baharu dan firma khusus yang bertenaga secara signifikan mempengaruhi arah dan kedinamikan pasaran Model Bahasa Kecil. Syarikat-syarikat ini sering membawa perspektif segar, memberi tumpuan kepada prinsip sumber terbuka, niche industri tertentu, atau pendekatan teknologi yang unik.
OpenAI
OpenAI, yang boleh dikatakan pemangkin kepada lonjakan minat AI generatif baru-baru ini, memegang kehadiran yang menguasai dalam ruang SLM, membina di atas penyelidikan perintis dan strategi penggunaan yang berjaya. Walaupun terkenal dengan model besarnya, OpenAI secara aktif membangunkan dan menggunakan varian yang lebih kecil dan lebih cekap, seperti keluarga GPT-4o mini, keluarga o1-mini, dan keluarga o3-mini yang dijangkakan. Ini mencerminkan pemahaman strategik bahawa kes penggunaan yang berbeza memerlukan saiz model dan ciri prestasi yang berbeza.
Sebagai perintis dalam pemprosesan bahasa semula jadi, kelebihan daya saing OpenAI berpunca daripada kepakaran penyelidikan yang mendalam dan keupayaannya yang terbukti untuk menterjemahkan penyelidikan kepada produk yang berdaya maju secara komersial. Fokusnya melangkaui keupayaan mentah untuk merangkumi aspek penting seperti kecekapan, keselamatan, dan penggunaan etika AI, yang amat relevan apabila model menjadi lebih meluas. Model penghantaran berasaskan API syarikat telah memainkan peranan penting dalam mendemokrasikan akses kepada AI yang berkuasa, membolehkan pembangun dan perniagaan di seluruh dunia mengintegrasikan teknologinya. Perkongsian strategik dengan Microsoft menyediakan modal yang signifikan dan jangkauan pasaran yang tiada tandingan, menanamkan teknologi OpenAI dalam ekosistem perusahaan yang luas.
OpenAI terus menolak sempadan dengan meneroka secara aktif teknik pemampatan model lanjutan dan menyiasat seni bina hibrid yang mungkin menggabungkan kekuatan saiz model yang berbeza untuk meningkatkan prestasi sambil meminimumkan permintaan pengkomputeran. Kepimpinannya dalam membangunkan teknik untuk penalaan halus dan penyesuaian model membolehkan organisasi menyesuaikan model asas OpenAI yang berkuasa untuk keperluan industri tertentu dan set data proprietari, seterusnya mengukuhkan kedudukan pasarannya sebagai inovator dan pemboleh utama AI terpakai.
Anthropic
Anthropic telah mengukir identiti tersendiri dalam landskap AI dengan meletakkan keselamatan, kebolehpercayaan, dan pertimbangan etika di barisan hadapan falsafah pembangunannya. Fokus ini jelas terpancar dalam pendekatannya terhadap SLMs, dicontohi oleh model seperti Claude Haiku. Direka secara eksplisit untuk prestasi yang selamat dan boleh dipercayai dalam konteks perusahaan, Haiku bertujuan untuk menyediakan keupayaan AI yang berguna sambil meminimumkan risiko menghasilkan kandungan yang berbahaya, berat sebelah, atau tidak benar.
Memposisikan dirinya sebagai penyedia AI yang boleh dipercayai (trustworthy AI), Anthropic menarik minat terutamanya kepada organisasi yang beroperasi dalam domain sensitif atau mereka yang mengutamakan penggunaan AI yang bertanggungjawab. Penekanan mereka pada AI berperlembagaan (constitutional AI) dan ujian keselamatan yang ketat membezakan mereka daripada pesaing yang mungkin mengutamakan prestasi mentah mengatasi segalanya. Dengan menawarkan SLMs yang bukan sahaja berkebolehan tetapi juga direka dengan pagar keselamatan terhadap penyalahgunaan, Anthropic memenuhi permintaan yang semakin meningkat untuk penyelesaian AI yang selaras dengan nilai korporat dan jangkaan kawal selia, menjadikan mereka pesaing utama, terutamanya untuk perniagaan yang mencari rakan kongsi AI yang boleh dipercayai dan berasaskan etika.
Mistral AI
Muncul dengan pantas dari persada teknologi Eropah, Mistral AI, sebuah syarikat Perancis yang ditubuhkan pada tahun 2023, telah mencipta gelombang besar dalam sektor SLM. Strategi terasnya berkisar pada penciptaan model AI yang padat dan sangat cekap yang direka secara eksplisit untuk prestasi dan kebolehgunaan, walaupun pada peranti tempatan atau dalam persekitaran pengkomputeran pinggir. Model seperti Mistral 7B (yang dikeluarkan pada mulanya) mendapat perhatian meluas kerana memberikan prestasi yang luar biasa berbanding saiznya yang sederhana (7 bilion parameter), menjadikannya sangat sesuai untuk senario di mana sumber pengkomputeran terhad.
Pembeza utama untuk Mistral AI ialah komitmen kuatnya terhadap pembangunan sumber terbuka (open-source development). Dengan mengeluarkan banyak model dan alatnya di bawah lesen permisif, Mistral AI memupuk kerjasama, ketelusan, dan inovasi pantas dalam komuniti AI yang lebih luas. Pendekatan ini berbeza dengan ekosistem proprietari beberapa pemain yang lebih besar dan dengan cepat membina pengikut setia di kalangan pembangun dan penyelidik. Di luar model asasnya, syarikat itu telah menunjukkan kepelbagaian dengan menghasilkan varian seperti Mistral Saba, yang disesuaikan untuk bahasa Timur Tengah dan Asia Selatan, dan meneroka keupayaan multimodal dengan konsep seperti Pixtral (bertujuan untuk pemahaman imej), mempamerkan cita-citanya untuk menangani pelbagai keperluan linguistik dan fungsian. Kebangkitan pesat Mistral AI menonjolkan selera yang signifikan untuk alternatif berprestasi tinggi, cekap, dan sering kali sumber terbuka dalam pasaran AI.
Infosys
Infosys, sebuah syarikat gergasi global dalam perkhidmatan IT dan perundingan, memanfaatkan kepakaran industri dan hubungan pelanggannya yang mendalam untuk mengukir niche dalam pasaran SLM, memberi tumpuan kepada penyelesaian khusus industri (industry-specific solutions). Pelancaran Infosys Topaz BankingSLM dan Infosys Topaz ITOpsSLM mencontohi strategi ini. Model-model ini dibina khas untuk menangani cabaran dan aliran kerja unik dalam sektor perbankan dan operasi IT, masing-masing.
Pemboleh utama untuk Infosys ialah perkongsian strategiknya dengan NVIDIA, menggunakan timbunan AI NVIDIA sebagai asas untuk SLMs khusus ini. Model-model ini direka untuk integrasi lancar dengan sistem perusahaan sedia ada, termasuk platform perbankan Finacle milik Infosys yang digunakan secara meluas. Dibangunkan dalam pusat kecemerlangan khusus yang memberi tumpuan kepada teknologi NVIDIA, dan diperkukuhkan lagi melalui kerjasama dengan rakan kongsi seperti Sarvam AI, SLMs ini mendapat manfaat daripada latihan pada data tujuan umum dan khusus sektor. Yang penting, Infosys bukan sahaja menyediakan model; ia juga menawarkan perkhidmatan pra-latihan dan penalaan halus (pre-training and fine-tuning services), membolehkan perusahaan mencipta model AI yang ditempah khas yang disesuaikan dengan data proprietari dan keperluan operasi khusus mereka, sambil memastikan keselamatan dan pematuhan dengan standard industri yang relevan. Pendekatan berorientasikan perkhidmatan ini meletakkan Infosys sebagai penyepadu dan penyesuai teknologi SLM untuk perusahaan besar.
Pemain Terkemuka Lain
Bidang SLM lebih luas daripada sekadar syarikat-syarikat yang diketengahkan ini. Penyumbang penting lain sedang mendorong inovasi dan membentuk segmen pasaran tertentu:
- Cohere: Memberi tumpuan kepada AI perusahaan, menawarkan model seperti Command R+ yang direka untuk kes penggunaan perniagaan dan sering menekankan privasi data dan fleksibiliti penggunaan (cth., pada pelbagai awan atau di premis).
- Hugging Face: Walaupun terkenal terutamanya sebagai platform dan hab komuniti, Hugging Face juga menyumbang kepada pembangunan model (seperti Zephyr 7B untuk pengekodan) dan memainkan peranan penting dalam mendemokrasikan akses kepada beribu-ribu model, termasuk banyak SLMs, memudahkan penyelidikan dan pembangunan aplikasi.
- Stability AI: Pada mulanya terkenal dengan kerjanya dalam penjanaan imej (Stable Diffusion), Stability AI sedang mengembangkan portfolionya ke dalam model bahasa, meneroka SLMs yang padat dan cekap yang sesuai untuk penggunaan pada peranti dan pelbagai aplikasi perusahaan, memanfaatkan kepakarannya dalam AI generatif.
Syarikat-syarikat ini, bersama pemain yang lebih besar, menyumbang kepada ekosistem yang dinamik dan berkembang pesat. Strategi mereka yang pelbagai—merangkumi sumber terbuka, platform proprietari, pengkhususan industri, dan penyelidikan asas—secara kolektif mendorong kemajuan dalam kecekapan, kebolehcapaian, dan keupayaan SLM, memastikan bahawa model yang lebih kecil ini memainkan peranan yang semakin penting dalam masa depan kecerdasan buatan merentasi aplikasi dan industri yang tidak terkira banyaknya.