Syarikat AI Paling Inovatif 2025

Lanskap kecerdasan buatan (AI) mengalami perubahan dramatik pada tahun 2024, menandakan detik penting dalam perjalanan menuju kecerdasan buatan umum (AGI). Lonjakan awal kemajuan, yang melahirkan chatbot yang mengagumkan seperti ChatGPT dan Claude, sebahagian besarnya didorong oleh peningkatan model, data latihan, dan kuasa pengkomputeran. Walau bagaimanapun, apabila keuntungan daripada saiz semata-mata mula mendatar, para penyelidik menyedari keperluan untuk pendekatan baru, yang melangkaui latihan, untuk mencapai matlamat bercita-cita tinggi AGI – model yang memiliki keupayaan kognitif yang lebih luas yang melampaui manusia.

Perkembangan terobosan muncul daripada OpenAI dengan model o1 yang penting. Ini menandakan titik perubahan, kerana para penyelidik mula menyalurkan lebih banyak sumber pengkomputeran ke dalam penaakulan masa nyata, proses kognitif yang dilakukan oleh model sejurus selepas menerima arahan atau pertanyaan pengguna. Walaupun masa tindak balas o1 mungkin melebihi model lain, kualiti jawapannya jelas mengatasi model yang tidak mempunyai keupayaan penaakulan ini. Kenaikannya yang pantas ke bahagian atas kedudukan ujian penanda aras berfungsi sebagai pemangkin, mendorong pemain utama lain seperti Google DeepMind, Anthropic, dan DeepSeek untuk memasukkan penaakulan masa nyata ke dalam latihan model mereka.

Peralihan paradigma ke arah penaakulan masa nyata ini meningkatkan permintaan untuk GPU Nvidia, yang sudah penting untuk latihan. Harga saham Nvidia mengalami peningkatan 171% yang mengejutkan pada tahun 2024, bukti pandangan jauh syarikat itu. Setelah menjangkakan trend ini, Nvidia dengan bijak menyepadukan ciri baharu ke dalam GPUnya, menjadikannya lebih mahir dalam inferens masa nyata. Ini memuncak dalam seni bina Blackwell dan cip B100 dan B200. Didedahkan pada Mac 2024, GPU baharu ini segera dibeli oleh pengendali pusat data terkemuka, dengan bekalan sepanjang tahun habis dijual hampir serta-merta.

Malah sebelum kemunculan model penaakulan, beberapa syarikat AI perintis telah pun menolak sempadan pembangunan sistem AI. Google DeepMind mencapai kejayaan dengan keluarga model Gemininya, yang sememangnya multimodal, mampu memahami imejan dan audio dengan kecekapan yang sama seperti bahasa. Anthropic mengekalkan usaha tanpa henti, mencabar penguasaan OpenAI, dan terutamanya menjadi yang pertama mengeluarkan model yang mampu berinteraksi dengan komputer pengguna. Mistral, bersama-sama dengan Microsoft, memperkenalkan model bahasa kecil yang mengagumkan seperti Ministral 3B, Ministral 8B, Phi-3, dan Phi-4, yang direka untuk operasi yang cekap pada komputer riba dan juga telefon pintar. Pada masa yang sama, Runway terus mentakrifkan semula keadaan seni dengan model penjanaan video Gen-3 Alphanya.

Di tengah-tengah kemajuan ini, sebuah makmal AI yang agak kecil di China, DeepSeek, secara senyap-senyap membuat kemajuan yang ketara. Menjelang akhir tahun 2024, model DeepSeek, termasuk model penaakulan, mula menghantar riak ke seluruh industri AI. Mereka mencapai keputusan terkini dengan kos dan kuasa GPU yang jauh lebih rendah daripada yang difikirkan mungkin sebelum ini, berkongsi penyelidikan dan model mereka secara terbuka. Kejayaan DeepSeek, walaupun menyebabkan sedikit kebimbangan awal, bersedia untuk mempercepatkan inovasi di kalangan syarikat AI terkemuka dunia pada tahun yang akan datang.

2. Nvidia

Usaha untuk sistem AI yang semakin canggih terus memacu pelaburan yang besar daripada pembangun model bahasa besar. Walau bagaimanapun, satu syarikat sudah menikmati hasil daripada revolusi AI ini: Nvidia. Setelah menyemarakkan perlumbaan AI dengan unit pemprosesan grafiknya (GPU) yang dominan, Nvidia kini berada pada kedudukan yang sempurna dengan pemproses dan platform Blackwell yang terobosan untuk menyokong usaha mencapai kecerdasan tahap manusia.

Blackwell mengatasi pendahulunya, H100, menawarkan sehingga 2.5 kali ganda kuasa untuk tugas latihan model am, sambil menggunakan tenaga yang jauh lebih sedikit. Pengendali pusat data utama dan makmal AI, termasuk gergasi industri seperti Google, Meta, Microsoft, OpenAI, Tesla, dan xAI, telah komited untuk membeli ratusan ribu GPU Blackwell.

Walaupun model terkini daripada syarikat China seperti DeepSeek dan Alibaba telah menunjukkan keupayaan yang mengagumkan menggunakan GPU Nvidia yang lebih lama dan kurang berkuasa, Nvidia tidak hanya berpuas hati. Syarikat itu secara aktif membangunkan platform untuk pelbagai aplikasi, daripada penemuan ubat (Clara untuk Biopharma) dan kenderaan autonomi (Drive AGX) kepada pengeluaran video (Holoscan) dan kembar digital (Omniverse). Dengan memupuk kemajuan AI merentasi spektrum senario dunia sebenar yang luas, Nvidia secara strategik meletakkan dirinya untuk pertumbuhan yang mampan, walaupun model masa depan menunjukkan pergantungan yang berkurangan pada kuasa pengkomputeran semata-mata.

2. OpenAI

Sejak 2019, OpenAI telah secara konsisten meningkatkan modelnya dengan mengembangkan data latihan dan sumber pengkomputeran, strategi yang telah diterima pakai secara meluas di seluruh industri. Walau bagaimanapun, apabila pulangan yang semakin berkurangan daripada pendekatan penskalaan ini menjadi jelas, OpenAI menyedari keperluan untuk laluan baharu ke arah mencapai AGI – model yang mengatasi kecerdasan manusia dalam kebanyakan tugas.

Penyelesaian OpenAI tiba dalam bentuk model o1. Daripada hanya memfokuskan pada peningkatan sumber semasa prlatihan, OpenAI merekayasa o1 untuk memperuntukkan lebih banyak masa dan kuasa pengkomputeran semasa inferens, fasa di mana model digunakan secara aktif dan bertindak balas kepada gesaan pengguna. Semasa proses ini, o1 mengumpul dan mengekalkan maklumat kontekstual, daripada pengguna dan sumber data yang berkaitan. Ia menggunakan metodologi cuba-cuba untuk menentukan laluan optimum kepada jawapan. Hasilnya ialah penjanaan respons peringkat PhD kepada soalan rumit, mendorong o1 ke bahagian atas kedudukan penanda aras prestasi.

OpenAI menawarkan versi ‘eksperimen’ dan ‘mini’ o1 kepada pelanggan ChatGPT Plus. Selain itu, perkhidmatan premium yang dipanggil ChatGPT Pro menyediakan akses tanpa had kepada model o1 penuh dengan harga $200 sebulan. Pada Disember 2024, OpenAI melancarkan pengganti o1, o3, dan pada Februari 2025, memberikan pengguna berbayar akses kepada o3-mini, varian yang lebih kecil dan pantas yang dioptimumkan untuk sains, matematik dan pengekodan. Kesan paling mendalam daripada model penaakulan baharu OpenAI ialah pengesahan peningkatan pengkomputeran pada masa inferens sebagai jalan yang menjanjikan untuk mencapai kejayaan selanjutnya dalam kecerdasan dalam perjalanan ke AGI.

2. Google DeepMind

Penyelidikan asas yang membuka jalan kepada chatbot hari ini berasal dari Google pada akhir 2010-an. Google telah membangunkan chatbot berkuasa model bahasa besar sebelum kemunculan ChatGPT. Walau bagaimanapun, kebimbangan mengenai keselamatan, privasi dan implikasi undang-undang dilaporkan membawa kepada pendekatan berhati-hati, menangguhkan keluaran awamnya. Keraguan ini mengakibatkan Google pada mulanya ketinggalan dalam perlumbaan AI yang dicetuskan oleh pelancaran ChatGPT.

Keluaran Gemini 2.0 Google DeepMind pada tahun 2024 menandakan kebangkitan semula Google yang pasti. Gemini 2.0 mewakili model AI pasaran massa pertama yang sememangnya multimodal, mampu memproses dan menjana imej, video, audio dan kod komputer dengan kefasihan yang sama seperti teks. Keupayaan ini membolehkan model menganalisis dan menaakul tentang klip video, atau bahkan suapan video langsung daripada kamera telefon, dengan kelajuan dan ketepatan yang luar biasa.

Gemini juga menonjol kerana keupayaannya untuk mengawal perkhidmatan Google yang lain, seperti Maps dan Search. Penyepaduan ini mempamerkan kelebihan strategik Google, menggabungkan penyelidikan AI dengan maklumat dan alat produktiviti yang mantap. Gemini adalah antara model AI pertama yang menunjukkan operasi autonomi dan kapasiti untuk menaakul melalui masalah yang kompleks bagi pihak pengguna. Model Gemini 2.0 Flash Thinking Experimental malah memberikan pengguna pandangan tentang proses pemikiran yang digunakan untuk mencapai jawapan. Tambahan pula, pada bulan Disember, Google memperkenalkan Project Mariner, ciri AI ejen berasaskan Gemini yang direka untuk melaksanakan tugas seperti membeli-belah runcit dalam talian secara autonomi.

2. Anthropic

Aplikasi utama AI generatif setakat ini tertumpu pada penulisan teks, ringkasan dan penjanaan imej. Langkah evolusi seterusnya melibatkan melengkapkan model bahasa besar dengan kebolehan menaakul dan kapasiti untuk menggunakan alatan. Model ‘Computer Use’ Anthropic memberikan gambaran awal tentang masa depan ini.

Bermula dengan Claude 3.5 Sonnet pada tahun 2024, model Anthropic boleh melihat aktiviti pada skrin, termasuk kandungan internet. Ia boleh memanipulasi kursor, mengklik butang dan memasukkan teks. Video demonstrasi mempamerkan keupayaan Claude untuk melengkapkan borang menggunakan maklumat yang tersedia di tapak web yang dibuka dalam tab pelayar. Ia boleh mencapai tugas seperti membuat tapak web peribadi atau mengatur logistik perjalanan sehari. Tindakan autonomi AI, seperti membuka tab baharu, menjalankan carian dan mengisi medan data, benar-benar luar biasa.

Walaupun model itu kini beroperasi pada kadar yang lebih perlahan dan mungkin tidak selalunya menghasilkan jawapan yang betul, penambahbaikan pesat dijangka apabila Anthropic mengenal pasti dan menangani batasannya. Project Mariner Google yang disebutkan di atas mengikut jejak Anthropic pada bulan Disember, dan OpenAI memperkenalkan model penggunaan komputernya sendiri, Operator, pada Januari 2025. Pada Februari 2025, Anthropic melancarkan lelaran utama seterusnya, Claude 3.7 Sonnet, model yang lebih besar yang mampu melibatkan mod penaakulan secara automatik untuk pertanyaan yang mencabar.

2. Microsoft

Pembangunan model Phi Microsoft berpunca daripada soalan asas yang dikemukakan oleh penyelidik syarikat itu pada tahun 2023: ‘Apakah saiz model terkecil yang boleh mempamerkan tanda-tanda kecerdasan baru muncul?’ Pertanyaan ini menandakan detik penting dalam evolusi ‘model bahasa kecil,’ model yang direka untuk prestasi optimum dalam senario dengan memori, kuasa pemprosesan atau sambungan yang terhad, di mana masa tindak balas yang pantas adalah penting.

Sepanjang tahun 2024, Microsoft mengeluarkan dua generasi model kecil yang mempamerkan keupayaan penaakulan dan logik yang tidak digabungkan secara eksplisit semasa latihan. Pada bulan April, syarikat itu melancarkan satu siri model Phi-3 yang cemerlang dalam bahasa, penaakulan, pengekodan dan penanda aras matematik, mungkin disebabkan oleh latihan mereka pada data sintetik yang dijana oleh LLM yang jauh lebih besar dan lebih berkemampuan. Varian Phi-3 sumber terbuka telah dimuat turun lebih 4.5 juta kali di Hugging Face pada tahun 2024.

Pada akhir tahun 2024, Microsoft melancarkan model bahasa kecil Phi-4nya, yang mengatasi model Phi-3 dalam tugas berfokuskan penaakulan dan malah mengatasi GPT-4o OpenAI pada penanda aras GPQA (soalan saintifik) dan MATH. Microsoft mengeluarkan model itu di bawah lesen sumber terbuka dan pemberat terbuka, memperkasakan pembangun untuk mencipta model tepi atau aplikasi untuk telefon atau komputer riba. Dalam masa kurang daripada sebulan, Phi-4 memperoleh 375,000 muat turun di Hugging Face.

##2. Amazon

Amazon AWS baru-baru ini memperkenalkan Trainium2, versi baharu pemproses Trainiumnya untuk AI, yang berpotensi mencabar penguasaan GPU Nvidia dalam tetapan tertentu. Trainium2 direka bentuk untuk menyampaikan kuasa pengkomputeran besar yang diperlukan untuk melatih model AI generatif terbesar dan untuk operasi masa inferens selepas penggunaan model. AWS mendakwa bahawa Trainium adalah 30% hingga 40% lebih kos efektif daripada GPU untuk tugas yang setanding.

Trainium2 menangani kekurangan kuasa dan penyepaduan perisian yang diperhatikan dalam cip Trainium pertama, meletakkan Amazon untuk berpotensi merapatkan jurang dengan Nvidia. (Perlu diingat bahawa AWS sendiri kekal sangat bergantung pada Nvidia untuk GPU.) Menggantikan Nvidia adalah cabaran yang hebat kerana pelanggan terkunci dengan lapisan perisian CUDA Nvidia, yang menyediakan penyelidik dengan kawalan terperinci tentang cara model mereka menggunakan sumber cip. Amazon menawarkan lapisan perisian kawalan kernelnya sendiri, Neuron Kernel Interface (NKI), yang, serupa dengan CUDA, memberikan penyelidik kawalan terperinci ke atas interaksi kernel cip.

Adalah penting untuk ambil perhatian bahawa Trainium2 masih belum diuji pada skala. AWS sedang membina kelompok pelayan dengan 400,000 cip Trainium2 untuk Anthropic, yang boleh memberikan pandangan berharga tentang mengoptimumkan prestasi cip AInya dalam penggunaan berskala besar.

2. Arm

Pereka semikonduktor British, Arm, telah lama menjadi penyedia utama seni bina yang digunakan dalam cip yang menjanakan peranti kecil seperti telefon, sensor dan perkakasan IoT. Peranan ini menjadi lebih penting dalam era baru muncul di mana cip peranti tepi akan melaksanakan model AI. Pusat data juga akan memainkan peranan penting dalam evolusi ini, selalunya mengendalikan sebahagian atau semua pemprosesan AI yang paling mencabar dan menyampaikan hasil kepada peranti tepi.

Apabila pusat data berkembang pesat di seluruh dunia, penggunaan kuasa elektrik mereka akan menjadi kebimbangan yang semakin mendesak. Faktor ini menyumbang kepada penekanan pada kecekapan dalam seni bina CPU Neoverse terbaharu Arm. Ia mempunyai peningkatan prestasi 50% berbanding generasi sebelumnya dan prestasi 20% lebih baik setiap watt berbanding pemproses yang menggunakan seni bina x86 yang bersaing, menurut syarikat itu.

Arm melaporkan bahawa Amazon, Microsoft, Google dan Oracle semuanya telah menggunakan Arm Neoverse untuk kedua-dua pengkomputeran tujuan am dan inferens dan latihan AI berasaskan CPU. Sebagai contoh, pada tahun 2024, Microsoft mengumumkan bahawa silikon tersuai pertamanya yang direka untuk awan, pemproses Cobalt 100, dibina pada Arm Neoverse. Beberapa pusat data AI terbesar akan bergantung pada Grace Hopper Superchip NVIDIA, yang menggabungkan GPU Hopper dan CPU Grace berdasarkan Neoverse. Arm dijadualkan melancarkan CPUnya sendiri tahun ini, dengan Meta sebagai salah satu pelanggan awalnya.

2. Gretel

Sepanjang tahun lalu, syarikat AI telah mengalami pulangan yang semakin berkurangan daripada melatih model mereka dengan jumlah data yang semakin meningkat yang dikikis daripada web. Akibatnya, mereka telah mengalihkan tumpuan mereka daripada kuantiti data latihan semata-mata kepada kualitinya. Ini telah membawa kepada peningkatan pelaburan dalam kandungan bukan awam dan khusus yang dilesenkan daripada rakan kongsi penerbit. Penyelidik AI juga perlu menangani jurang atau titik buta dalam data latihan yang dijana oleh manusia atau beranotasi manusia. Untuk tujuan ini, mereka semakin beralih kepada data latihan sintetik yang dijana oleh model AI khusus.

Gretel mendapat perhatian pada tahun 2024 dengan mengkhusus dalam penciptaan dan penyusunan data latihan sintetik. Syarikat itu mengumumkan ketersediaan umum produk utamanya, Gretel Navigator, yang membolehkan pembangun menggunakan bahasa semula jadi atau gesaan SQL untuk menjana, menambah, mengedit dan menyusun set data latihan sintetik untuk penalaan halus dan ujian. Platform itu telah pun menarik komuniti lebih 150,000 pembangun yang telah mensintesis lebih 350 bilion keping data latihan.

Pemain industri lain telah menyedari keupayaan Gretel. Gretel bekerjasama dengan Google untuk menjadikan data latihan sintetiknya mudah diakses oleh pelanggan Google Cloud. Perkongsian serupa dengan Databricks diumumkan pada bulan Jun, memberikan pelanggan perusahaan Databricks akses kepada data latihan sintetik untuk model mereka yang berjalan dalam awan Databricks.

2. Mistral AI

Mistral AI, pesaing Perancis dalam arena AI generatif, telah secara konsisten memberikan tekanan kepada OpenAI, Anthropic dan Google di barisan hadapan pembangunan model AI sempadan. Mistral AI mengeluarkan satu siri model baharu yang menggabungkan kemajuan teknologi yang ketara pada tahun 2024, menunjukkan pertumbuhan perniagaan yang pesat melalui kedua-dua pemasaran langsung API dan perkongsian strategik.

Terdahulu pada tahun itu, syarikat itu memperkenalkan sepasang model sumber terbuka yang dipanggil Mixtral, yang terkenal dengan penggunaan inovatif seni bina ‘campuran pakar’, di mana hanya subset khusus parameter model terlibat untuk mengendalikan pertanyaan, meningkatkan kecekapan. Pada Julai 2024, Mistral mengumumkan Mistral Large 2, yang, pada 123 bilion parameter, mempamerkan peningkatan ketara dalam penjanaan kod, matematik, penaakulan dan panggilan fungsi. Syarikat Perancis itu juga mengeluarkan Ministral 3B dan Ministral 8B, model yang lebih kecil yang direka untuk pelaksanaan pada komputer riba atau telefon, yang mampu menyimpan kira-kira 50 halaman teks maklumat kontekstual yang disediakan oleh pengguna.

Mistral telah mencapai kejayaan di Eropah dengan meletakkan dirinya sebagai alternatif kos rendah dan fleksibel kepada syarikat AI A.S. seperti OpenAI. Ia juga meneruskan pengembangannya ke pasaran perusahaan A.S. pada tahun 2024. Pada bulan Jun, syarikat itu memperoleh pusingan pembiayaan $640 juta, yang diketuai oleh firma modal teroka General Catalyst, meningkatkan nilai Mistral kepada kira-kira $6.2 bilion.

2. Fireworks AI

Fireworks menawarkan persekitaran masa jalan tersuai yang menyelaraskan kerja kejuruteraan yang sering kompleks yang berkaitan dengan membina infrastruktur untuk penggunaan AI. Menggunakan platform Fireworks, perusahaan boleh menyepadukan mana-mana daripada lebih 100 model AI dan kemudian menyesuaikan dan memperhalusinya untuk kes penggunaan khusus mereka.

Syarikat itu memperkenalkan produk baharu pada tahun 2024 yang akan meletakkannya untuk memanfaatkan trend utama dalam industri AI. Pertama, pembangun telah menjadi semakin fokus pada responsif model dan aplikasi berkuasa AI. Fireworks memperkenalkan FireAttention V2, perisian pengoptimuman dan kuantisasi yang mempercepatkan prestasi model dan mengurangkan kependaman rangkaian. Kedua, sistem AI semakin berkembang menjadi ‘talian paip’ yang menggunakan pelbagai model dan alatan melalui API. Perisian FireFunction V2 baharu bertindak sebagai pengatur untuk semua komponen dalam sistem yang semakin kompleks ini, terutamanya apabila perusahaan menggunakan lebih banyak aplikasi AI autonomi.

Fireworks melaporkan peningkatan 600% dalam pertumbuhan hasil pada tahun 2024. Pangkalan pelanggannya termasuk syarikat terkemuka seperti Verizon, DoorDash, Uber, Quora dan Upwork.

2. Snorkel AI

Perusahaan telah menyedari bahawa keberkesanan sistem AI mereka dikaitkan secara langsung dengan kualiti data mereka. Snorkel AI telah membina perniagaan yang berkembang maju dengan membantu perusahaan menyediakan data proprietari mereka untuk digunakan dalam model AI. Platform pembangunan data AI Snorkel Flow syarikat menyediakan kaedah yang menjimatkan kos untuk syarikat melabel dan menyusun data proprietari mereka, membolehkan penggunaannya dalam menyesuaikan dan menilai model AI untuk keperluan perniagaan khusus mereka.

Pada tahun 2024, Snorkel mengembangkan sokongannya untuk memasukkan imej, membolehkan syarikat melatih model AI multimodal dan penjana imej menggunakan imej proprietari mereka sendiri. Ia juga menggabungkan penjanaan tambahan perolehan (RAG) ke dalam platformnya, membolehkan pelanggan mendapatkan semula hanya segmen maklumat yang paling relevan daripada dokumen yang panjang, seperti kandungan pangkalan pengetahuan proprietari, untuk digunakan dalam latihan AI. Snorkel Custom, tahap perkhidmatan sentuhan yang lebih tinggi, melibatkan pakar pembelajaran mesin Snorkel bekerjasama secara langsung dengan pelanggan dalam projek.

Snorkel menyatakan bahawa tempahan tahunan tahun ke tahunnya meningkat dua kali ganda pada tahun 2024, dengan pertumbuhan tiga digit dalam tempahan tahunan untuk setiap tiga tahun yang lalu. Enam daripada bank terbesar kini menggunakan Snorkel Flow, menurut syarikat itu, bersama-sama dengan jenama seperti Chubb, Wayfair dan Experian.

2. CalypsoAI

Memandangkan AI memainkan peranan yang semakin penting dalam proses membuat keputusan yang kritikal, perusahaan sedang mencari keterlihatan yang dipertingkatkan ke dalam kerja dalaman model. Keperluan ini amat ketara dalam industri terkawal yang mesti sentiasa memantau berat sebelah dan output yang tidak diingini yang lain. CalypsoAI adalah antara yang pertama mengiktiraf keperluan yang baru muncul ini dan segera bertindak balas dengan ciri kebolehjelasan yang dipertingkatkan dalam platform infrastruktur AInya.

Apa yang membezakan Calypso ialah keluasan teknologi kebolehperhatiannya. Pada tahun 2024, syarikat itu melancarkan Platform Keselamatan AInya, yang melindungi data perusahaan dengan menjamin, mengaudit dan memantau semua model AI generatif aktif yang mungkin digunakan oleh syarikat, tanpa mengira vendor model atau sama ada model itu dihoskan secara dalaman atau luaran. Calypso juga memperkenalkan alat visualisasi baharu yang membolehkan pengguna memerhati logik yang mendasari keputusan AI dalam masa nyata.

Pasaran bertindak balas secara positif terhadap penekanan Calypso pada kebolehperhatian AI. Syarikat itu melaporkan peningkatan sepuluh kali ganda dalam hasil pada tahun 2024 dan menjangkakan peningkatan lima kali ganda lagi pada tahun 2025.

2. Galileo

Walaupun sistem AI mempamerkan lebih sedikit kejadian halusinasi fakta dan berat sebelah berbanding setahun yang lalu, ia tetap terdedah kepada isu ini. Ini menimbulkan kebimbangan yang ketara bagi mana-mana perniagaan yang menggunakan AI, terutamanya mereka yang berada dalam sektor terkawal seperti penjagaan kesihatan dan perbankan. Pasukan pembangunan AI menggunakan platform AI Galileo untuk mengukur, mengoptimumkan dan memantau ketepatan model dan aplikasi mereka.

Pada awal tahun 2024, berikutan dua tahun penyelidikan, Galileo mengeluarkan Luna, satu set model penilaian yang dilatih untuk mengenal pasti output yang berbahaya. Model ini membolehkan platform Galileo meneliti dan menjaringkan kerja LLM dengan pantas semasa ia memasang token yang membentuk responsnya. Proses ini mengambil masa kira-kira 200 milisaat, membolehkan masa yang mencukupi untuk membenderakan dan menghalang output AI daripada dipaparkan kepada pengguna. Walaupun LLM standard boleh melaksanakan tugas ini, ia akan menjadi lebih mahal. Model binaan khas Galileo menawarkan ketepatan, kecekapan kos dan, yang penting, kelajuan yang unggul.

Galileo melaporkan peningkatan empat kali ganda dalam pangkalan pelanggannya pada tahun 2024, dengan pelanggan termasuk Twilio, Reddit, Chegg, Comcast dan JPMorgan Chase. Syarikat permulaan itu juga memperoleh pusingan pembiayaan $68 juta daripada pelabur seperti CEO Hugging Face, Clément Delangue.

2. Runway

Salah satu aspirasi—dan kebimbangan—yang paling ketara di sekitar AI ialah potensinya untuk menjana video yang berkualiti tinggi untuk merevolusikan seni dan ekonomi pembikinan filem. Teknologi itu membuat kemajuan yang ketara ke arah masa depan ini pada tahun 2024, dengan Runway, sebuah syarikat permulaan penjanaan video yang berpangkalan di New York, memainkan peranan utama. Keluaran model Gen-3 Alpha Runway pada Jun 2024 mendapat pujian meluas dalam komuniti AI kerana kebolehpercayaan video yang dijana yang dipertingkatkan dengan ketara.

Runway juga melaksanakan peningkatan besar pada alatannya untuk mengawal estetika video AI. Model itu dilatih pada kedua-dua imej dan video dan boleh menjana video berdasarkan input teks atau imej. Syarikat itu kemudiannya mengeluarkan Gen-3 Alpha Turbo, versi Gen-3 yang lebih kos efektif dan lebih pantas.

Hollywood telah memantau dengan teliti kemajuan AI generatif, dan Runway melaporkan bahawa ia telah mula menghasilkan versi tersuai modelnya untuk pemain industri hiburan. Ia memeterai perkongsian rasmi dengan Lionsgate Studios pada September 2024. Runway membangunkan model tersuai untuk syarikat produksi dan melatihnya pada katalog filem Lionsgate. Runway menyatakan bahawa model itu bertujuan untuk membantu pembikin filem, pengarah dan kreatif Lionsgate yang lain dalam ‘menambah’ kerja mereka sambil ‘menjimatkan masa, wang dan sumber.’ Runway percaya pengaturannya dengan Lionsgate boleh berfungsi sebagai pelan tindakan untuk kerjasama serupa dengan syarikat produksi lain.

2. Cerebras Systems

Sistem AI, terutamanya model sempadan yang besar, memerlukan kuasa pengkomputeran yang besar untuk beroperasi pada skala. Ini memerlukan sambungan antara beribu-ribu atau berjuta-juta cip untuk mengagihkan beban kerja. Walau bagaimanapun, sambungan rangkaian antara cip boleh memperkenalkan kesesakan prestasi. Teknologi Cerebras Systems direka untuk memanfaatkan kelebihan kelajuan dan kecekapan menyepadukan sejumlah besar kuasa pengkomputeran ke dalam satu cip yang sangat besar.

Cip WSE-3 (Wafer Scale Engine generasi ketiga) terbaharu syarikat itu, contohnya, berukuran 814 milimeter persegi, saiz pinggan makan malam, dan 56 kali lebih besar daripada cip H100 peneraju pasaran Nvidia. Cip itu menggabungkan 4 trilion transistor yang mengejutkan dan menawarkan 44 gigabit memori. Cip ini boleh dikelompokkan untuk membentuk superkomputer, seperti Condor Galaxy, ‘buruj’ superkomputer yang saling bersambung yang dibangunkan oleh Cerebras dengan kerjasama pelanggan terbesarnya, G42, sebuah syarikat AI dan pengkomputeran awan yang berpangkalan di UAE.

Sehingga kini, Cerebras telah menemui niche dalam organisasi penyelidikan besar, termasuk Mayo Clinic, Sandia National Laboratories, Lawrence Livermore National Laboratory dan Los Alamos National Laboratory. Syarikat itu memfailkan IPO pada September 2024. Prospektus menunjukkan bahawa jualan syarikat meningkat lebih tiga kali ganda kepada $78.7 juta pada tahun 2023 dan melonjak kepada $136.4 juta pada separuh pertama tahun 2024.