NeuReality, perintis dalam membentuk semula seni bina inferens AI untuk memenuhi permintaan model dan beban kerja AI masa kini, mengumumkan bahawa peranti inferens NR1 mereka kini diprapasang dengan model AI perusahaan popular, termasuk Llama, Mistral, Qwen, Granite, dan menyokong awan AI generatif persendirian dan kelompok tempatan. Peranti sedia AI generatif dan ejen ini dihidupkan dan berfungsi dalam masa kurang daripada 30 minit, memberikan 3x kelajuan untuk merealisasikan nilai, membolehkan pelanggan berinovasi dengan lebih pantas. Bukti Konsep (PoC) semasa menunjukkan sehingga 6.5x peningkatan dalam output token dalam jejak kos dan kuasa yang sama berbanding pelayan inferens berasaskan CPU x86, membolehkan perniagaan dan kerajaan dari semua saiz mengakses dan menggunakan AI dengan lebih berpatutan.
Di dalam peranti, cip NR1® ialah AI-CPU tulen pertama yang dibina untuk orkestrasi inferens – pengurusan data, tugas dan integrasi – dengan perisian, perkhidmatan dan API terbina dalam. Ia bukan sahaja menyatukan seni bina CPU dan NIC tradisional menjadi satu, tetapi ia juga membungkus 6x kuasa pemprosesan ke dalam cip untuk bersaing dengan kemajuan GPU yang pesat sambil menghapuskan kelemahan CPU tradisional.
Cip NR1 berpasangan dengan mana-mana GPU atau pemecut AI dalam peranti yang menyediakan penjimatan kos, tenaga dan hartanah yang terobosan yang penting untuk penggunaan AI perusahaan yang meluas. Sebagai contoh, membandingkan model Llama 3.3-70B yang sama dan persediaan GPU atau pemecut AI yang sama, peranti berkuasa AI-CPU NeuReality mencapai jumlah kos yang lebih rendah setiap juta token AI berbanding pelayan berasaskan CPU x86.
Moshe Tanach, pengasas bersama dan Ketua Pegawai Eksekutif NeuReality berkata, "Tiada siapa yang mempertikaikan potensi besar AI. Cabarannya ialah bagaimana untuk menjadikan penggunaan inferens AI berdaya maju dari segi ekonomi. Teknologi AI-CPU yang mengganggu NeuReality menghapuskan kelemahan, membolehkan kami memberikan prestasi tambahan yang diperlukan untuk membuka kunci kuasa penuh GPU sambil menyelaraskan pertanyaan dan token AI, memaksimumkan prestasi dan pulangan pelaburan sistem AI mahal ini."
Tanach meneruskan, "Kini, kami membawa kemudahan penggunaan ke peringkat baharu dengan peranti inferens AI silikon-ke-perisian bersepadu. Ia diprapasang dengan model AI dan semua alat yang tersedia untuk membantu pembangun perisian AI menggunakan AI lebih pantas, lebih mudah dan lebih murah daripada sebelumnya, membolehkan mereka mengalihkan sumber kepada penggunaan AI dalam perniagaan mereka dan bukannya integrasi dan pengoptimuman infrastruktur."
Kajian baru-baru ini mendapati bahawa kira-kira 70% perusahaan melaporkan menggunakan AI generatif dalam sekurang-kurangnya satu fungsi perniagaan, yang menunjukkan peningkatan dalam permintaan. Walau bagaimanapun, hanya 25% perusahaan mempunyai proses yang didayakan sepenuhnya oleh AI, dan dengan penggunaan meluas, hanya satu pertiga telah mula melaksanakan kes penggunaan AI terhad.
Hari ini, kelemahan prestasi CPU pada pelayan yang menguruskan beban kerja multimodal dan model bahasa besar merupakan punca utama penggunaan GPU yang rendah di sekitar 30-40%. Ini mengakibatkan pembaziran silikon yang mahal dalam penggunaan AI, dan pasaran yang kurang mendapat perkhidmatan yang masih menghadapi halangan kerumitan dan kos.
Rashid Attar, Naib Presiden Kanan Kejuruteraan, Qualcomm Technologies, Inc. berkata, "Perusahaan dan penyedia perkhidmatan menggunakan aplikasi dan ejen AI pada kadar yang rekod, dan memberi tumpuan untuk memberikan prestasi secara ekonomi. Dengan menyepadukan Pemecut Qualcomm Cloud AI 100 Ultra dengan seni bina AI-CPU NeuReality, pengguna boleh mencapai tahap kecekapan kos dan prestasi AI baharu tanpa menjejaskan kemudahan penggunaan dan penskalaan.”
Peranti NR1 NeuReality telah digunakan dengan pelanggan perkhidmatan awan dan kewangan dan direka bentuk khusus untuk mempercepatkan penggunaan AI melalui kemampuannya, kebolehaksesan dan kecekapan ruang, sesuai untuk pilihan inferens sebagai perkhidmatan di premis dan awan. Sebagai tambahan kepada model AI generatif dan ejen yang diprapasang baharu serta keluaran baharu setiap suku tahun, ia juga dioptimumkan sepenuhnya dengan SDK dan API yang diprakonfigurasikan untuk penglihatan komputer, AI perbualan atau permintaan tersuai (cth., Perkhidmatan kewangan, sains hayat, kerajaan, pembekal awan) yang menyokong pelbagai kes penggunaan dan pasaran perniagaan.
Peranti NR1 pertama menyatukan modul NR1® (kad PCIe) dengan Pemecut Qualcomm® Cloud AI 100 Ultra.
NeuReality akan mempamerkan di InnoVEX (diadakan bersama dengan Computex) di Tapak Israel, Dewan 2 Gerai S0912 (berhampiran pentas tengah) di Taipei, Taiwan dari 20-23 Mei 2025. Syarikat itu akan mengadakan demonstrasi langsung peranti inferens NR1, termasuk memindahkan aplikasi sembang dalam beberapa minit serta demonstrasi prestasi cip NR1 yang menjalankan Model Kilang Lancar dan DeepSeek-R1-Distill-Llama-8B.
Ditubuhkan pada 2019, NeuReality ialah perintis seni bina inferens AI khusus yang dikuasakan oleh cip NR1® - AI-CPU pertama untuk orkestrasi inferens. Berdasarkan seni bina terbuka dan berasaskan piawaian, NR1 serasi sepenuhnya dengan mana-mana pemecut AI. Misi NeuReality ialah menjadikan AI boleh diakses dan di mana-mana dengan mengurangkan halangan yang dikaitkan dengan kos, kuasa dan kerumitan yang tinggi dan menggunakan teknologi gangguan mereka untuk meluaskan penggunaan inferens AI. Syarikat itu mempunyai 80 pekerja di kemudahan di Israel, Poland dan Amerika Syarikat.
1 Model AI yang diprapasang dan dioptimumkan untuk pelanggan perusahaan termasuk: Llama 3.3 70B, Llama 3.1 8B (siri Llama 4 akan datang); Mistral 7B, Mistral 8x7B dan Mistral Small; Qwen 2.5, termasuk Coder (Qwen 3 akan datang); DeepSeek R1**-**Distill-Llama 8B, R1 Distill-Llama 70b; dan Granite 3, 3.1 8B (Granite 3.3 akan datang).
Revolusi AI NeuReality: Gabungan Prestasi, Keberkesanan Kos dan Kemudahan
Oleh kerana Kecerdasan Buatan (AI) terus menembusi pelbagai industri, perusahaan menghadapi cabaran untuk menggunakan penyelesaian inferens AI secara ekonomi dan cekap. NeuReality mengganggu ekonomi AI melalui pendekatan inovatifnya yang memfokuskan pada penyediaan akses LLM (Model Bahasa Besar) segera di luar kotak sambil mengurangkan dengan ketara jumlah kos inferens AI. Produk perdana NeuReality, peranti Inferens NR1, menyediakan perusahaan dengan prestasi, keberkesanan kos dan kemudahan yang belum pernah terjadi sebelumnya dengan mengoptimumkan seni bina inferens AI serta prapemasangan model AI perusahaan popular.
Peranti Inferens NR1: Pengubah Permainan
Teras kepada peranti Inferens NR1 ialah AI-CPU yang dibina khusus NeuReality yang berfungsi sebagai hab kawalan terpusat untuk data, tugas dan integrasi. Tidak seperti seni bina CPU dan NIC tradisional, cip NR1 mengintegrasikan komponen ini ke dalam satu unit, mengurangkan kelemahan dan memaksimumkan kuasa pemprosesan. Pendekatan bersepadu ini membolehkan cip bersaing dengan kemajuan GPU yang pantas sambil mengoptimumkan pertanyaan dan token AI untuk prestasi dan pulangan pelaburan yang dipertingkatkan.
AI Di Luar Kotak: Memudahkan Penggunaan
Untuk meningkatkan lagi kemudahan penggunaan, peranti Inferens NR1 diprapasang dengan model AI perusahaan popular, termasuk Llama, Mistral, Qwen dan Granite. Ciri ini menghapuskan kerumitan konfigurasi dan pengoptimuman, membenarkan pembangun perisian AI memberi tumpuan kepada penggunaan AI dalam perniagaan mereka dan bukannya meluangkan masa untuk penyepaduan infrastruktur. Peranti ini boleh dihidupkan dan berfungsi dalam masa kurang daripada 30 minit, memberikan pelanggan kelajuan yang pantas untuk merealisasikan nilai.
AI Mampu Milik: Mempercepatkan Penggunaan
Teknologi NeuReality membolehkan perusahaan mengakses dan menggunakan AI dengan lebih ekonomi dengan memberikan jumlah kos yang lebih rendah setiap juta token AI berbanding pelayan berasaskan CPU x86. Keberkesanan kos ini penting untuk perniagaan dan kerajaan dari semua saiz kerana ia mengurangkan halangan kepada penggunaan AI dan membolehkan aplikasi yang lebih meluas.
Kerjasama dengan Qualcomm Technologies: Membuka Tahap Prestasi Baharu
Perkongsian strategik antara NeuReality dan Qualcomm Technologies meningkatkan lagi keupayaan peranti Inferens NR1. Dengan menyepadukan Pemecut Qualcomm Cloud AI 100 Ultra dengan seni bina AI-CPU NeuReality, pengguna boleh mencapai tahap kecekapan kos dan prestasi AI baharu tanpa menjejaskan kemudahan penggunaan dan penskalaan. Pendekatan kolaboratif ini mempamerkan dedikasi NeuReality untuk memanfaatkan teknologi termaju untuk mengoptimumkan penyelesaian inferens AI.
Menangani Cabaran AI Perusahaan: Meningkatkan Penggunaan GPU
NeuReality menangani cabaran ketara yang dihadapi oleh perusahaan: kelemahan prestasi CPU pada pelayan, yang mengurangkan penggunaan GPU. Dari segi sejarah, pelayan yang menguruskan beban kerja multimodal dan model bahasa besar mengalami penggunaan GPU yang rendah, purata sekitar 30-40%. Penggunaan rendah ini mengakibatkan pembaziran silikon yang mahal dalam penggunaan AI dan mengehadkan penggunaan AI dalam pasaran yang kurang mendapat perkhidmatan. Teknologi AI-CPU NeuReality menangani isu ini dengan menghapuskan kelemahan prestasi, membolehkan perusahaan memanfaatkan sepenuhnya keupayaan GPU mereka dalam aplikasi AI mereka.
Memenuhi Permintaan AI Generatif: Peningkatan Penggunaan
Penyelesaian NeuReality berada pada kedudukan yang baik untuk pasaran AI generatif yang berkembang pesat. Kajian baru-baru ini menunjukkan bahawa kira-kira 70% perusahaan melaporkan menggunakan AI generatif dalam sekurang-kurangnya satu fungsi perniagaan. Walau bagaimanapun, hanya 25% perusahaan mempunyai proses yang didayakan sepenuhnya oleh AI, dan dengan penggunaan meluas. Peranti Inferens NR1 NeuReality membolehkan perusahaan mempercepatkan inisiatif AI generatif mereka dengan menghapuskan halangan kepada penerimaan melalui peningkatan kemudahan penggunaan, keberkesanan kos dan prestasi.
Kemudahan Penggunaan: Mengurangkan Halangan Penggunaan
Selain daripada prestasi dan keberkesanan kos, kemudahan penggunaan ialah pemacu utama penyelesaian AI NeuReality. Peranti Inferens NR1 diprapasang dengan model AI dan SDK, yang memudahkan proses penggunaan dan mengurangkan keperluan untuk penyepaduan dan pengoptimuman infrastruktur. Kemudahan penggunaan ini membolehkan pembangun perisian AI memberi tumpuan untuk membina dan menggunakan aplikasi AI yang inovatif dan bukannya meluangkan masa untuk infrastruktur yang kompleks.
Aplikasi Luas: Pelbagai Industri
Peranti Inferens NR1 NeuReality direka untuk menyokong pelbagai kes penggunaan dan pasaran perniagaan. Peranti ini mengoptimumkan penglihatan komputer, AI perbualan dan permintaan tersuai melalui SDK dan API yang diprakonfigurasikan. Fleksibiliti ini menjadikan peranti Inferens NR1 sesuai untuk pelbagai industri, termasuk perkhidmatan kewangan, sains hayat, kerajaan dan penyedia perkhidmatan awan.
Mempercepatkan Penerimaan AI: Keberpatutan, Kebolehcapaian dan Kecekapan Ruang
Peranti NR1 NeuReality memajukan penggunaan AI dengan memberikan kedua-dua kemampuan dan kebolehcapaian, yang menjadikannya patut digabungkan dengan infrastruktur di premis dan awan. Banyak organisasi bersusah payah untuk mengembangkan inisiatif AI mereka kerana kos dan kerumitan yang menghalang, tetapi penyelesaian NeuReality menghilangkan halangan ini dengan menawarkan platform standard terbuka yang kos efektif yang menyelaraskan pembangunan dan penggunaan AI.
Serlahan Demonstrasi
NeuReality akan mempersembahkan enjin inferens NR1 mereka di InnoVEX, yang akan diadakan bersamaan dengan Computex di Taipei, Taiwan dari 20-23 Mei 2025, mempamerkan keupayaannya. Semasa majlis itu, syarikat itu akan menunjukkan cara memindahkan aplikasi sembang dengan mudah dalam beberapa minit dan mempamerkan prestasi cip NR1 dalam Model Kilang Lancar dan DeepSeek-R1-Distill-Llama-8B.
Inovasi Berterusan: Bersedia untuk Masa Hadapan
NeuReality komited untuk meningkatkan keupayaan peranti Inferens NR1 mereka dengan keluaran tetap model AI generatif dan ejen baharu serta SDK yang dioptimumkan. Inovasi berterusan ini membolehkan perusahaan kekal dikemas kini dengan teknologi AI terkini dan memastikan infrastruktur AI mereka dioptimumkan untuk beban kerja masa hadapan.
NeuReality: Memperkasakan Perusahaan untuk Menguasai Potensi AI
Teknologi AI-CPU gangguan NeuReality menyampaikan mod yang kos efektif untuk menggunakan penggunaan AI inferens dengan memaksimumkan prestasi GPU sambil mengoptimumkan pertanyaan dan token AI untuk prestasi dan pulangan pelaburan yang maksimum. Apabila NeuReality terus berinovasi dan mengembangkan keupayaan peranti Inferens NR1, ia akan menjadi sekutu yang penting untuk perusahaan yang berkembang dalam dunia AI yang berkembang pesat.
Dengan menggabungkan tumpuan pada prestasi, keberkesanan kos dan kemudahan penggunaan dengan komitmen terhadap inovasi berterusan, NeuReality berada pada kedudukan untuk membentuk semula ekonomi AI dan membolehkan perusahaan dari semua saiz untuk menguasai potensi AI.