NeuReality: AI 경제학 재구성 | ko

기업 및 서비스 제공업체는 기록적인 속도로 AI 애플리케이션과 에이전트를 배포하고 있으며, 경제적인 방식으로 성능을 제공하는 데 주력하고 있습니다.

NeuReality는 오늘날의 AI 모델 및 워크로드 요구 사항을 충족하기 위해 AI 추론 아키텍처를 재구상하는 선구자이며, NR1 추론 어플라이언스가 Llama, Mistral, Qwen, Granite 1을 포함한 인기 있는 엔터프라이즈 AI 모델과 함께 사전 로드되어 프라이빗 생성 AI 클라우드 및 온프레미스 클러스터를 지원한다고 발표했습니다. 30분 이내에 시작 및 실행되는 이 생성 및 에이전트 AI 지원 어플라이언스는 3배 더 빠른 가치 실현을 제공하여 고객이 더 빠르게 혁신할 수 있도록 지원합니다. 현재 PoC(개념 증명)는 동일한 비용 및 전력 범위 내에서 x86 CPU 기반 추론 서버에 비해 최대 6.5배의 토큰 처리량을 보여 주어 모든 규모의 기업 및 정부가 AI에 더 저렴하게 액세스하고 사용할 수 있도록 지원합니다.

어플라이언스 내부에서 NR1® 칩은 데이터, 작업 및 통합의 관리인 추론 오케스트레이션을 위해 구축된 최초의 진정한 AI-CPU이며 내장된 소프트웨어, 서비스 및 API를 갖추고 있습니다. 기존 CPU 및 NIC 아키텍처를 단일 패키지로 통합할 뿐만 아니라 칩에 6배의 처리 능력을 캡슐화하여 GPU의 빠른 발전에 발맞추면서 기존 CPU 병목 현상을 제거합니다.

NR1 칩은 어플라이언스 내의 모든 GPU 또는 AI 액셀러레이터와 쌍을 이루어 광범위한 엔터프라이즈 AI 채택에 필수적인 획기적인 비용, 에너지 및 공간 효율성을 제공합니다. 예를 들어 동일한 Llama 3.3-70B 모델과 동일한 GPU 또는 AI 액셀러레이터 설정을 비교해 보면 NeuReality의 AI-CPU 구동 어플라이언스는 x86 CPU 기반 서버보다 백만 AI 토큰당 총 비용이 저렴합니다.

NeuReality의 공동 창립자이자 CEO인 Moshe Tanach는 “AI의 엄청난 잠재력에 대해 의문을 제기하는 사람은 없을 것입니다. 문제는 AI 추론 배포를 경제적으로 실행 가능하게 만드는 방법입니다. NeuReality의 파괴적인 AI-CPU 기술은 병목 현상을 제거하여 GPU의 모든 잠재력을 발휘하는 데 필요한 추가 성능을 제공하는 동시에 AI 쿼리 및 토큰을 오케스트레이션하여 이러한 고가의 AI 시스템의 성능과 ROI를 극대화할 수 있습니다.”라고 말했습니다.

Tanach는 계속해서 “이제 통합된 실리콘-소프트웨어 AI 추론 어플라이언스를 통해 사용 편의성을 새로운 차원으로 끌어올렸습니다. AI 모델과 모든 툴이 사전 로드되어 AI 소프트웨어 개발자가 이전보다 더 빠르고 쉽고 저렴하게 AI를 배포할 수 있으므로 인프라 통합 및 최적화가 아니라 비즈니스에서 AI를 적용하는 데 리소스를 집중할 수 있습니다.”라고 말했습니다.

최근 연구에 따르면 기업의 약 70%가 하나 이상의 비즈니스 기능에서 생성 AI를 사용하고 있다고 보고하여 수요 증가를 나타냅니다. 그러나 AI로 완전히 활성화된 프로세스를 보유하고 광범위한 채택을 달성한 기업은 25%에 불과하고 제한적인 AI 사용 사례를 구현하기 시작한 기업은 1/3에 불과합니다.

오늘날 서버에서 멀티모달 및 대형 언어 모델 워크로드를 관리하는 CPU 성능 병목 현상은 GPU 평균 활용도가 30-40%로 낮아지는 주요 요인입니다. 이로 인해 AI 배포에서 값비싼 실리콘 낭비가 발생하고 여전히 복잡성과 비용 장벽에 직면한 서비스가 부족한 시장이 발생합니다.

퀄컴 테크날러지 Inc.의 엔지니어링 수석 부사장인 Rashid Attar는 “기업 및 서비스 제공업체는 기록적인 속도로 AI 애플리케이션과 에이전트를 배포하고 있으며 경제적인 방식으로 성능을 제공하는 데 주력하고 있습니다. 퀄컴 Cloud AI 100 Ultra 액셀러레이터를 NeuReality의 AI-CPU 아키텍처와 통합함으로써 사용자는 배포 및 확장의 용이성을 저해하지 않으면서 새로운 수준의 비용 효율성과 AI 성능을 달성할 수 있습니다.”라고 말했습니다.

NeuReality의 NR1 어플라이언스는 클라우드 및 금융 서비스 고객과 함께 배포되었으며 경제성, 접근성 및 공간 효율성을 통해 AI 채택을 가속화하도록 특별히 설계되어 온프레미스 및 클라우드 추론-서비스 옵션에 적합합니다. 새로운 사전 로드된 생성 및 에이전트 AI 모델과 분기별 새 릴리스 외에도 컴퓨터 비전, 대화형 AI 또는 금융 서비스, 생명 과학, 정부, 클라우드 서비스 제공업체와 같은 다양한 비즈니스 사용 사례 및 시장을 지원하는 사용자 지정 요청에 대한 사전 구성된 SDK 및 API를 완전히 최적화했습니다.

최초의 NR1 어플라이언스는 NR1® 모듈(PCIe 카드)을 퀄컴® Cloud AI 100 Ultra 액셀러레이터와 통합합니다.

NeuReality는 2025년 5월 20일부터 23일까지 타이베이, 대만에서 개최되는 InnoVEX(컴퓨텍스와 공동 개최)의 이스라엘 관, 홀 2, 부스 S0912(중앙 무대 근처)에서 전시합니다. 이 회사는 몇 분 안에 채팅 애플리케이션을 마이그레이션하는 것을 포함하여 NR1 추론 어플라이언스 데모와 NR1 칩이 Smooth Factory Models 및 DeepSeek-R1-Distill-Llama-8B를 실행하는 성능 데모를 개최할 예정입니다.

2019년에 설립된 NeuReality는 추론 오케스트레이션을 위한 최초의 AI-CPU인 NR1® 칩으로 구동되는 전용 AI 추론 아키텍처의 선구자입니다. 개방형 표준 기반 아키텍처를 기반으로 하는 NR1은 모든 AI 액셀러레이터와 완벽하게 호환됩니다. NeuReality의 사명은 높은 비용, 전력 소비 및 복잡성과 관련된 장벽을 줄이고 파괴적인 기술을 활용하여 AI 추론 채택을 확장하여 AI를 액세스 가능하고 보편적으로 만드는 것입니다. 이 회사는 이스라엘, 폴란드 및 미국에 80명의 직원을 두고 있습니다.

엔터프라이즈 고객을 위해 사전 로드되고 최적화된 1개의 AI 모델에는 Llama 3.3 70B, Llama 3.1 8B(Llama 4 시리즈 출시 예정), Mistral 7B, Mistral 8x7B 및 Mistral Small, Coder를 포함한 Qwen 2.5(Qwen 3 출시 예정), DeepSeek R1**-**Distill-Llama 8B, R1 Distill-Llama 70b 및 Granite 3, 3.1 8B(Granite 3.3 출시 예정)가 포함됩니다.

NeuReality의 AI 혁명: 성능, 비용 효율성 및 사용 편의성의 융합

인공지능(AI)이 다양한 산업에 스며들면서 기업은 경제적으로 실행 가능하고 효율적인 방식으로 AI 추론 솔루션을 배포하는 데 어려움을 겪고 있습니다. NeuReality는 AI 추론의 총 비용을 크게 절감하면서 즉시 사용 가능한 즉시 LLM (대형 언어 모델) 액세스를 제공하는 데 중점을 둔 혁신적인 접근 방식으로 AI 경제를 혁신합니다. NeuReality의 주력 제품인 NR1 추론 장치는 AI 추론 아키텍처를 최적화하고 인기있는 엔터프라이즈 AI 모델을 사전 로드하여 기업에 전례없는 성능, 비용 효율성 및 사용 편의성을 제공합니다.

NR1 추론 장치: 게임 체인저

NR1 추론 장치의 핵심은 NeuReality가 특별히 구축한 AI-CPU이며, 데이터, 작업 및 통합의 중앙 제어 센터 역할을합니다. 기존 CPU 및 NIC 아키텍처와 달리 NR1 칩은 이러한 구성 요소를 단일 단위로 통합하여 병목 현상을 줄이고 처리 능력을 극대화합니다. 이 통합 방법을 통해 칩은 GPU의 빠른 발전에 발맞추면서 AI 쿼리 및 토큰을 최적화하여 성능과 투자 수익률을 높일 수 있습니다.

즉시 사용 가능한 AI : 배포 간소화

사용 편의성을 더욱 높이기 위해 NR1 추론 장치에는 Llama, Mistral, Qwen 및 Granite를 포함한 인기있는 엔터프라이즈 AI 모델이 사전 로드되어 있습니다. 이 기능을 통해 구성 및 최적화의 복잡성이 제거되어 AI 소프트웨어 개발자가 인프라 통합에 시간을 소비하는 대신 비즈니스에서 AI를 적용하는 데 집중할 수 있습니다. 이 장치는 30 분 이내에 시작 및 실행될 수 있으므로 고객에게 빠른 가치 실현을 제공합니다.

경제적인 AI : 가속화 된 채택

NeuReality의 기술은 x86 CPU 기반 서버보다 백만 AI 토큰당 총 비용을 제공하여 기업이 AI에 더 경제적으로 액세스하고 사용할 수 있도록합니다. 이러한 비용 효율성은 다양한 규모의 기업과 정부에게 매우 중요합니다. AI 배포의 장벽을 낮추고 광범위한 응용 프로그램을 가능하게하기 때문입니다.

퀄컴 기술과의 협력 : 새로운 성능 수준 잠금 해제

NeuReality와 퀄컴 기술 간의 전략적 파트너십을 통해 NR1 추론 장치의 기능이 더욱 강화되었습니다. NR1은 퀄컴 Cloud AI 100 Ultra 가속기를 통합하여 비용 효율성과 새로운 AI 성능 수준을 달성할 수 있습니다. 이러한 협력적 접근 방식은 AI 추론 솔루션을 최적화하기 위한 최첨단 기술 활용에 대한 NeuReality의 의지를 보여줍니다.

기업 AI 도전 과제 해결 : GPU 활용률 향상

NeuReality는 GPU 활용률을 떨어뜨리는 CPU 성능 병목 현상과 같은 기업이 직면한 중요한 도전 과제를 해결하고 있습니다. 전통적으로 멀티모달 및 대형 언어 모델 워크로드를 관리하는 서버의 GPU 평균 활용률은 30-40%에 불과했습니다. 이러한 낮은 활용률로 인해 AI 배포에서 값비싼 실리콘 낭비가 발생하고 서비스가 부족한 시장에서 AI 채택이 제한됩니다. NeuReality의 AI-CPU 기술은 성능 병목 현상을 제거하여 이 문제를 해결하므로 기업은 AI 애플리케이션에서 GPU 기능을 최대한 활용할 수 있습니다.

생성 AI의 증가하는 수요 충족 : 증가된 사용률

NeuReality의 솔루션은 빠르게 성장하는 생성 AI 시장에서 유망합니다. 최근 연구에 따르면 약 70%의 기업이 하나 이상의 비즈니스 기능에서 생성 AI를 사용하고 있다고 보고했습니다. 그러나 AI로 완전히 활성화된 프로세스를 보유하고 광범위한 채택을 달성한 기업은 25%에 불과합니다. NeuReality의 NR1 추론 장치를 통해 기업은 사용 편의성, 비용 효율성 및 성능을 향상시켜 채택 장벽을 제거하여 생성 AI 이니셔티브를 가속화할 수 있습니다.

사용 편의성 : 배포 장벽 낮추기

성능 및 비용 효율성 외에도 사용 편의성도 NeuReality AI 솔루션의 핵심 동인입니다. NR1 추론 장치에는 AI 모델 및 소프트웨어 개발 키트가 사전 로드되어 있어 배포 프로세스를 간소화하고 인프라 통합 및 최적화에 대한 필요성을 줄입니다. 이러한 사용 편의성을 통해 AI 소프트웨어 개발자는 복잡한 인프라를 처리하는 데 시간을 소비하는 대신 혁신적인 AI 애플리케이션을 구축하고 배포하는 데 집중할 수 있습니다.

광범위한 애플리케이션 : 여러 산업

NeuReality의 NR1 추론 장치는 다양한 비즈니스 사용 사례 및 시장을 지원하도록 설계되었습니다. 이 장치는 컴퓨터 비전, 대화형 AI 및 사용자 지정 된 요청에 대한 사전 구성된 소프트웨어 개발 키트 및 API를 통해 최적화되었습니다. 이러한 다양성은 NR1 추론 장치를 금융 서비스, 생명 과학, 정부 및 클라우드 서비스 제공 업체를 포함한 다양한 산업에 적합하게 만듭니다.

AI 도입 가속화 : 경제성, 접근 용이성 및 공간 효율성

NeuReality의 NR1 장치는 경제성과 접근성을 동시에 제공하여 AI 도입을 촉진하며, 온프레미스 및 클라우드 인프라에 적합합니다. 많은 조직에서 높은 비용과 복잡성으로 인해 AI 이니셔티브를 확장하는 데 어려움을 겪고 있지만 NeuReality의 솔루션은 비용 효율적인 개방형 표준 플랫폼을 제공하여 이러한 장벽을 해결하고 AI 개발 및 배포를 간소화합니다.

데모 하이라이트

NeuReality는 2025년 5월 20일부터 23일까지 대만 타이베이에서 열리는 대만 컴퓨텍스 InnoVEX에서 NR1 추론 엔진을 선보여 기능을 선보일 예정입니다. 행사에서 회사는 몇 분 안에 채팅 애플리케이션을 쉽게 마이그레이션하는 방법을 시연하고 NR1 칩이 Smooth Factory Models과 DeepSeek-R1-Distill-Llama-8B에서 제공하는 성능을 보여줄 예정입니다.

지속적인 혁신 : 미래를 위한 준비

NeuReality는 새로운 생성 및 에이전트 AI 모델과 최적화된 소프트웨어 개발 키트를 정기적으로 릴리스하여 NR1 추론 장치의 기능을 향상시키기 위해 노력하고 있습니다. 이러한 지속적인 혁신을 통해 기업은 최신 AI 기술에 대한 최신 정보를 유지하고 AI 인프라가 미래 워크로드에 맞게 최적화되었는지 확인할 수 있습니다.

NeuReality : 기업이 AI의 잠재력을 마스터할 수 있도록 지원

NeuReality의 파괴적인 AI-CPU 기술은 추론 AI 배포를 배포하는 비용 효율적인 방법을 제공하여 AI 쿼리와 토큰을 최적화하는 동시에 GPU의 성능을 극대화하여 최대 성능과 투자 수익을 제공합니다. NeuReality가 계속 혁신하고 NR1 추론 장치의 기능을 확장함에 따라 번창하는 AI 세계에서 기업이 번창하는 데 핵심적인 동반자가 될 것입니다.

성능, 비용 효율성 및 사용 편의성에 대한 초점을 지속적인 혁신에 대한 노력과 결합함으로써 NeuReality는 AI 경제를 재구성하고 모든 규모의 기업이 AI의 잠재력을 마스터할 수 있도록 지원할 위치에 있습니다.

업데이트됨 2025-05-16

# AI # LLM # Agent