OpenAI, 맞춤형 AI 에이전트 구축 도구 공개

맞춤형 AI 에이전트 구축을 위한 OpenAI의 새로운 도구 공개

OpenAI는 최근 개발자가 정교하고 프로덕션 준비가 된 AI 에이전트를 만들 수 있도록 지원하는 새로운 도구 모음을 도입했습니다. 여기에는 Responses API, Agents SDK 및 향상된 관찰 기능이 포함됩니다. 이러한 발전은 사용자 정의 오케스트레이션 및 복잡하고 다단계 작업에서 프롬프트 반복 관리와 같은 에이전트 개발의 중요한 과제를 해결합니다.

업무 환경에서 AI 에이전트의 부상

OpenAI는 AI 에이전트가 업무 환경에 깊이 통합되어 다양한 산업 분야에서 생산성을 크게 향상시키는 미래를 구상합니다. 이러한 에이전트는 추론 및 다중 모드 상호 작용과 같은 고급 기능을 활용하여 복잡한 작업을 처리할 것으로 예상됩니다. 새로 출시된 도구는 OpenAI 플랫폼을 사용하여 에이전트 기반 워크플로 개발을 간소화하도록 특별히 설계되었습니다.

Responses API 소개

Responses API는 채팅 완성 기능과 어시스턴트 기능을 병합하는 중요한 단계입니다. OpenAI는 개발자가 새 프로젝트에 대해 이 API를 우선시할 것을 권장합니다.

Responses API의 주요 이점:

  • 유연성: 에이전트 기반 애플리케이션을 구축하기 위한 보다 유연한 기반을 제공합니다.
  • 복잡성 관리: 단일 Responses API 호출을 통해 개발자는 여러 도구와 모델 턴을 사용하여 점점 더 복잡해지는 작업을 처리할 수 있습니다.
  • 내장 도구 지원: API는 웹 검색, 로컬 파일 액세스 및 컴퓨터 제어(마우스 및 키보드 사용)를 포함한 외부 도구에 대한 기본 지원을 제공합니다.
  • 개발자 주도 개선 사항: 이전 모델의 피드백을 기반으로 API는 통합 디자인, 단순화된 다형성, 향상된 스트리밍 및 다양한 SDK 도우미를 제공합니다.

웹 검색 기능

웹 검색 기능의 경우 Responses API는 ChatGPT 검색, GPT-4o 검색 미리보기 및 GPT-4o 미니 검색 미리보기를 구동하는 동일한 모델을 활용합니다. 이러한 모델은 SimpleQA 벤치마크에서 90% 및 88%의 점수를 달성하여 인상적인 정확도를 보여주었습니다. 이는 일반적으로 15%에서 63% 사이의 점수를 얻는 ‘plain-vanilla’ GPT 모델보다 훨씬 뛰어납니다.

컴퓨터 제어 제한 사항

웹 검색 기능은 강력하지만 컴퓨터 사용 도구는 개선의 여지가 있습니다. 현재 OSWorld 벤치마크에서 38.1%를 기록하여 모델이 운영 체제 내에서 작업을 자동화하는 데 아직 신뢰할 수 없음을 나타냅니다.

API 진화: 초점의 변화

Chat Completions API와 Assistants API는 당분간 계속 사용할 수 있지만 OpenAI는 새로운 모델과 기능으로 Chat Completions API를 개선하기 위해 최선을 다하고 있습니다. 그러나 회사는 내년에 Assistants API가 더 이상 사용되지 않을 것이라고 발표했으며 이는 에이전트 개발을 위한 기본 도구로서 Responses API로의 명확한 전환을 나타냅니다.

Agents SDK: 에이전트 워크플로 오케스트레이션

Responses API와 함께 OpenAI는 새로운 Agents SDK를 출시했습니다. 이 SDK는 다음을 수행하는 도구를 제공하여 에이전트 워크플로의 오케스트레이션을 용이하게 하도록 설계되었습니다.

  • 고유 에이전트 정의: 특정 작업에 대한 특수 에이전트를 만듭니다.
  • 제어 전송 관리(핸드오프): 서로 다른 에이전트 간에 제어를 원활하게 전송합니다.
  • 안전 검사 구현(가드레일): 관련성이 없거나 유해하거나 바람직하지 않은 동작을 방지하기 위해 입력 및 출력 검사를 정의합니다.
  • Human-in-the-Loop 상호 작용 활성화: 필요한 경우 사람의 개입을 통합합니다.

Agents SDK의 실제 응용 프로그램:

Agents SDK는 다음을 포함한 광범위한 실제 응용 프로그램에 적합합니다.

  • 고객 지원 자동화
  • 다단계 연구
  • 콘텐츠 생성
  • 코드 검토
  • 영업 전망

모델 및 도구 호환성

Agents SDK는 o1, o3-mini, GPT-4.5, GPT-4o 및 GPT-4o-mini를 포함한 모든 현재 OpenAI 모델을 지원합니다. 또한 개발자는 임베딩 및 Knowledge API를 통해 외부 및 영구 지식으로 에이전트를 향상시킬 수 있습니다. Responses API를 활용하는 Agents SDK는 웹 검색, 로컬 파일 액세스 및 컴퓨터 제어를 위한 동일한 외부 도구를 지원합니다.

이전 프레임워크 대체

Agents SDK는 이전 버전을 대체하며 Responses API 및 타사 API를 포함한 모든 Chat Completions 스타일 API와 호환됩니다.

커뮤니티 반응 및 전략적 고려 사항

이러한 새로운 도구의 출시는 개발자 커뮤니티 내에서 논의를 촉발했습니다. Hacker News (HN) 커뮤니티의 일부 구성원은 OpenAI가 Chat Completions API에서 벗어나면 플랫폼에 대한 종속성이 증가할 수 있다는 우려를 표명했습니다.

종속성에 대한 우려:

일부 개발자는 Assistant API의 단계적 폐지가 사용자 정의 오케스트레이션을 구축하는 것의 중요성을 강조한다고 제안합니다. 이 접근 방식은 더 큰 유연성과 필요한 경우 기본 LLM을 교체할 수 있는 기능을 허용합니다.

‘Roll Your Own’ 접근 방식:

여러 HN 독자는 Agents SDK 또는 기타 에이전트 미들웨어를 채택하면 본질적으로 애플리케이션의 핵심 로직을 아웃소싱하는 것을 의미할 수 있다고 지적했습니다. 그들은 개발자가 자체 솔루션을 구축하여 더 많은 제어권을 유지하는 것을 선호할 수 있다고 주장합니다.

Responses API에 대한 심층 분석

Responses API는 기존 기능의 조합 그 이상입니다. 이는 개발자가 OpenAI의 모델과 상호 작용할 수 있는 방식의 근본적인 변화를 나타냅니다. 에이전트 개발의 초석이 되도록 설계되었으며 이전에는 사용할 수 없었던 수준의 제어 및 유연성을 제공합니다.

모델 동작에 대한 세분화된 제어

Responses API의 주요 이점 중 하나는 모델 동작에 대한 세분화된 제어를 제공한다는 것입니다. 개발자는 이제 자세한 지침과 제약 조건을 지정하여 모델의 응답을 보다 정확하게 안내할 수 있습니다. 이는 여러 단계와 상호 작용이 필요한 복잡한 작업에 특히 중요합니다.

향상된 프롬프트 엔지니어링

Responses API는 보다 정교한 프롬프트 엔지니어링을 용이하게 합니다. 개발자는 여러 도구와 데이터 소스를 통합하는 프롬프트를 작성하여 모델이 보다 정보에 입각하고 상황에 맞는 응답을 생성할 수 있도록 합니다. 이를 통해 미묘하고 복잡한 작업을 처리할 수 있는 에이전트를 만들 수 있습니다.

간소화된 개발 워크플로

Responses API의 통합 디자인과 향상된 스트리밍 기능은 보다 간소화된 개발 워크플로에 기여합니다. 개발자는 프롬프트 및 에이전트 디자인을 더 빠르게 반복할 수 있으므로 개발 주기가 빨라지고 에이전트 성능이 향상됩니다.

Agents SDK 자세히 살펴보기

Agents SDK는 단순한 도구 모음이 아닙니다. 복잡한 에이전트 워크플로를 구축하고 관리하기 위한 프레임워크입니다. 에이전트 개발에 대한 구조화된 접근 방식을 제공하여 강력하고 확장 가능한 애플리케이션을 더 쉽게 만들 수 있습니다.

모듈식 에이전트 디자인

SDK는 에이전트 디자인에 대한 모듈식 접근 방식을 장려합니다. 개발자는 특정 작업에 대한 특수 에이전트를 만든 다음 결합하여 더 복잡한 시스템을 만들 수 있습니다. 이러한 모듈성을 통해 시간이 지남에 따라 에이전트를 더 쉽게 유지 관리하고 업데이트할 수 있습니다.

핸드오프: 원활한 전환

핸드오프 메커니즘은 Agents SDK의 중요한 기능입니다. 서로 다른 에이전트 간의 원활한 전환을 허용하여 각 단계에서 가장 적절한 에이전트가 작업을 처리하도록 합니다. 이는 여러 단계와 결정 지점이 포함된 워크플로를 만드는 데 필수적입니다.

가드레일: 안전 및 관련성 보장

가드레일 기능은 안전 및 관련성 제약 조건을 적용하기 위한 메커니즘을 제공합니다. 개발자는 에이전트가 유해하거나 바람직하지 않은 출력을 생성하지 못하도록 하는 규칙을 정의할 수 있습니다. 이는 사용자와 상호 작용하거나 민감한 데이터를 처리하는 애플리케이션에 특히 중요합니다.

Human-in-the-Loop: 두 세계의 장점

Human-in-the-Loop 상호 작용을 통합하는 기능은 Agents SDK의 강력한 기능입니다. 개발자는 복잡한 작업을 자율적으로 처리할 수 있지만 필요한 경우 사람의 개입에 의존할 수 있는 에이전트를 만들 수 있습니다. 이러한 자동화와 사람의 감독의 조합은 많은 실제 응용 프로그램에 중요합니다.

에이전트 개발의 미래

OpenAI의 새로운 도구는 에이전트 개발 분야에서 중요한 진전을 나타냅니다. 개발자에게 광범위한 작업을 처리할 수 있는 정교한 AI 에이전트를 만들 수 있는 능력과 유연성을 제공합니다. 기술이 계속 발전함에 따라 다양한 산업 분야에서 AI 에이전트의 더욱 혁신적인 응용 프로그램을 기대할 수 있습니다.

Responses API 및 Agents SDK로의 전환은 AI 산업의 더 넓은 추세를 반영합니다. 즉, 보다 모듈화되고 사용자 정의 가능하며 제어 가능한 AI 시스템으로의 이동입니다. 이러한 추세는 특정 작업에 맞게 조정하고 복잡한 워크플로에 통합할 수 있는 AI 솔루션의 필요성에 의해 주도됩니다.

개발자에게 이러한 시스템을 구축하는 데 필요한 도구를 제공하려는 OpenAI의 노력은 AI의 미래에 대한 긍정적인 신호입니다. 더 많은 개발자가 이러한 도구를 수용하고 그 기능을 탐색함에 따라 다양한 분야에서 AI 에이전트의 개발 및 배포가 빠르게 가속화될 것으로 예상할 수 있습니다. 생산성 향상, 효율성 향상 및 새로운 혁신적인 솔루션의 가능성은 엄청납니다. 이는 우리가 기술과 상호 작용하고 작업하는 방식을 재구성할 수 있는 잠재력을 가진 변혁입니다. AI 에이전트의 진화는 단순한 자동화가 아닙니다. 인간의 능력을 증강하고 새로운 가능성을 창출하는 것입니다.