A inteligência artificial generativa está transformando fundamentalmente as operações de negócios com uma vasta gama de aplicações, incluindo assistentes conversacionais como Rufus e Amazon Seller Assistant, ambos da Amazon. Além disso, algumas das aplicações de IA generativa mais impactantes operam de forma autônoma nos bastidores, uma capacidade indispensável que permite às empresas transformar suas operações, processamento de dados e criação de conteúdo em grande escala. Essas implementações não conversacionais geralmente se manifestam na forma de fluxos de trabalho de agentes impulsionados por modelos de linguagem grandes (LLMs, Large Language Models), que executam objetivos de negócios específicos em vários setores sem interação direta do usuário.
Em comparação com as aplicações conversacionais que se beneficiam do feedback e da supervisão do usuário em tempo real, as aplicações não conversacionais oferecem vantagens distintas, como maior tolerância à latência, processamento em lote e caching, mas sua natureza autônoma exige medidas de segurança mais robustas e garantia de qualidade rigorosa.
Este artigo explora quatro estudos de caso distintos de aplicações de IA generativa na Amazon:
- Criação de Listagens de Produtos da Amazon e Melhoria da Qualidade dos Dados do Catálogo – Demonstra como os LLMs ajudam os parceiros de vendas e a Amazon a criar listagens de produtos de maior qualidade em escala.
- Processamento de Prescrições da Amazon Pharmacy – Apresenta a implementação em um ambiente altamente regulamentado e a decomposição de tarefas para fluxos de trabalho de agentes.
- Destaques de Avaliações (Review Highlights) – Ilustra processamento em lote em larga escala, integração de aprendizado de máquina (ML, Machine Learning) tradicional, o uso de LLMs menores e soluções econômicas.
- Geração de Imagens e Vídeos Criativos do Amazon Ads – Destaca a IA generativa multimodal e as práticas de IA responsável em trabalho criativo.
Cada estudo de caso revela diferentes facetas da implementação de aplicações de IA generativa não conversacionais, desde arquiteturas técnicas até considerações operacionais. Através desses exemplos, você entenderá como um conjunto abrangente de serviços da AWS, incluindo Amazon Bedrock e Amazon SageMaker, pode ser fundamental para o sucesso. Por fim, descrevemos as principais lições compartilhadas que são prevalentes em vários casos de uso.
Criando Listagens de Produtos de Alta Qualidade na Amazon
Criar listagens de produtos de alta qualidade com detalhes abrangentes ajuda os clientes a tomar decisões de compra informadas. Tradicionalmente, os parceiros de vendas inserem manualmente muitos atributos para cada produto. Uma nova solução de IA generativa lançada em 2024 transforma esse processo obtendo proativamente informações sobre produtos de sites de marcas e outras fontes, melhorando assim a experiência do cliente.
A IA generativa simplifica a experiência dos parceiros de vendas, permitindo a inserção de informações em vários formatos (por exemplo, URLs, imagens de produtos ou planilhas) e convertendo-as automaticamente no formato e estrutura desejados. Mais de 900.000 parceiros de vendas o utilizaram, com quase 80% dos rascunhos de listagens de produtos gerados sendo aceitos com edições mínimas. O conteúdo gerado por IA fornece detalhes abrangentes do produto, o que auxilia na melhoria da clareza e precisão, contribuindo assim para a descoberta do produto nas pesquisas dos clientes.
Para novas listagens de produtos, o fluxo de trabalho começa quando um parceiro de vendas fornece informações iniciais. Em seguida, o sistema aproveita várias fontes de informação para gerar uma listagem de produtos abrangente, incluindo título, descrição e atributos detalhados. A listagem de produtos gerada é compartilhada com o parceiro de vendas para aprovação ou edição.
Para listagens de produtos existentes, o sistema identifica produtos que podem ser enriquecidos com dados adicionais.
Integração e Processamento de Dados para Grande Volume de Output
As equipes da Amazon construíram conectores robustos de fontes internas e externas para APIs amigáveis aos LLMs usando o Amazon Bedrock e outros serviços da AWS, permitindo a integração perfeita com sistemas de back-end do Amazon.com.
Um desafio fundamental é sintetizar dados diversos em uma listagem de produtos coerente em mais de 50 atributos, incluindo texto e numérico. Os LLMs exigem mecanismos de controle e instruções específicos para interpretar com precisão os conceitos de comércio eletrônico, pois podem não ter o melhor desempenho com dados tão complexos e variados. Por exemplo, um LLM pode interpretar erroneamente a “capacidade” em um porta-facas como dimensões em vez do número de slots, ou “Fit Wear” como uma descrição de estilo em vez de um nome de marca. A engenharia de prompts e o fine-tuning foram amplamente utilizados para lidar com esses casos.
Geração e Validação com LLMs
As listagens de produtos geradas devem ser completas e corretas. Para ajudar a atingir esse objetivo, a solução implementa um fluxo de trabalho de várias etapas, utilizando LLMs tanto para geração quanto para validação de atributos. Essa abordagem de LLM duplo ajuda a evitar alucinações, o que é crucial ao lidar com riscos de segurança ou especificações técnicas. A equipe desenvolveu técnicas avançadas de auto-reflexão para garantir que os processos de geração e validação se complementassem efetivamente.
Garantia de Qualidade Multicamadas com Feedback Humano
O feedback humano é fundamental para a garantia de qualidade da solução. O processo inclui avaliações iniciais por especialistas da Amazon.com, juntamente com a contribuição de parceiros de vendas para aceitação ou edição. Isso oferece resultados de alta qualidade e a capacidade de aprimorar continuamente o modelo de IA.
O processo de garantia de qualidade inclui métodos de teste automatizados que incorporam ML, algoritmos ou avaliações baseadas em LLMs. As listagens de produtos que falham são regeneradas, enquanto as bem-sucedidas passam por testes adicionais. Usando [modelos de inferência causal], identificamos características subjacentes que influenciam o desempenho da listagem de produtos e oportunidades de enriquecimento. Por fim, as listagens de produtos que passam nas verificações de qualidade e são aceitas pelos parceiros de vendas são publicadas, garantindo que os clientes recebam informações de produtos precisas e abrangentes.
Otimização do Sistema no Nível da Aplicação para Precisão e Custo
Dados os altos padrões de precisão e integridade, a equipe empregou uma abordagem experimental abrangente equipada com um sistema de otimização automatizado. Este sistema explora várias combinações de LLMs, prompts, playbooks, fluxos de trabalho e ferramentas de IA para melhorar métricas de negócios superiores, incluindo custo. Através da avaliação contínua e testes automatizados, o gerador de listagens de produtos pode equilibrar efetivamente desempenho, custo e eficiência, ao mesmo tempo em que se adapta a novos desenvolvimentos de IA. Esta abordagem significa que os clientes podem se beneficiar de informações de produtos de alta qualidade e os parceiros de vendas podem acessar ferramentas de ponta para criação eficiente de listagens de produtos.
Processamento de Prescrições Baseado em IA Generativa na Amazon Pharmacy
Construindo sobre o exemplo anterior de listagem de produtos do vendedor, que é baseado em um fluxo de trabalho híbrido humano-máquina, a Amazon Pharmacy demonstra como esses princípios podem ser aplicados em uma indústria regulamentada pela [Lei de Portabilidade e Responsabilidade de Seguro de Saúde](HIPAA, Health Insurance Portability and Accountability Act). Anteriormente, no artigo [Compreendendo como a Amazon Pharmacy usa o Amazon SageMaker para criar um chatbot baseado em LLM], compartilhamos um assistente de conversação para especialistas em atendimento ao paciente, agora focamos no processamento automatizado de prescrições.
Na Amazon Pharmacy, desenvolvemos um sistema de IA construído sobre Amazon Bedrock e SageMaker para ajudar os técnicos de farmácia a processar instruções de medicamentos com mais precisão e eficiência. Esta solução integra especialistas humanos com LLMs nas funções de criação e validação para aumentar a precisão das instruções de medicamentos para pacientes.
Projeto de Fluxo de Trabalho Delegado para Precisão em Saúde
O sistema de processamento de prescrições combina expertise humana (digitadores de dados e farmacêuticos) com suporte de IA para fornecer recomendações e feedback direcionais. O fluxo de trabalho começa com um pré-processador da base de conhecimento da farmácia, que padroniza o texto da prescrição bruta de [Amazon DynamoDB] antes de usar um modelo de linguagem pequeno (SLM, Small Language Model) ajustado em SageMaker para identificar componentes-chave (dose, frequência).
O sistema integra perfeitamente especialistas como digitadores de dados e farmacêuticos, onde a IA generativa complementa o fluxo de trabalho geral, melhorando a agilidade e a precisão para melhor atender nossos pacientes. Um sistema de montagem de direções com proteções então gera instruções para os digitadores de dados criarem as direções que digitam através de um módulo de sugestões. Um módulo de sinalização marca ou corrige erros e aplica outras proteções como feedback fornecido aos digitadores de dados. Os técnicos finalizam direções digitadas com alta precisão e segurança para que os farmacêuticos forneçam feedback ou serviços downstream executem as direções.
Um destaque desta solução é o uso da decomposição de tarefas, permitindo que engenheiros e cientistas dividam todo o processo em várias etapas, incluindo módulos individuais compostos de subetapas. O SLM ajustado foi extensivamente usado pela equipe. Além disso, o processo emprega programas tradicionais de ML, como [Reconhecimento de Entidades Nomeadas (NER, Named Entity Recognition)] ou estimativas de pontuação de confiança final usando [modelos de regressão]. O uso de SLMs e ML tradicional neste processo controlado e bem definido aumenta significativamente a velocidade de processamento, mantendo padrões de segurança rígidos devido à inclusão de proteções apropriadas nas etapas específicas.
O sistema contém várias subetapas bem definidas, com cada subfluxo atuando como um componente especializado que trabalha de forma semi-autônoma, mas colaborativa para um objetivo geral dentro do fluxo de trabalho. Esta abordagem de decomposição com validações específicas em cada fase se mostrou mais eficaz do que uma solução ponta a ponta, permitindo ao mesmo tempo o uso de SLMs ajustados. A equipe utilizou [AWS Fargate] para coordenar o fluxo de trabalho devido à sua integração atual com os sistemas de back-end existentes.
Durante o processo de desenvolvimento do produto da equipe, eles se voltaram para o Amazon Bedrock, que fornece LLMs de alto desempenho com recursos fáceis de usar sob medida para aplicações de IA generativa. O SageMaker oferece suporte para opções LLM adicionais, personalização mais profunda e abordagens de ML tradicionais. Para saber mais sobre essa tecnologia, consulte [Como a divisão de tarefas e LLMs menores podem tornar a IA mais acessível] e leia [Estudo de caso da Amazon Pharmacy].
Construindo Aplicações Confiáveis com Proteções e HITL
Para manter os padrões HIPAA e fornecer privacidade ao paciente, implementamos práticas rigorosas de governança de dados ao mesmo tempo em que adotamos uma abordagem híbrida que combinava um LLM ajustado usando a API Amazon Bedrock e [Geração Aumentada de Recuperação](RAG, Retrieval Augmented Generation) usando [Amazon OpenSearch Service]. Esta combinação permite a recuperação eficiente de conhecimento, mantendo alta precisão para sub-tarefas específicas.
Gerenciar alucinações de LLM, que são críticas no setor de saúde, exige mais do que ajuste fino em grandes conjuntos de dados. Nossa solução implementou proteções específicas de domínio construídas no [Amazon Bedrock Guardrails] e complementadas pela supervisão de loop humano (HITL, Human-in-the-Loop) para aumentar a confiabilidade do sistema.
A equipe da Amazon Pharmacy continua a aprimorar esse sistema com feedback em tempo real dos farmacêuticos e recursos expandidos de formato de receita. Essa abordagem equilibrada de inovação, expertise de domínio, serviços avançados de IA e supervisão humana não apenas aumenta a eficiência operacional, mas significa que um sistema de IA pode aumentar corretamente os profissionais de saúde, proporcionando o melhor atendimento ao paciente.
Avaliações de Clientes Baseadas em IA Generativa
Nosso exemplo anterior demonstrou como a Amazon Pharmacy integra LLMs em fluxos de trabalho em tempo real para processamento de prescrições, este caso de uso demonstra como técnicas semelhantes (SLMs, ML tradicional e design de fluxo de trabalho cuidadoso) podem ser aplicadas à [inferência em lote offline] em grande escala.
A Amazon lançou [Destaques de Avaliações de Clientes Gerados por IA] para processar mais de 200 milhões de avaliações e classificações de produtos anualmente. Este recurso condensa opiniões compartilhadas de clientes em parágrafos concisos, destacando feedback positivo, neutro e negativo sobre produtos e seus recursos. Os compradores podem entender rapidamente o consenso, mantendo a transparência, fornecendo acesso a avaliações de clientes relevantes e preservando as avaliações originais.
O sistema aprimora as decisões de compra através de uma interface onde os clientes podem explorar os destaques das avaliações selecionando recursos específicos (por exemplo, qualidade da imagem, funcionalidade do controle remoto ou facilidade de instalação do Fire TV). Esses recursos são sinalizados com marcas de seleção verdes para sentimentos positivos, sinais negativos laranjas para negativos e cinza para neutro, o que significa que os compradores podem identificar rapidamente os benefícios e desvantagens de um produto com base em avaliações de compras verificadas.
Uso Eficaz de LLMs para Casos de Uso Offline
A equipe desenvolveu uma arquitetura híbrida econômica que combina abordagens tradicionais de ML com SLMs especializados. Esta abordagem atribui análise de sentimentos e extração de palavras-chave ao ML tradicional, enquanto utiliza SLMs otimizados para tarefas complexas de geração de texto, aumentando assim a precisão e a eficiência do processamento.
Este recurso emprega [Transformações em Lote SageMaker] para processamento assíncrono, o que pode reduzir significativamente os custos em comparação com endpoints em tempo real. Para fornecer uma experiência de latência quase nula, a solução [armazena em cache] as percepções extraídas e as avaliações existentes, reduzindo os tempos de espera e permitindo que vários clientes acessem simultaneamente sem computação adicional. O sistema processa incrementalmente novas avaliações, atualizando as percepções sem a necessidade de reprocessar o conjunto de dados completo. Para desempenho e economia ideais, este recurso usa [instâncias Amazon Elastic Compute Cloud] (Amazon EC2) [Inf2] para trabalhos de transformação em lote, [proporcionando escala de preço-desempenho até 40% melhor em comparação com alternativas].
Ao seguir esta abordagem abrangente, a equipe gerenciou efetivamente os custos ao mesmo tempo em que processava grandes volumes de avaliações e produtos, tornando a solução eficiente e escalável.
Geração de Imagens e Vídeos Criativos Impulsionada por IA do Amazon Ads
Nos exemplos anteriores, exploramos principalmente aplicações de IA generativa focadas em texto, agora passaremos para a IA generativa multimodal com [Geração de Conteúdo Criativo de Anúncios Patrocinados do Amazon Ads]. Esta solução possui recursos de geração de [imagem] e [vídeo], compartilharemos detalhes sobre esses recursos nesta seção. No geral, o núcleo desta solução usa o [Amazon Nova], modelo de geração de conteúdo criativo.
Começando com as necessidades do cliente, uma pesquisa conduzida pela Amazon em março de 2023 revela que quase 75% dos anunciantes listam a criação de conteúdo criativo como seu principal desafio ao se esforçarem para ter sucesso em campanhas publicitárias. Muitos anunciantes (especialmente aqueles sem capacidade interna ou suporte de agência) enfrentam barreiras significativas devido à expertise e custo envolvidos na produção de visuais de alta qualidade. A solução Amazon Ads democratiza a criação de conteúdo visual, tornando-o acessível e eficiente para anunciantes de vários tamanhos. O impacto é substancial: anunciantes que utilizam imagens geradas por IA em campanhas de [Marcas Patrocinadas] veem [taxas de cliques (CTR)] próximas a 8% e enviam campanhas 88% mais do que usuários não usuários.
No ano passado, o AWS Machine Learning Blog publicou um artigo que [detalha a solução de geração de imagens]. Desde então, a Amazon adotou o [Amazon Nova Canvas] como base para a geração de imagens criativas. Utilizando prompts de texto ou imagem, combinados com recursos de edição baseados em texto e controles para ajuste de esquema de cores e layout, cria imagens de nível profissional.
Em setembro de 2024, a equipe da Amazon Ads adicionou a capacidade de criar [anúncios em vídeo curtos] a partir de imagens de produtos. Este recurso usa [modelos de fundação (foundation models)] disponíveis no [Amazon Bedrock], fornecendo aos clientes controle através do controle de linguagem natural sobre o estilo visual, ritmo, movimento da câmera, rotação e zoom. Ele usa um fluxo de trabalho de agente para primeiro descrever o storyboard do vídeo e, em seguida, gerar o conteúdo da história.
Conforme discutido no artigo original, a [IA Responsável] está no centro desta solução, e o modelo criativo Amazon Nova vem com controles integrados para suportar o uso seguro e responsável da IA, incluindo marcas d'água e moderação de conteúdo.
Esta solução usa funções [AWS Step Functions] e [AWS Lambda] para coordenação sem servidor do image e processos de geração de vídeo. O conteúdo gerado é armazenado em [Amazon Simple Storage Service] (Amazon S3), os metadados são armazenados em DynamoDB e [Amazon API Gateway] fornece acesso do cliente aos recursos de geração. Esta solução agora emprega o Amazon Bedrock Guardrails, além de manter [Amazon Rekognition] e [Amazon Comprehend] integrados em várias etapas para verificações de segurança adicionais.
Criar criativos de anúncios de alta qualidade em escala apresenta desafios complexos. Os modelos de IA generativa precisam produzir imagens atraentes e adequadas à marca em diversas categorias de produtos e ambientes de publicidade, ao mesmo tempo em que o tornam facilmente acessível para anunciantes de todos os níveis técnicos. A garantia e melhoria da qualidade são fundamentais para os recursos de geração de imagem e vídeo. Este sistema é aprimorado continuamente através de amplos processos HITL habilitados pelo [Amazon SageMaker Ground Truth]. Esta implementação oferece uma ferramenta poderosa que pode transformar os processos criativos dos anunciantes, tornando a criação de conteúdo visual de alta qualidade mais acessível em todas as categorias de produtos e ambientes.
Este é apenas o começo de como a Amazon Ads está usando a IA generativa para ajudar os anunciantes que precisam criar conteúdo alinhado com seus objetivos de publicidade. Esta solução demonstra como a redução das barreiras de criação pode melhorar diretamente as campanhas publicitárias, mantendo ao mesmo tempo altos padrões de uso responsável da IA.
Principais Lições e Discussões Técnicas
Aplicações não conversacionais se beneficiam de maior tolerância à latência, permitindo processamento em lote e caching, mas exigem mecanismos de validação robustos e medidas de segurança aprimoradas devido à sua autonomia. Estas percepções são aplicáveis a implementações de IA não conversacionais e conversacionais:
- Decomposição de Tarefas e Fluxos de Trabalho de Agentes – Dividir problemas complexos em componentes menores provou ser valioso em diversas implementações. Esta decomposição bem pensada conduzida por especialistas de domínio permite a criação de modelos especializados para sub-tarefas específicas, conforme demonstrado pelo processamento de receitas da Amazon Pharmacy, onde SLMs ajustados lidam com tarefas discretas, como identificação de dosagem. Esta estratégia permite a criação de agentes especializados com etapas de validação claras, aumentando a confiabilidade e simplificando a manutenção. O caso de uso de listagem de produtos do vendedor da Amazon exemplifica isso através de seu fluxo de trabalho de várias etapas com processos separados de geração e validação. Além disso, o caso de uso de avaliações em destaque demonstra o uso efetivo em termos de custo e controlado de LLMs, pré-processando usando ML tradicional e executando a parte que pode estar associada à tarefa LLM.
- Arquiteturas Híbridas e Seleção de Modelo – Combinar ML tradicional com LLMs oferece melhor controle e relação custo-benefício em comparação com abordagens puramente LLM. O ML tradicional se destaca no tratamento de tarefas bem definidas, conforme visto no sistema de avaliações em destaque para análise de sentimentos e extração de informações. As equipes da Amazon implantaram estrategicamente modelos de linguagem grandes e pequenos com base em necessidades, combinando RAG com ajuste fino para aplicações eficazes específicas de domínio, como a implementação da Amazon Pharmacy.
- Estratégias de Otimização de Custos – As equipes da Amazon conseguiram eficiências através de processamento em lote, mecanismos de caching para operações de alto volume, tipos de instância especializados como [AWS Inferentia] e [AWS Trainium] e seleção otimizada de modelo. As avaliações em destaque mostram como o processamento incremental reduz os requisitos computacionais e o Amazon Ads usa o Amazon Nova [modelos de fundação](FM, foundation models) para criação eficiente de conteúdo criativo em termos de custo.
- Mecanismos de Garantia e Controle de Qualidade – O controle de qualidade depende de proteções específicas de domínio através do Amazon Bedrock Guardrails e validação multicamadas que combinam testes automatizados com avaliações humanas. Uma abordagem LLM dupla para geração e validação ajuda a prevenir alucinações em listagens de produtos do vendedor da Amazon, enquanto técnicas de auto-reflexão aprimoram a precisão. O FM criativo Amazon Nova oferece controles inerentes de IA responsável e é complementado por testes A/B contínuos e medições de desempenho.
- Implementação HITL – As abordagens HITL abrangem múltiplas camadas, desde avaliações especializadas de farmacêuticos até feedback do usuário final de parceiros de vendas. As equipes da Amazon estabeleceram fluxos de trabalho de melhoria estruturados que equilibram automação e supervisão humana com base em requisitos específicos de domínio e perfis de risco.
- IA Responsável e Conformidade – As práticas de IA responsável incluem proteções de entrada de conteúdo para ambientes regulamentados e adesão a regulamentações como HIPAA. As equipes da Amazon integram moderação de conteúdo para aplicações voltadas para o usuário, mantêm transparência nas avaliações em destaque, fornecendo acesso a informações de origem e implementaram governança de dados com monitoramento para qualidade e conformidade aprimoradas.
Estes padrões permitem soluções de IA generativa escaláveis, confiáveis e econômicas, mantendo ao mesmo tempo padrões de qualidade e responsabilidade. Estas implementações demonstram que soluções eficazes exigem não apenas modelos avançados, mas também atenção cuidadosa à arquitetura, operações e governança, apoiadas por serviços AWS e práticas estabelecidas.
Próximos Passos
Os exemplos da Amazon compartilhados neste artigo ilustram como a IA generativa cria valor além de assistentes conversacionais tradicionais. Convidamos você a seguir esses exemplos ou criar suas próprias soluções para ver como a IA generativa pode remodelar seus negócios ou mesmo sua indústria. Você pode visitar a página [Casos de uso de IA generativa da AWS] para iniciar seu processo de ideação.
Estes exemplos demonstram que implementações eficazes de IA generativa frequentemente se beneficiam da combinação de diferentes tipos de modelos e fluxos de trabalho. Para saber quais FMs são suportados pelos serviços AWS, consulte [Modelos de fundação suportados no Amazon Bedrock] e [Modelos de fundação Amazon SageMaker JumpStart]. Também recomendamos que você explore o [Amazon Bedrock Flows], que pode simplificar seu caminho para a construção de fluxos de trabalho. Além disso, lembramos que os aceleradores Trainium e Inferentia renderam economias significativas nestas aplicações.
Conforme mostrado nos exemplos que ilustramos, os fluxos de trabalho de agentes provaram ser particularmente valiosos. Recomendamos que você revise [Agentes do Amazon Bedrock] para construir rapidamente fluxos de trabalho de agentes.
A implementação bem-sucedida da IA generativa é mais do que apenas seleção de modelo – ela representa um processo abrangente de desenvolvimento de software desde a experimentação até o monitoramento de aplicações. Para começar a construir sua base em todos esses serviços essenciais, convidamos você a revisar o [Amazon QuickStart].
Para saber mais sobre como a Amazon está usando a IA, consulte [Inteligência artificial] no Amazon News.