AI generatif sedang merevolusikan operasi perniagaan melalui pelbagai aplikasi, termasuk pembantu perbualan seperti Rufus dan Pembantu Penjual Amazon di bawah Amazon. Di samping itu, beberapa aplikasi AI generatif yang paling berpengaruh beroperasi secara autonomi di latar belakang, satu ciri penting yang membolehkan perniagaan mengubah operasi, pemprosesan data, dan penciptaan kandungan mereka secara besar-besaran. Pelaksanaan bukan perbualan ini sering muncul dalam bentuk aliran kerja ejen yang dikuasakan oleh model bahasa besar (LLM), yang menjalankan objektif perniagaan tertentu merentasi industri tanpa interaksi pengguna langsung.
Berbanding dengan aplikasi perbualan yang mendapat manfaat daripada maklum balas dan pengawasan pengguna masa nyata, aplikasi bukan perbualan menawarkan kelebihan unik seperti toleransi latensi yang lebih tinggi, pemprosesan kelompok, dan penimbalan. Walau bagaimanapun, sifat autonomi mereka memerlukan langkah keselamatan yang lebih kukuh dan jaminan kualiti yang terperinci.
Artikel ini meneroka empat contoh aplikasi AI generatif yang berbeza di Amazon:
- Penciptaan penyenaraian produk Amazon dan peningkatan kualiti data katalog – Menunjukkan bagaimana LLM membantu rakan kongsi jualan dan Amazon mencipta penyenaraian produk berkualiti tinggi secara besar-besaran
- Pemprosesan preskripsi farmasi Amazon – Menunjukkan pelaksanaan dalam persekitaran yang sangat terkawal dan penguraian tugas untuk aliran kerja ejen
- Sorotan ulasan – Menerangkan pemprosesan kelompok besar-besaran, integrasi pembelajaran mesin (ML) warisan, penggunaan LLM yang lebih kecil, dan penyelesaian yang menjimatkan kos
- Imej kreatif iklan Amazon dan penjanaan video – Mengetengahkan AI generatif multimodal dan amalan AI yang bertanggungjawab dalam kerja kreatif
Setiap kajian kes mendedahkan aspek yang berbeza dalam melaksanakan aplikasi AI generatif bukan perbualan, daripada seni bina teknikal kepada pertimbangan operasi. Melalui contoh-contoh ini, anda akan mengetahui bagaimana set lengkap perkhidmatan AWS, termasuk Amazon Bedrock dan Amazon SageMaker, menjadi kunci kejayaan. Akhir sekali, kami menyenaraikan pelajaran utama yang dikongsi secara universal dalam pelbagai kes penggunaan.
Mencipta Penyenaraian Produk Berkualiti Tinggi di Amazon
Mencipta penyenaraian produk berkualiti tinggi dengan butiran yang komprehensif membantu pelanggan membuat keputusan pembelian yang tepat. Secara tradisinya, rakan kongsi jualan memasukkan banyak atribut setiap produk secara manual. Penyelesaian AI generatif baharu yang diperkenalkan pada tahun 2024 mengubah proses ini dengan meningkatkan pengalaman pelanggan dengan proaktif mendapatkan maklumat produk daripada laman web jenama dan sumber lain.
AI generatif mempermudahkan pengalaman rakan kongsi jualan dengan menyokong input maklumat dalam pelbagai format (contohnya, URL, imej produk, atau hamparan) dan secara automatik menukarkannya kepada struktur dan format yang dikehendaki. Lebih daripada 900,000 rakan kongsi jualan telah menggunakannya, dan hampir 80% daripada draf penyenaraian produk yang dijana diterima dengan pengeditan yang minimum. Kandungan yang dijana AI memberikan butiran produk yang komprehensif, yang membantu meningkatkan kejelasan dan ketepatan, seterusnya menyumbang kepada penemuan produk dalam carian pelanggan.
Untuk penyenaraian produk baharu, aliran kerja bermula dengan rakan kongsi jualan memberikan maklumat awal. Kemudian, sistem menggunakan pelbagai sumber maklumat untuk menjana penyenaraian produk yang komprehensif, termasuk tajuk, penerangan, dan atribut terperinci. Penyenaraian produk yang dijana dikongsi dengan rakan kongsi jualan untuk kelulusan atau pengeditan.
Untuk penyenaraian produk sedia ada, sistem mengenal pasti produk yang boleh diperkaya dengan data tambahan.
Integrasi dan Pemprosesan Data untuk Output Besar-besaran
Pasukan Amazon menggunakan Amazon Bedrock dan perkhidmatan AWS lain untuk membina penyambung sumber dalaman dan luaran yang teguh untuk API mesra LLM, dengan itu, mengintegrasikan dengan lancar ke dalam sistem belakang Amazon.com.
Satu cabaran utama ialah mensintesis pelbagai data ke dalam penyenaraian produk yang koheren merentasi lebih daripada 50 atribut (termasuk teks dan angka). LLM memerlukan mekanisme kawalan dan arahan khusus untuk mentafsir konsep e-dagang dengan tepat kerana ia mungkin tidak berprestasi secara optimum dengan data yang begitu kompleks dan pelbagai. Contohnya, LLM mungkin salah mentafsir "kapasiti" tempat pisau sebagai dimensi dan bukannya bilangan slot, atau salah mengklasifikasikan "Fit Wear" sebagai penerangan gaya dan bukannya nama jenama. Kejuruteraan gesaan dan penalaan halus digunakan secara meluas untuk menyelesaikan kes-kes ini.
Penjanaan dan Pengesahan Menggunakan LLM
Penyenaraian produk yang dijana harus lengkap dan betul. Untuk membantu mencapai matlamat ini, penyelesaian ini melaksanakan aliran kerja berbilang langkah yang menggunakan LLM untuk penjanaan dan pengesahan atribut. Pendekatan dwi-LLM ini membantu mencegah halusinasi, yang penting apabila berurusan dengan kebimbangan keselamatan atau spesifikasi teknikal. Pasukan ini membangunkan teknik refleksi diri yang canggih untuk memastikan penjanaan dan pengesahan saling melengkapi dengan berkesan.
Jaminan Kualiti Berbilang Lapisan dengan Maklum Balas Manusia
Maklum balas manusia merupakan teras kepada jaminan kualiti penyelesaian. Proses ini melibatkan penilaian awal oleh pakar Amazon.com, bersama dengan rakan kongsi jualan yang memberikan input untuk penerimaan atau pengeditan. Ini menyediakan output berkualiti tinggi dan keupayaan untuk terus meningkatkan model AI.
Proses jaminan kualiti termasuk menggabungkan kaedah ujian automatik yang menggabungkan ML, algoritma, atau penilaian berasaskan LLM. Penyenaraian produk yang gagal dijana semula, dan penyenaraian produk yang berjaya menjalani ujian lanjut. Menggunakan [model inferens kausal], kami mengenal pasti ciri-ciri asas yang mempengaruhi prestasi penyenaraian produk serta peluang pengayaan. Akhirnya, penyenaraian produk yang lulus pemeriksaan kualiti dan diterima oleh rakan kongsi jualan diterbitkan, memastikan pelanggan menerima maklumat produk yang tepat dan komprehensif.
Pengoptimuman Sistem Peringkat Aplikasi untuk Ketepatan dan Kos
Memandangkan piawaian yang tinggi untuk ketepatan dan kelengkapan, pasukan ini menggunakan pendekatan eksperimen yang komprehensif, dilengkapi dengan sistem pengoptimuman automatik. Sistem ini meneroka pelbagai kombinasi LLM, gesaan, skrip mainan, aliran kerja, dan alat AI untuk meningkatkan metrik perniagaan yang lebih tinggi, termasuk kos. Melalui penilaian berterusan dan ujian automatik, penjana penyenaraian produk boleh mengimbangi prestasi, kos, dan kecekapan dengan berkesan sambil menyesuaikan diri dengan pembangunan AI baharu. Pendekatan ini bermakna pelanggan boleh mendapat manfaat daripada maklumat produk berkualiti tinggi, dan rakan kongsi jualan boleh mengakses alat canggih untuk penciptaan penyenaraian produk yang cekap.
Pemprosesan Preskripsi Berasaskan AI Generatif di Farmasi Amazon
Berdasarkan contoh penyenaraian penjual yang dibincangkan sebelum ini dengan asas aliran kerja manusia-dalam-gelung, Farmasi Amazon menunjukkan cara prinsip-prinsip ini boleh digunakan dalam industri yang dikawal selia oleh Akta Mudah Alih dan Akauntabiliti Insurans Kesihatan. Dalam rencana [Ketahui Cara Farmasi Amazon Menggunakan Amazon SageMaker untuk Mencipta Chatbot Berasaskan LLM], kami berkongsi pembantu perbualan untuk pakar penjagaan pesakit, dan sekarang kami menumpukan pada pemprosesan preskripsi automatik.
Di Farmasi Amazon, kami telah membangunkan sistem AI yang dibina di atas Amazon Bedrock dan SageMaker untuk membantu juruteknik farmasi memproses arahan ubat dengan lebih tepat dan cekap. Penyelesaian ini mengintegrasikan pakar manusia dengan LLM dalam peranan penciptaan dan pengesahan untuk meningkatkan ketepatan arahan ubat pesakit.
Reka Bentuk Aliran Kerja yang Diwakilkan untuk Ketepatan Penjagaan Kesihatan
Sistem pemprosesan preskripsi menggabungkan kepakaran manusia (penyelia kemasukan data dan ahli farmasi) dengan sokongan AI untuk memberikan cadangan dan maklum balas arahan. Aliran kerja bermula dengan prapemproses perpustakaan pengetahuan farmasi, yang menyeragamkan teks preskripsi mentah daripada [Amazon DynamoDB], kemudian menggunakan model bahasa kecil (SLM) yang ditala halus pada SageMaker untuk mengenal pasti komponen utama (dos, kekerapan).
Sistem ini mengintegrasikan dengan lancar pakar seperti penyelia kemasukan data dan ahli farmasi, di mana AI generatif saling melengkapi keseluruhan aliran kerja, dengan itu meningkatkan ketangkasan dan ketepatan untuk melayani pesakit kami dengan lebih baik. Sistem perhimpunan arahan dengan pengawal selia kemudian menjana arahan untuk penyelia kemasukan data untuk mencipta arahan yang ditaip mereka melalui blok cadangan. Blok penanda menandakan atau membetulkan kesilapan dan menguatkuasakan pengawal selia tambahan sebagai maklum balas kepada penyelia kemasukan data. Juruteknik memuktamadkan arahan yang ditaip dengan sangat tepat dan selamat untuk maklum balas ahli farmasi atau melaksanakan arahan kepada perkhidmatan hiliran.
Satu sorotan penyelesaian ini ialah penggunaan penguraian tugas yang membolehkan jurutera dan saintis memecahkan keseluruhan proses kepada berbilang langkah, termasuk modul individu yang terdiri daripada sub-langkah. Pasukan ini menggunakan SLM yang ditala halus secara meluas. Selain itu, proses ini turut menggunakan prosedur ML warisan, seperti [Pengecaman Entiti Bernama (NER)] atau penggunaan [model regresi] untuk anggaran keyakinan terakhir. Penggunaan SLM dan ML warisan dalam proses terkawal dan ditakrifkan dengan jelas ini membolehkan kelajuan pemprosesan ditingkatkan dengan ketara sambil mengekalkan piawaian keselamatan yang ketat kerana pengawal selia yang sesuai dimasukkan ke dalam langkah tertentu.
Sistem ini mengandungi berbilang sub-langkah yang ditakrifkan dengan jelas, dengan setiap sub-proses beroperasi sebagai komponen khusus, berfungsi secara separa autonomi tetapi bersama-sama ke arah matlamat keseluruhan dalam aliran kerja. Pendekatan penguraian ini, dengan pengesahan tertentu pada setiap peringkat, terbukti lebih berkesan daripada penyelesaian hujung ke hujung sambil membolehkan penggunaan SLM yang ditala halus. Pasukan ini menggunakan [AWS Fargate] untuk menyelaraskan aliran kerja kerana ia sedang disepadukan ke dalam sistem belakang sedia ada.
Semasa proses pembangunan produk pasukan ini, mereka beralih kepada Amazon Bedrock, yang menawarkan LLM berkinerja tinggi dengan ciri-ciri kemudahan penggunaan yang disesuaikan untuk aplikasi AI generatif. SageMaker menyokong pemilihan LLM selanjutnya, penyesuaian yang lebih mendalam, dan kaedah ML warisan. Untuk mengetahui lebih lanjut tentang teknologi ini, lihat [Bagaimana Penguraian Tugas dan LLM yang Lebih Kecil Boleh Menjadikan AI Lebih Berpatutan], dan baca [Kajian Kes Perniagaan Farmasi Amazon].
Membina Aplikasi yang Boleh Dipercayai dengan Pengawal Selia dan HITL
Untuk mematuhi piawaian HIPAA dan memberikan privasi pesakit, kami melaksanakan amalan tadbir urus data yang ketat sambil menggunakan pendekatan hibrid yang menggabungkan RAG [Penjanaan Ditambah Pencarian] menggunakan [Amazon OpenSearch Service] dan LLM yang ditala halus dengan API Amazon Bedrock. Gabungan ini membolehkan pencarian pengetahuan yang cekap sambil mengekalkan ketepatan yang tinggi untuk sub-tugas tertentu.
Mengurus halusinasi LLM, yang sangat penting dalam penjagaan kesihatan, memerlukan lebih daripada sekadar penalaan halus pada set data yang besar. Penyelesaian kami melaksanakan pengawal selia khusus domain yang dibina di atas [Amazon Bedrock Guardrails] dan ditambah dengan pengawasan manusia-dalam-gelung (HITL) untuk meningkatkan kebolehpercayaan sistem.
Pasukan Farmasi Amazon terus meningkatkan sistem ini melalui maklum balas masa nyata daripada para ahli farmasi dan keupayaan format preskripsi yang diperluas. Pendekatan seimbang inovasi, kepakaran domain, perkhidmatan AI lanjutan, dan pengawasan manusia ini bukan sahaja meningkatkan kecekapan operasi tetapi juga bermakna sistem AI memperkasakan profesional penjagaan kesihatan dengan betul, seterusnya memberikan penjagaan pesakit yang optimum.
Sorotan Ulasan Pelanggan Berasaskan AI Generatif
Contoh kami sebelumnya menunjukkan cara Farmasi Amazon mengintegrasikan LLM ke dalam aliran kerja masa nyata untuk pemprosesan preskripsi, manakala kes penggunaan ini menunjukkan cara teknologi yang serupa (SLM, ML warisan, dan reka bentuk aliran kerja yang bertimbang rasa) boleh digunakan untuk [inferens kelompok luar talian] secara besar-besaran.
Amazon memperkenalkan [sorotan ulasan pelanggan yang dijana AI] untuk memproses lebih daripada 200 juta ulasan dan penilaian produk tahunan. Ciri ini menyuling pendapat pelanggan yang dikongsi menjadi perenggan ringkas yang menyoroti maklum balas positif, neutral, dan negatif tentang produk dan fungsinya. Pembeli boleh memahami konsensus dengan cepat sambil mengekalkan ketelusan dengan menyediakan akses kepada ulasan pelanggan yang berkaitan dan mengekalkan ulasan asal.
Sistem ini meningkatkan keputusan membeli-belah dengan antara muka di mana pelanggan boleh meneroka sorotan ulasan dengan memilih fungsi khusus (seperti kualiti gambar, kefungsian jauh, atau kemudahan pemasangan untuk Fire TV). Fungsi ini ditandakan dengan tanda semak hijau untuk sentimen positif, tanda tolak oren untuk negatif, dan kelabu untuk neutral—yang bermakna pembeli boleh mengenal pasti kekuatan dan kelemahan produk dengan cepat berdasarkan ulasan pembelian yang disahkan.
Menggunakan LLM untuk Kes Penggunaan Luar Talian dalam Cara yang Menjimatkan Kos
Pasukan ini membangunkan seni bina hibrid yang menjimatkan kos yang menggabungkan kaedah ML warisan dengan SLM khusus. Pendekatan ini meningkatkan ketepatan dan kecekapan pemprosesan dengan menyediakan ML warisan untuk analisis sentimen dan pengekstrakan kata kunci, manakala SLM yang dioptimumkan digunakan untuk tugas penjanaan teks yang kompleks.
Fungsi ini menggunakan [Transformasi Kelompok SageMaker] untuk pemprosesan asinkronus, yang boleh mengurangkan kos dengan ketara berbanding dengan titik hujung masa nyata. Untuk memberikan pengalaman latensi sifar yang hampir, penyelesaian ini [menimbal] cerapan yang diekstrak dan ulasan sedia ada, mengurangkan masa menunggu dan membenarkan berbilang pelanggan mengakses pada masa yang sama tanpa memerlukan pengiraan tambahan. Sistem memproses ulasan baharu secara berperingkat, mengemas kini cerapan tanpa memproses semula set data lengkap. Untuk prestasi dan keberkesanan kos yang optimum, fungsi ini menggunakan [Amazon Elastic Compute Cloud] (Amazon EC2) [contoh Inf2] untuk tugas transformasi kelompok yang [memberikan sehingga 40% nilai yang lebih baik untuk wang berbanding dengan alternatif].
Dengan mengikuti pendekatan komprehensif ini, pasukan menguruskan kos dengan berkesan sambil memproses sejumlah besar ulasan dan produk, menjadikan penyelesaian ini cekap dan boleh diskalakan.
Iklan Amazon Kreatif Imej dan Penjanaan Video Berkuasa AI
Dalam contoh sebelumnya, kami meneroka terutamanya aplikasi AI generatif yang tertumpu pada teks, dan sekarang kami akan beralih kepada AI generatif multimodal dengan [Penjanaan Kandungan Kreatif Iklan Tajaan Iklan Amazon]. Penyelesaian ini mempunyai keupayaan [imej] dan [video] generasi, dan kami akan berkongsi butiran tentang ciri-ciri ini dalam bahagian ini. Secara keseluruh