Naratif Belanja AI: Permintaan Atasi Kecekapan

Gegaran Awal: DeepSeek dan Khayalan Kecekapan

Kemunculan DeepSeek AI dari China awal tahun ini telah menggegarkan landskap pelaburan teknologi. Pendekatannya yang kelihatan seperti satu kejayaan baharu, menjanjikan kecerdasan buatan yang berkuasa dengan kos pengkomputeran yang jauh lebih rendah, serta-merta mencetuskan spekulasi. Satu naratif dengan cepat terbentuk: mungkin pengembangan infrastruktur AI yang berterusan dan mahal, yang dicirikan oleh pembelian besar-besaran cip dan sistem khusus, akan mula perlahan. Pasaran bertindak balas, mencerminkan kepercayaan bahawa era baharu AI yang kos efektif mungkin secara dramatik mengurangkan ledakan perbelanjaan yang dijangkakan.

Walau bagaimanapun, pandangan daripada perhimpunan peringkat tinggi minda industri baru-baru ini memberikan gambaran yang sangat berbeza. Sebuah persidangan AI generatif yang diadakan di New York oleh Bloomberg Intelligence mencadangkan bahawa tafsiran awal, yang hanya tertumpu pada potensi penjimatan kos, terlepas pandang cerita yang lebih besar. Jauh daripada menandakan kelembapan perbelanjaan, acara itu menekankan keinginan yang hampir tidak terpuaskan untuk kapasiti AI yang lebih besar. Konsensus bukanlah tentang mengurangkan; ia adalah tentang memikirkan cara untuk memenuhi selera yang berkembang secara eksponen untuk sistem pintar, walaupun dalam masa yang sama sangat berharap agar kosnya lebih rendah.

Suara dari Lapangan: Dahaga Kapasiti yang Tidak Terpadam

Perbincangan sepanjang acara sehari itu, yang menghimpunkan pembangun, ahli strategi, dan pelabur, secara konsisten berkisar pada tema permintaan yang meningkat yang mendorong pelaburan besar-besaran. Mandeep Singh, seorang penganalisis teknologi kanan dengan Bloomberg Intelligence dan salah seorang penganjur acara itu, merumuskan sentimen yang lazim dengan ringkas. Mengimbas kembali pelbagai panel dan perbincangan pakar, beliau menyatakan satu laungan universal: tiada siapa yang terlibat merasakan mereka mempunyai kapasiti AI yang mencukupi. Perasaan yang meluap-luap adalah tentang memerlukan lebih banyak, bukan mempunyai terlalu banyak.

Secara kritikal, tambah Singh, bayangan ‘gelembung infrastruktur’, ketakutan biasa dalam sektor teknologi yang berkembang pesat, ketara tidak hadir dalam perbualan. Fokus kekal tertumpu pada cabaran asas yang dihadapi oleh seluruh industri. Anurag Rana, rakan sekerja Singh dan penganalisis kanan Bloomberg Intelligence untuk perkhidmatan IT dan perisian, membingkainya sebagai persoalan utama: ‘Di manakah kita dalam kitaran [pembinaan infrastruktur AI] itu?’

Walaupun mengakui bahawa menentukan peringkat sebenar pembinaan besar-besaran ini masih sukar difahami (‘Tiada siapa yang tahu’ dengan pasti, Rana mengakui), fenomena DeepSeek tidak dapat dinafikan telah mengubah perspektif. Ia menyuntik dos harapan yang kuat bahawa beban kerja AI yang signifikan berpotensi dikendalikan dengan lebih ekonomik. ‘DeepSeek menggoyahkan ramai orang,’ perhati Rana. Implikasinya jelas: jika model AI yang canggih benar-benar boleh berjalan dengan cekap pada perkakasan yang kurang menuntut, mungkin projek gergasi, seperti inisiatif berbilion-bilion dolar yang dikhabarkan dirancang oleh konsortium yang melibatkan pemain teknologi utama, mungkin dinilai semula atau diskalakan secara berbeza.

Impian itu, yang bergema di seluruh industri menurut Rana, adalah agar kos operasi AI, terutamanya untuk inference (peringkat di mana model terlatih menjana ramalan atau kandungan), mengikuti trajektori penurunan dramatik yang disaksikan dalam penyimpanan pengkomputeran awan sepanjang dekad yang lalu. Beliau teringat bagaimana ekonomi menyimpan sejumlah besar data pada platform seperti Amazon Web Services (AWS) bertambah baik secara dramatik selama kira-kira lapan tahun. ‘Penurunan dalam lengkung kos itu… ekonominya bagus,’ katanya. ‘Dan itulah yang diharapkan oleh semua orang, bahawa di sisi inference… jika lengkung itu jatuh ke tahap itu, ya Tuhan, kadar penerimaan AI… akan menjadi hebat.’ Singh bersetuju, menyatakan bahawa kedatangan DeepSeek secara asasnya ‘telah mengubah pemikiran semua orang tentang mencapai kecekapan.’

Keinginan untuk kecekapan ini dapat dirasai sepanjang sesi persidangan. Walaupun banyak panel menyelidiki kepraktisan memindahkan projek AI perusahaan dari peringkat konseptual ke pengeluaran langsung, perbincangan selari sentiasa menekankan keperluan kritikal untuk mengurangkan kos yang berkaitan dengan penggunaan dan pengendalian model AI ini. Matlamatnya jelas: mendemokrasikan akses dengan menjadikan AI berdaya maju dari segi ekonomi untuk rangkaian aplikasi dan pengguna yang lebih luas. Shawn Edwards, ketua teknologi Bloomberg sendiri, mencadangkan bahawa DeepSeek tidak semestinya satu kejutan sepenuhnya, tetapi lebih kepada ilustrasi kuat tentang keinginan universal. ‘Apa yang membuatkan saya berfikir ialah alangkah baiknya jika anda boleh melambai tongkat sakti dan model-model ini berjalan dengan sangat cekap,’ katanya, melanjutkan harapan itu kepada keseluruhan spektrum model AI, bukan hanya satu kejayaan khusus.

Prinsip Percambahan: Memacu Permintaan Pengkomputeran

Salah satu sebab utama pakar menjangkakan pelaburan yang berterusan dan besar dalam infrastruktur AI, walaupun dalam usaha mencari kecekapan, terletak pada percambahan model AI semata-mata. Tema yang berulang sepanjang persidangan New York ialah langkah tegas menjauhi tanggapan tentang satu model AI monolitik tunggal yang mampu mengendalikan semua tugas.

  • Urusan Keluarga: Seperti yang dikatakan oleh Edwards dari Bloomberg, ‘Kami menggunakan keluarga model. Tidak ada perkara seperti model terbaik.’ Ini mencerminkan pemahaman yang semakin meningkat bahawa seni bina AI yang berbeza cemerlang dalam tugas yang berbeza – penjanaan bahasa, analisis data, pengecaman imej, pelengkapan kod, dan sebagainya.
  • Penyesuaian Perusahaan: Ahli panel secara meluas bersetuju bahawa walaupun model ‘asas’ atau ‘sempadan’ tujuan umum yang besar akan terus dibangunkan dan diperhalusi oleh makmal AI utama, tindakan sebenar dalam perniagaan melibatkan penggunaan berpotensi ratusan atau bahkan ribuan model AI khusus.
  • Penalaan Halus dan Data Proprietari: Kebanyakan model perusahaan ini akan disesuaikan daripada model asas melalui proses yang dipanggil fine-tuning. Ini melibatkan latihan semula rangkaian neural pra-latihan pada data spesifik syarikat, yang sering kali proprietari. Ini membolehkan AI memahami konteks perniagaan yang unik, terminologi, dan interaksi pelanggan, memberikan hasil yang jauh lebih relevan dan berharga daripada yang boleh dilakukan oleh model generik.
  • Mendemokrasikan Pembangunan: Jed Dougherty, yang mewakili platform sains data Dataiku, menekankan keperluan untuk ‘pilihan di kalangan model’ untuk ejen AI perusahaan. Beliau menekankan kepentingan memberi syarikat kawalan, keupayaan penciptaan, dan auditability ke atas alat AI mereka. ‘Kami mahu meletakkan alat untuk membina perkara ini di tangan orang ramai,’ tegas Dougherty. ‘Kami tidak mahu sepuluh PhD membina semua ejen.’ Dorongan ke arah kebolehcapaian yang lebih luas dalam pembangunan itu sendiri membayangkan keperluan untuk lebih banyak infrastruktur asas untuk menyokong usaha penciptaan teragih ini.
  • AI Khusus Jenama: Industri kreatif menawarkan contoh utama. Hannah Elsakr, yang mengetuai usaha perniagaan baharu di Adobe, menjelaskan strategi mereka yang bertaruh pada model tersuai sebagai pembeza utama. ‘Kami boleh melatih sambungan model tersuai untuk jenama anda yang boleh membantu kempen iklan baharu,’ beliau memberi contoh, menunjukkan bagaimana AI boleh disesuaikan untuk mengekalkan estetika dan mesej jenama tertentu.

Selain daripada kepelbagaian model, peningkatan penggunaan AI agents dalam aliran kerja korporat merupakan satu lagi pemacu penting permintaan pemprosesan. Ejen-ejen ini dibayangkan bukan sahaja sebagai alat pasif tetapi sebagai peserta aktif yang mampu melaksanakan tugas berbilang langkah.

Ray Smith, yang mengetuai usaha ejen dan automasi Copilot Studio Microsoft, meramalkan masa depan di mana pengguna berinteraksi dengan berpotensi ratusan ejen khusus melalui antara muka bersatu seperti Copilot. ‘Anda tidak akan memasukkan keseluruhan proses ke dalam satu ejen, anda akan memecahkannya kepada bahagian-bahagian,’ jelasnya. Ejen-ejen ini, cadangnya, pada asasnya adalah ‘aplikasi dalam dunia baharu’ pengaturcaraan. Visinya adalah di mana pengguna hanya menyatakan matlamat mereka – ‘beritahu apa yang kami mahu capai’ – dan ejen mengatur langkah-langkah yang diperlukan. ‘Aplikasi ejen hanyalah cara baharu aliran kerja,’ kata Smith, menekankan bahawa merealisasikan visi ini bukanlah soal kemungkinan teknologi (‘semuanya mungkin dari segi teknologi’) tetapi lebih kepada ‘kadar di mana kita membinanya.’

Dorongan untuk menanamkan ejen AI dengan lebih mendalam ke dalam proses organisasi harian ini seterusnya meningkatkan tekanan untuk pengurangan kos dan penggunaan yang cekap. James McNiven, ketua pengurusan produk di gergasi mikropemproses ARM Holdings, membingkai cabaran itu dari segi kebolehcapaian. ‘Bagaimana kita menyediakan akses pada lebih banyak peranti?’ beliau merenung. Memerhatikan model mencapai keupayaan hampir ‘peringkat PhD’ dalam tugas-tugas tertentu, beliau membuat perbandingan dengan impak transformatif membawa sistem pembayaran mudah alih ke negara-negara membangun tahun lalu. Persoalan teras kekal: ‘Bagaimana kita mendapatkan [keupayaan AI] itu kepada orang yang boleh menggunakan keupayaan itu?’ Menjadikan ejen AI yang canggih sedia ada sebagai pembantu kepada sebahagian besar tenaga kerja memerlukan bukan sahaja perisian pintar tetapi juga perkakasan yang cekap dan, tidak dapat dielakkan, lebih banyak pelaburan infrastruktur asas, walaupun kecekapan setiap pengiraan bertambah baik.

Halangan Penskalaan: Silikon, Kuasa, dan Gergasi Awan

Malah model asas generik yang paling banyak digunakan berkembang biak pada kadar yang mengejutkan, meletakkan tekanan besar pada infrastruktur sedia ada. Dave Brown, yang menyelia pengkomputeran dan rangkaian untuk Amazon Web Services (AWS), mendedahkan bahawa platform mereka sahaja menawarkan pelanggan akses kepada sekitar 1,800 model AI yang berbeza. Beliau menekankan fokus intensif AWS untuk ‘melakukan banyak perkara untuk menurunkan kos’ menjalankan alat berkuasa ini.

Strategi utama untuk penyedia awan seperti AWS melibatkan pembangunan custom silicon mereka sendiri. Brown menonjolkan peningkatan penggunaan cip rekaan AWS, seperti pemproses Trainium mereka yang dioptimumkan untuk latihan AI, menyatakan, ‘AWS menggunakan lebih banyak pemproses kami sendiri berbanding pemproses syarikat lain.’ Langkah ke arah perkakasan khusus dalaman ini bertujuan untuk merebut kawalan ke atas prestasi dan kos, mengurangkan pergantungan kepada pembekal cip tujuan umum seperti Nvidia, AMD, dan Intel. Walaupun usaha ini, Brown secara terus terang mengakui realiti asas: ‘Pelanggan akan melakukan lebih banyak jika kosnya lebih rendah.’ Siling permintaan pada masa ini lebih ditentukan oleh kekangan bajet daripada kekurangan aplikasi berpotensi.

Skala sumber yang diperlukan oleh pembangun AI terkemuka adalah sangat besar. Brown menyatakan kerjasama harian AWS dengan Anthropic, pencipta keluarga model bahasa Claude yang canggih. Michael Gerstenhaber, ketua antara muka pengaturcaraan aplikasi Anthropic, yang bercakap bersama Brown, menunjukkan keamatan pengkomputeran AI moden, terutamanya model yang direka untuk penaakulan kompleks atau ‘berfikir’. Model-model ini sering menjana penjelasan langkah demi langkah terperinci untuk jawapan mereka, menggunakan kuasa pemprosesan yang signifikan. ‘Model berfikir menyebabkan banyak kapasiti digunakan,’ kata Gerstenhaber.

Walaupun Anthropic secara aktif bekerjasama dengan AWS mengenai teknik pengoptimuman seperti ‘prompt caching’ (menyimpan dan menggunakan semula pengiraan daripada interaksi sebelumnya untuk menjimatkan sumber), keperluan perkakasan asas kekal amat besar. Gerstenhaber secara terus terang menyatakan bahawa Anthropic memerlukan ‘ratusan ribu pemecut’ – cip AI khusus – yang diedarkan ‘merentasi banyak pusat data’ semata-mata untuk menjalankan suite model semasanya. Ini memberikan gambaran konkrit tentang skala sumber pengkomputeran yang menyokong hanya satu pemain AI utama.

Menambah cabaran mendapatkan dan menguruskan armada silikon yang luas ialah penggunaan tenaga yang meningkat secara berlingkar yang berkaitan dengan AI. Brown menonjolkan ini sebagai kebimbangan kritikal, dan yang meningkat dengan cepat. Pusat data semasa yang menyokong beban kerja AI intensif sudah menggunakan kuasa yang diukur dalam ratusan megawatt. Unjuran mencadangkan keperluan masa depan tidak dapat dielakkan akan meningkat ke julat gigawatt – output loji kuasa besar. ‘Kuasa yang digunakannya,’ Brown memberi amaran, merujuk kepada AI, ‘adalah besar, dan jejaknya besar di banyak pusat data.’ Permintaan tenaga yang meningkat ini bukan sahaja memberikan kos operasi yang besar tetapi juga cabaran alam sekitar dan logistik yang signifikan untuk menempatkan dan menjana kuasa infrastruktur AI generasi akan datang.

Kad Liar Ekonomi: Bayangan Terhadap Rancangan Pertumbuhan

Walaupun tinjauan optimis didorong oleh kemajuan teknologi dan kes penggunaan yang berkembang pesat, satu pembolehubah penting menyelubungi semua unjuran untuk pelaburan AI: iklim ekonomi yang lebih luas. Ketika persidangan Bloomberg Intelligence berakhir, para hadirin sudah memerhatikan kegelisahan pasaran yang berpunca daripada pakej tarif global yang baru diumumkan, yang dianggap lebih meluas daripada yang dijangkakan.

Ini berfungsi sebagai peringatan kuat bahawa peta jalan teknologi yang bercita-cita tinggi boleh terganggu dengan cepat oleh halangan makroekonomi. Rana dari Bloomberg memberi amaran bahawa walaupun perbelanjaan AI mungkin agak terlindung pada mulanya, bidang tradisional pelaburan IT korporat, seperti pelayan dan storan yang tidak berkaitan dengan AI, boleh menjadi mangsa pertama dalam penguncupan ekonomi. ‘Perkara besar lain yang kami fokuskan ialah perbelanjaan teknologi bukan AI,’ katanya, menyatakan kebimbangan mengenai potensi impak ke atas penyedia perkhidmatan teknologi utama menjelang musim pendapatan, walaupun sebelum mempertimbangkan bajet AI secara khusus.

Walau bagaimanapun, terdapat teori yang lazim bahawa AI mungkin terbukti unik berdaya tahan. Rana mencadangkan bahawa Ketua Pegawai Kewangan (CFO) di syarikat-syarikat besar, yang menghadapi kekangan bajet disebabkan oleh ketidaktentuan ekonomi atau bahkan kemelesetan, mungkin memilih untuk mengutamakan inisiatif AI. Mereka berpotensi mengalihkan dana dari kawasan yang kurang kritikal untuk melindungi pelaburan AI strategik yang dianggap penting untuk daya saing masa depan.

Namun, pandangan optimis ini jauh dari terjamin. Ujian muktamad, menurut Rana, adalah sama ada syarikat-syarikat besar mengekalkan sasaran perbelanjaan modal agresif mereka, terutamanya untuk membina pusat data AI, dalam menghadapi ketidaktentuan ekonomi yang semakin meningkat. Persoalan kritikal kekal: ‘Adakah mereka akan berkata, ‘Anda tahu apa? Ia terlalu tidak menentu.’’ Jawapannya akan menentukan sama ada momentum yang kelihatan tidak dapat dihalang di sebalik perbelanjaan infrastruktur AI meneruskan pendakiannya yang tanpa henti atau menghadapi jeda yang tidak dijangka yang ditentukan oleh realiti ekonomi global.