Aspirasi AI Google: Mencontohi Strategi Apple

Google semakin bercita-cita tinggi untuk mencontohi Apple, terutamanya dalam bidang model besar AI Generatif (GenAI). Persidangan Google Cloud Next baru-baru ini mempamerkan visi Google yang bercita-cita tinggi. Ini termasuk inovasi yang terdiri daripada cip TPU v7 Ironwood, yang direka untuk menyaingi GB200 Nvidia, kepada protokol Agent2Agent (A2A) yang bertujuan untuk mengatasi MCP Anthropic, dan persekitaran runtime Pathways untuk penggunaan GenAI.

Google juga secara aktif membangunkan alat seperti ADK dan Agentspace untuk memperkasakan pembangun dalam mencipta Ejen AI. Teras kepada usaha ini ialah Vertex AI, platform pembangunan dan penggunaan native cloud AI Google. Vertex AI kini menawarkan pelbagai perkhidmatan penjanaan kandungan, meliputi Veo 2 untuk video, Imagen 3 untuk imej, Chirp 3 untuk audio dan Lyria untuk muzik. Jelas sekali bahawa Google Cloud memposisikan dirinya untuk menyediakan pembangun dan pengguna dengan suite aplikasi pembangunan model besar GenAI yang komprehensif.

Walaupun kebolehgunaan sebenar perkhidmatan dan pengalaman ini masih belum dapat dilihat, Google telah mewujudkan ekosistem perkakasan dan perisian AI multimodal yang lengkap, dibangunkan sendiri, sumber tertutup dan sedia ada.

Pendekatan komprehensif ini menggambarkan Google sebagai Apple era AI.

TPU Ironwood: Pencabar Yang Berkuasa

Pelancaran cip TPU generasi ketujuh, Ironwood, amat ketara.

  • Setiap TPU dilengkapi dengan memori HBM 192GB, dengan lebar jalur antara 7.2 hingga 7.4TB/s, berkemungkinan menggunakan teknologi HBM3E. Ini dibandingkan dengan cip B200 Nvidia, yang menawarkan lebar jalur 8TB/s.
  • Setiap TPU v7 yang disejukkan cecair boleh mencapai 4.6 Petaflops kuasa pengkomputeran FP8 tumpat. Ini agak kurang daripada 20 Petaflops B200.
  • Walau bagaimanapun, rangkaian pusat data Jupiter Google membolehkan penskalaan untuk menyokong sehingga 400,000 cip atau 43 kluster TPU v7x. Kepakaran teknologi pelayan Google membolehkannya mengurangkan penekanan pada metrik prestasi cip tunggal.
  • Yang penting, Google telah memperkenalkan Pathways, persekitaran runtime AI khusus yang meningkatkan fleksibiliti penggunaan model GenAI, seterusnya mengukuhkan kelebihannya dalam domain kluster perkhidmatan.
  • Ironwood tersedia dalam dua konfigurasi kluster: 256 cip atau 9216 cip, disesuaikan dengan beban kerja tertentu. Kluster tunggal boleh mencapai kuasa pengkomputeran 42.5 Exaflops. Google mendakwa prestasi ini melebihi superkomputer terbesar di dunia, El Capitan, sebanyak 24 kali ganda. Walau bagaimanapun, angka ini diukur pada ketepatan FP8, dan El Capitan AMD belum lagi memberikan data ketepatan FP8. Google telah mengakui perkara ini, menjadikan perbandingan langsung sukar.

Menerima Ekosistem GenAI Sumber Tertutup

Google sedang mengejar ekosistem sumber tertutup yang komprehensif dalam bidang GenAI. Walaupun Gemma sumber terbuka mempunyai meritnya, Google menyalurkan sumber ke arah penyelesaian sumber tertutupnya.

Dengan lonjakan minat Ejen AI, Google mengumumkan protokol A2A di persidangan itu, meminta 50 vendor arus perdana untuk bersaing dengan MCP Anthropic.

Walaupun OpenAI sumber terbuka SDK Ejennya, mengintegrasikan keupayaan model besarnya, Google mengembangkan Vertex AI dengan ADK, Agentspace, AutoML, AIPlatform dan Kubeflow, menyuntik pelbagai keupayaan model.

Walau bagaimanapun, apabila membandingkan penjanaan imej GPT-4o dengan ciri setara Gemini 2.0 Flash, tawaran Google, walaupun bercita-cita tinggi, mungkin kurang digilap. Penggabungan pelbagai model, perkhidmatan dan alat, walaupun bermanfaat untuk persaingan, mungkin kelihatan pramatang. Pasaran memerlukan model besar multimodal yang matang, disepadukan dengan baik dan perkhidmatan dalam model.

Meniru Model Gmail, Chrome dan Google dalam AI

Kejayaan Google dengan Gmail, Chrome dan pendekatan ‘roket tiga peringkat’ membolehkannya menguasai pasaran teknologi global. Strategi ini sedang dilaksanakan dengan pantas dalam bidang GenAI. Walau bagaimanapun, tidak seperti advokasinya yang lalu untuk sumber terbuka, Google semakin menerima pembangunan sumber tertutup.

Google secara berkesan mengubah sumber terbuka menjadi bentuk sumber tertutup dengan menyatukan sumbernya untuk mewujudkan ekosistem yang dominan dalam bidang tertentu, kemudian mengenakan tol. Pendekatan ini menghadapi peningkatan kritikan daripada pembangun.

Rangka kerja pembelajaran mesin sumber terbuka Google, TensorFlow dan Jax, telah mencapai kejayaan global. Walau bagaimanapun, persekitaran runtime Pathways baharu adalah sumber tertutup, malah mengasingkan alat pembangunan CUDA Nvidia.

Google vs. Nvidia: Pertempuran untuk Penguasaan AI

Oleh kerana Nvidia memperjuangkan AI Fizikal dan memperkenalkan model umum robot humanoid sumber terbuka Isaac GR00T N1, Google DeepMind memasuki pasaran dengan Gemini Robotics dan Gemini Robotics-ER, berdasarkan Gemini 2.0.

Pada masa ini, kehadiran Google hanya kurang dalam pasaran komputer AI desktop. Bagaimanakah DGX Spark Nvidia (dahulunya Projek DIGITS) dan DGX Station, bersama-sama dengan Mac Studio Apple, bersaing dengan perkhidmatan awan Google? Soalan ini telah menjadi tumpuan dalam industri berikutan persidangan itu.

Kebergantungan Apple pada Google Cloud dan Cip M3 Ultra

Apple dilaporkan menggunakan kluster TPU Google Cloud untuk melatih model besarnya, malah meninggalkan penyelesaian latihan cip Nvidia kerana pertimbangan kos! Walaupun menghadapi kelemahan perisian, Apple memberi tumpuan kepada cip siri M. Mac Studio terkini, yang dilengkapi dengan cip M3 Ultra, kini menawarkan sehingga 512GB memori bersatu. Potensi penerimaan awal Apple terhadap teknologi Pathways Google Cloud mungkin telah menjajarkan ia dengan Google.

Faktor Antitrust

Isu asas berkisar pada kebimbangan antitrust. Pada masa ini, model perniagaan Apple berada pada kedudukan yang unik untuk menavigasi tuntutan mahkamah antitrust global, tidak seperti Microsoft dan Google, yang menghadapi potensi perpecahan. Saiz Google mendedahkannya kepada risiko pelupusan paksa sistem pengendalian Android teras dan perniagaan pelayar Chrome.

Google baru-baru ini telah menghentikan penyelenggaraan Projek Sumber Terbuka Android (AOSP), menjadikan peralihan ke arah model Apple tidak dapat dielakkan dalam era AI. Apabila penemuan AI muncul, peralihan strategik Google menjadi semakin jelas.

Pengembangan TPU v7 Ironwood Google

Menyelami lebih mendalam spesifikasi TPU v7 Ironwood mendedahkan perkakasan yang direka bentuk dengan teliti. 192GB Memori Lebar Jalur Tinggi (HBM) ialah komponen penting, membenarkan akses data pantas yang penting untuk melatih dan menjalankan model AI yang kompleks. Penggunaan teknologi HBM3E yang diunjurkan menggariskan komitmen Google untuk memanfaatkan kemajuan terkini dalam teknologi memori. Lebar jalur 7.2-7.4TB/s bukan sekadar nombor yang mengagumkan; ia diterjemahkan terus kepada masa pemprosesan yang lebih pantas dan keupayaan untuk mengendalikan set data yang lebih besar dan rumit.

Perbandingan dengan B200 Nvidia tidak dapat dielakkan, memandangkan penguasaan Nvidia dalam pasaran GPU. Walaupun B200 menawarkan lebar jalur yang sedikit lebih tinggi iaitu 8TB/s, seni bina sistem keseluruhan dan penyepaduan dalam ekosistem Google ialah tempat Ironwood bertujuan untuk membezakan dirinya.

4.6 Petaflops kuasapengkomputeran FP8 tumpat ialah ukuran keupayaan cip untuk melakukan operasi titik terapung, yang merupakan asas kepada pengiraan AI. Perbezaan berbanding dengan 20 Petaflops B200 menyerlahkan falsafah reka bentuk yang berbeza. Google menekankan kebolehskalaan dan penyepaduan TPUnya dalam infrastruktur pusat datanya, manakala Nvidia memberi tumpuan kepada kuasa pengkomputeran mentah pada peringkat cip.

Kepentingan Rangkaian Pusat Data Jupiter Google

Rangkaian pusat data Jupiter Google ialah aset penting, membolehkan sambungan lancar sejumlah besar cip TPU. Keupayaan untuk menyokong sehingga 400,000 cip atau 43 kluster TPU v7x menggariskan skala operasi Google. Kebolehskalaan ini ialah pembeza utama, kerana ia membolehkan Google mengedarkan beban kerja merentasi infrastruktur yang besar, mengoptimumkan prestasi dan kecekapan.

Kepakaran Google dalam teknologi pelayan ialah faktor penting dalam strategi AInya. Dengan mengutamakan prestasi peringkat sistem berbanding spesifikasi cip individu, Google boleh memanfaatkan infrastrukturnya untuk mencapai hasil yang unggul. Pendekatan ini amat relevan dalam konteks latihan model AI berskala besar, di mana keupayaan untuk mengedarkan pengiraan merentasi rangkaian pemproses yang saling berkaitan adalah penting.

Mendedahkan Persekitaran Runtime AI Pathways

Pengenalan Pathways ialah langkah strategik yang meningkatkan fleksibiliti dan kecekapan penggunaan model GenAI. Persekitaran runtime AI khusus ini membolehkan pembangun mengoptimumkan model mereka untuk infrastruktur Google, memanfaatkan sepenuhnya sumber perkakasan dan perisian yang tersedia.

Pathways mewakili pelaburan yang ketara dalam tindanan perisian AI, menyediakan platform bersatu untuk menggunakan dan mengurus model AI. Dengan menyelaraskan proses penggunaan, Google bertujuan untuk menurunkan halangan untuk masuk bagi pembangun dan menggalakkan penggunaan perkhidmatan AInya. Ini, seterusnya, akan memacu inovasi dan mewujudkan ekosistem yang bertenaga di sekitar platform AI Google.

Wawasan Lebih Mendalam tentang Strategi Sumber Tertutup Google

Penerimaan Google terhadap strategi sumber tertutup dalam bidang GenAI ialah pilihan yang disengajakan yang mencerminkan visi jangka panjangnya untuk AI. Walaupun Gemma sumber terbuka telah menjadi sumbangan berharga kepada komuniti AI, Google jelas mengutamakan penyelesaian sumber tertutupnya, menyedari bahawa ia menawarkan kawalan dan penyesuaian yang lebih besar.

Dengan memfokuskan pada pembangunan sumber tertutup, Google boleh mengoptimumkan model dan infrastruktur AInya untuk tugas tertentu, memastikan prestasi dan kecekapan maksimum. Pendekatan ini juga membolehkan Google melindungi harta inteleknya dan mengekalkan kelebihan daya saing dalam landskap AI yang berkembang pesat.

Pendekatan sumber tertutup bukan tanpa pengkritiknya, yang berpendapat bahawa ia menyekat inovasi dan menghadkan kerjasama. Walau bagaimanapun, Google menegaskan bahawa ia perlu untuk memastikan kualiti, keselamatan dan kebolehpercayaan perkhidmatan AInya.

Protokol A2A dan Pertempuran untuk Penguasaan Ejen AI

Kemunculan Ejen AI telah mewujudkan medan pertempuran baharu dalam industri AI, dan Google bertekad untuk menjadi peneraju dalam ruang ini. Pengumuman protokol A2A di persidangan Google Cloud Next ialah petunjuk jelas tentang cita-cita Google.

Dengan mendapatkan 50 vendor arus perdana untuk menyokong protokol A2A, Google cuba mewujudkan standard bersatu untuk komunikasi Ejen AI. Ini akan membolehkan Ejen AI daripada platform yang berbeza berinteraksi dengan lancar, mewujudkan ekosistem AI yang lebih saling berkaitan dan kolaboratif.

Persaingan dengan MCP Anthropic ialah aspek utama strategi Ejen AI Google. Anthropic ialah syarikat penyelidikan AI yang dihormati, dan protokol MCPnya telah mendapat perhatian dalam industri. Protokol A2A Google mewakili cabaran langsung kepada MCP, dan hasil daripada persaingan ini akan memberi impak yang ketara kepada masa depan Ejen AI.

Vertex AI: Platform Pembangunan AI Komprehensif

Vertex AI Google ialah platform pembangunan AI komprehensif yang menyediakan pembangun dengan pelbagai alat dan perkhidmatan. Dengan menyepadukan ADK, Agentspace, AutoML, AIPlatform dan Kubeflow, Google mencipta kedai sehenti untuk pembangunan AI.

Vertex AI bertujuan untuk memudahkan proses pembangunan AI, menjadikannya lebih mudah untuk pembangun membina, melatih dan menggunakan model AI. Platform ini juga menyediakan akses kepada perpustakaan besar model pra-latihan, membolehkan pembangun menggabungkan keupayaan AI dengan cepat ke dalam aplikasi mereka.

Penyepaduan pelbagai keupayaan model ialah kelebihan utama Vertex AI. Dengan menawarkan pelbagai model, Google memenuhi pelbagai kes penggunaan, daripada pengecaman imej hingga pemprosesan bahasa semula jadi. Pendekatan komprehensif ini menjadikan Vertex AI pilihan yang menarik untuk pembangun yang mencari platform pembangunan AI yang serba boleh dan berkuasa.

Penyepaduan Model Google: Cita-cita vs. Pelaksanaan

Walaupun cita-cita Google untuk menyepadukan pelbagai model, perkhidmatan dan alat adalah terpuji, pelaksanaan mungkin memerlukan penambahbaikan lanjut. Pasaran menuntut model besar multimodal yang matang, disepadukan dengan baik dan perkhidmatan dalam model. Tawaran Google semasa, walaupun menjanjikan, mungkin memerlukan penggilapan lanjut untuk memenuhi jangkaan ini.

Penyepaduan pelbagai keupayaan AI ialah usaha yang kompleks, dan Google menghadapi cabaran untuk memastikan bahawa model dan perkhidmatan yang berbeza berfungsi bersama dengan lancar. Ini memerlukan perhatian yang teliti terhadap perincian dan komitmen kepada peningkatan berterusan.

Akhirnya, kejayaan usaha penyepaduan model Google akan bergantung pada keupayaannya untuk memberikan pengalaman pengguna yang berkuasa dan intuitif. Ini memerlukan pemahaman yang mendalam tentang keperluan pengguna dan tumpuan yang tidak henti-henti pada kualiti.