Persoalan sama ada kecerdasan buatan akan menggantikan pekerjaan manusia telah menjadi subjek perdebatan yang meluas. Sesetengah organisasi sudah bertaruh pada AI, manakala yang lain teragak-agak, mempersoalkan keupayaan semasa. Untuk menyiasat perkara ini, penyelidik dari Carnegie Mellon University menjalankan eksperimen dengan mencipta sebuah syarikat simulasi yang diuruskan sepenuhnya oleh ejen AI. Penemuan mereka, yang dibentangkan dalam artikel pracetak di Arxiv, memberikan pandangan yang berharga tentang potensi dan batasan AI di tempat kerja.
Tenaga kerja maya terdiri daripada model AI seperti Claude dari Anthropic, GPT-4o dari OpenAI, Google Gemini, Amazon Nova, Meta Llama, dan Qwen dari Alibaba. Ejen AI ini ditugaskan pelbagai peranan, termasuk penganalisis kewangan, pengurus projek, dan jurutera perisian. Para penyelidik juga menggunakan platform untuk mensimulasikan rakan sekerja, membolehkan ejen AI berinteraksi dengan mereka untuk tugas-tugas tertentu seperti menghubungi sumber manusia.
Eksperimen AI: Penerokaan Mendalam
Eksperimen ini bertujuan untuk meniru persekitaran perniagaan dunia sebenar di mana ejen AI boleh melaksanakan pelbagai tugas secara bebas. Setiap ejen AI ditugaskan untuk menavigasi fail untuk menganalisis data dan menjalankan lawatan maya untuk memilih ruang pejabat baharu. Prestasi setiap model AI dipantau dengan teliti untuk menilai keberkesanannya dalam menyelesaikan tugas yang diberikan.
Keputusan mendedahkan cabaran yang signifikan. Ejen AI gagal menyelesaikan lebih daripada 75% daripada tugas yang diberikan kepada mereka. Claude 3.5 Sonnet, walaupun mendahului, berjaya menyelesaikan hanya 24% daripada tugas. Termasuk tugas yang diselesaikan sebahagiannya, skornya mencapai hanya 34.4%. Gemini 2.0 Flash memperoleh kedudukan kedua tetapi hanya menyelesaikan 11.4% daripada tugas. Tiada ejen AI lain yang dapat menyelesaikan lebih daripada 10% daripada tugas.
Keberkesanan Kos vs. Prestasi
Satu lagi aspek penting dalam eksperimen ini ialah kos operasi yang berkaitan dengan setiap ejen AI. Claude 3.5 Sonnet, walaupun prestasinya agak lebih baik, menanggung kos operasi tertinggi pada $6.34. Sebaliknya, Gemini 2.0 Flash mempunyai kos operasi yang jauh lebih rendah iaitu hanya $0.79. Ini menimbulkan persoalan tentang keberkesanan kos menggunakan model AI tertentu dalam operasi perniagaan.
Para penyelidik memerhatikan bahawa ejen AI bergelut dengan aspek tersirat dalam arahan. Sebagai contoh, apabila diarah untuk menyimpan hasil dalam fail ".docx", mereka gagal memahami bahawa ia merujuk kepada format Microsoft Word. Mereka juga menghadapi kesukaran dengan tugas yang memerlukan interaksi sosial, menyoroti batasan AI dalam memahami dan bertindak balas terhadap isyarat sosial.
Cabaran dalam Navigasi Web
Salah satu halangan terbesar bagi ejen AI ialah menavigasi web, terutamanya mengendalikan pop-up dan reka letak laman web yang kompleks. Apabila berhadapan dengan halangan, mereka kadang-kadang menggunakan jalan pintas, melangkau bahagian tugas yang sukar dan menganggap mereka telah menyelesaikannya. Kecenderungan untuk memintas segmen yang mencabar ini menggariskan ketidakupayaan AI untuk mengendalikan senario dunia sebenar yang kompleks secara bebas.
Penemuan ini menunjukkan bahawa walaupun AI boleh cemerlang dalam tugas-tugas tertentu, seperti analisis data, ia masih jauh daripada mampu berfungsi secara bebas dalam persekitaran perniagaan. Ejen AI bergelut dengan tugas-tugas yang memerlukan pemahaman yang lebih mendalam tentang konteks, interaksi sosial, dan kemahiran menyelesaikan masalah.
Pemerhatian Utama daripada Kajian
Kajian Carnegie Mellon University memberikan beberapa pemerhatian utama tentang keadaan semasa AI dan peranannya yang berpotensi di tempat kerja:
Penyelesaian Tugas Terhad: Ejen AI bergelut untuk menyelesaikan tugas secara bebas, gagal dalam lebih daripada 75% percubaan. Ini menekankan keperluan pengawasan dan campur tangan manusia dalam tugas yang dipacu AI.
Kesukaran dengan Arahan Tersirat: Ejen sering gagal memahami aspek tersirat atau kontekstual arahan, menunjukkan kekurangan pemahaman di luar arahan eksplisit.
Cabaran dalam Interaksi Sosial: Ejen AI bergelut dengan tugas yang memerlukan interaksi sosial, mencadangkan bahawa AI belum mampu menguruskan hubungan interpersonal atau menavigasi dinamik sosial dengan berkesan.
Isu Navigasi Web: Ejen mempunyai masalah menavigasi web, menunjukkan bahawa AI memerlukan pembangunan lebih lanjut untuk mengendalikan laman web yang kompleks dan pop-up yang tidak dijangka.
Kecenderungan Jalan Pintas: Ejen kadang-kadang mengambil jalan pintas, melangkau bahagian tugas yang sukar, mendedahkan ketidakupayaan untuk mengendalikan penyelesaian masalah yang kompleks tanpa pemikiran kritis seperti manusia.
Implikasi untuk Masa Depan Kerja
Penemuan kajian ini mempunyai implikasi yang signifikan untuk masa depan kerja. Walaupun AI berpotensi untuk mengautomasikan tugas-tugas tertentu dan meningkatkan kecekapan, ia tidak mungkin menggantikan pekerja manusia sepenuhnya dalam masa terdekat. Sebaliknya, AI lebih cenderung untuk menambah keupayaan manusia, membolehkan pekerja memberi tumpuan kepada aktiviti yang lebih strategik dan kreatif.
Kajian ini juga menekankan kepentingan melatih model AI untuk lebih memahami konteks, isyarat sosial, dan penyelesaian masalah yang kompleks. Memandangkan teknologi AI terus berkembang, adalah penting untuk menangani batasan ini untuk memastikan bahawa AI dapat menyokong pekerja manusia dengan berkesan dalam pelbagai peranan.
Tenaga Kerja Campuran: Manusia dan AI
Masa depan kerja mungkin melibatkan tenaga kerja campuran, di mana manusia dan AI bekerjasama untuk mencapai matlamat bersama. Pekerja manusia boleh menyediakan pemikiran kritis, kreativiti, dan kemahiran sosial yang AI kini kekurangan, manakala AI boleh mengautomasikan tugas rutin dan menganalisis sejumlah besar data dengan lebih cekap daripada manusia.
Tenaga kerja campuran ini akan memerlukan perubahan dalam kemahiran dan latihan. Pekerja perlu mengembangkan keupayaan untuk bekerjasama dengan sistem AI, memahami pandangan yang dijana AI, dan menyesuaikan diri dengan peranan yang berubah apabila AI mengambil alih lebih banyak tugas.
Peranan Etika dan Pengawasan
Apabila AI menjadi lebih berleluasa di tempat kerja, adalah juga penting untuk mempertimbangkan implikasi etika menggunakan AI. Isu-isu seperti bias, privasi, dan anjakan pekerjaan perlu ditangani dengan teliti untuk memastikan bahawa AI digunakan secara bertanggungjawab dan beretika.
Organisasi harus mewujudkan garis panduan yang jelas dan mekanisme pengawasan untuk penggunaan AI di tempat kerja. Garis panduan ini harus menangani isu-isu seperti privasi data, bias algoritmik, dan impak AI terhadap pekerjaan.
Menganalisis Cabaran Model AI Individu
Meneroka lebih mendalam tentang spesifikasi model AI yang digunakan dalam eksperimen ini memberikan lebih banyak pandangan tentang cabaran dan penyelesaian yang berpotensi. Model seperti Claude, GPT-4o, Gemini, Llama, dan lain-lain masing-masing mempunyai seni bina dan set data latihan yang unik, yang secara langsung mempengaruhi prestasi dan kos operasi mereka.
Claude: Memahami Keupayaan dan Batasan
Claude, yang terkenal dengan keupayaannya dalam pemprosesan bahasa semula jadi, menunjukkan kadar penyelesaian yang agak tinggi dalam eksperimen ini. Walau bagaimanapun, ia juga datang dengan kos operasi tertinggi, menunjukkan pertukaran antara prestasi dan keberkesanan kos. Isu yang dihadapi Claude dengan arahan tersirat dan interaksi sosial mencadangkan bahawa walaupun canggih, ia masih memerlukan penambahbaikan dalam pemahaman kontekstual.
Untuk meningkatkan prestasi Claude, lelaran masa depan boleh mendapat manfaat daripada set data latihan yang lebih pelbagai yang merangkumi senario dengan isyarat sosial dan arahan tersirat yang kompleks. Selain itu, mengoptimumkan model untuk keberkesanan kos boleh menjadikannya pilihan yang lebih berdaya maju untuk aplikasi perniagaan.
GPT-4o: Pelaku Serba Boleh?
GPT-4o, yang dibangunkan oleh OpenAI, mewakili satu lagi model terkini dengan pelbagai keupayaan. Prestasinya dalam eksperimen ini menunjukkan bahawa walaupun kekuatannya, ia masih bergelut dengan aplikasi praktikal, dunia sebenar yang memerlukan gabungan kemahiran teknikal dan sosial. Peningkatan boleh memberi tumpuan kepada integrasi yang lebih baik dengan alat berasaskan web dan pengendalian gangguan yang tidak dijangka yang lebih baik, seperti pop-up.
Gemini: Alternatif yang Berkesan Kos?
Gemini Google menonjol kerana kos operasinya yang agak rendah, menjadikannya pilihan yang menarik bagi perniagaan yang ingin meminimumkan perbelanjaan. Walau bagaimanapun, kadar penyelesaian tugasnya menunjukkan bahawa terdapat ruang untuk peningkatan dalam prestasi keseluruhannya. Untuk menangani perkara ini, pembangun boleh menumpukan pada memperhalusi keupayaan menyelesaikan masalah Gemini dan kapasitinya untuk memahami konteks dalam arahan terbuka.
Llama: Potensi Sumber Terbuka
Llama Meta, sebagai model sumber terbuka, menawarkan kelebihan pembangunan dan penyesuaian yang dipacu oleh komuniti. Walaupun prestasinya dalam eksperimen ini tidak begitu hebat, sifat sumber terbuka Llama bermakna bahawa penambahbaikan boleh dibuat oleh pelbagai pembangun. Bidang tumpuan mungkin termasuk meningkatkan kemahiran navigasi webnya dan meningkatkan keupayaannya untuk menavigasi set data yang kompleks.
Mengatasi Batasan AI dalam Tetapan Perniagaan
Eksperimen ini menggariskan bahawa untuk model AI benar-benar cemerlang dalam persekitaran perniagaan, pembangun mesti memberi tumpuan kepada beberapa bidang utama:
Pemahaman Kontekstual: Meningkatkan keupayaan AI untuk memahami dan mentafsir konteks adalah penting. Ini melibatkan model latihan pada set data yang pelbagai yang merangkumi arahan tersirat dan isyarat sosial.
Interaksi Sosial: Meningkatkan kapasiti AI untuk interaksi sosial akan membolehkannya menguruskan perhubungan interpersonal dan menavigasi dinamik sosial dengan lebih berkesan.
Navigasi Web: Membangunkan kemahiran navigasi web AI akan membantunya mengendalikan laman web yang kompleks, pop-up, dan gangguan lain yang tidak dijangka.
Penyelesaian Masalah: Memperhalusi keupayaan menyelesaikan masalah AI akan membolehkannya mengendalikan tugas yang kompleks tanpa menggunakan jalan pintas atau membuat andaian.
Evolusi AI yang Berterusan
Kajian Carnegie Mellon University menawarkan gambaran tentang keadaan semasa AI. Memandangkan teknologi AI terus berkembang, adalah penting untuk menjejaki kemajuannya dan menangani batasannya. Dengan memberi tumpuan kepada bidang utama ini, AI boleh menjadi alat yang berharga untuk menambah keupayaan manusia dan meningkatkan kecekapan di tempat kerja.
Menangani Kebimbangan Etika
Penyepaduan AI dalam perniagaan juga memperkenalkan beberapa kebimbangan etika yang mesti ditangani secara proaktif. Bias algoritmik, privasi data, dan anjakan pekerjaan adalah antara isu yang paling mendesak.
Bias Algoritmik: Model AI boleh mengekalkan dan menguatkan bias sedia ada dalam data yang mereka dilatih. Ini boleh menyebabkan hasil diskriminasi dalam bidang seperti pengambilan pekerja, kenaikan pangkat, dan penilaian prestasi. Organisasi harus mengaudit sistem AI dengan teliti untuk memastikan ia bebas daripada bias dan tidak mendiskriminasi mana-mana kumpulan orang.
Privasi Data: Sistem AI sering memerlukan akses kepada sejumlah besar data, yang boleh menimbulkan kebimbangan tentang privasi. Organisasi harus melaksanakan langkah perlindungan data yang kukuh untuk memastikan bahawa maklumat sensitif tidak terjejas.
Anjakan Pekerjaan: Automasi tugas melalui AI boleh menyebabkan anjakan pekerjaan, terutamanya dalam peranan rutin dan berulang. Organisasi harus mengambil langkah untuk mengurangkan impak anjakan pekerjaan dengan menyediakan latihan dan sokongan untuk pekerja untuk beralih ke peranan baharu.
Masa Depan adalah Kolaboratif
Masa depan kerja melibatkan hubungan kolaboratif antara manusia dan AI, di mana setiap satu saling melengkapi kekuatan masing-masing. Pekerja manusia membawa kreativiti, pemikiran kritis, dan kemahiran sosial ke meja, manakala AI mengautomasikan tugas rutin dan menganalisis sejumlah besar data. Organisasi yang menerima model kolaboratif ini akan berada pada kedudukan yang terbaik untuk berjaya dalam landskap kerja yang berubah-ubah.
Memandangkan teknologi AI terus maju, organisasi harus kekal mudah menyesuaikan diri dan proaktif dalam menangani cabaran dan peluang yang ditawarkan oleh AI. Dengan melabur dalam latihan, mewujudkan garis panduan etika, dan memupuk budaya kolaboratif, mereka boleh memanfaatkan kuasa AI untuk mewujudkan tempat kerja yang lebih produktif, cekap, dan saksama. Ringkasnya, walaupun AI menunjukkan potensi, terdapat batasan yang jelas pada masa ini mengenai keupayaannya untuk menggantikan tenaga kerja manusia dalam pelbagai tugas dan operasi. Memahami batasan ini adalah penting bagi perniagaan yang berharap untuk memanfaatkan potensi AI pada tahun-tahun akan datang.