Keputusan Mengejutkan Ujian 5 Pembantu Penulisan AI

Saya baru-baru ini mengambil bahagian dalam eksperimen penulisan AI yang dianjurkan oleh The Washington Post, menyertai panel pakar komunikasi untuk menilai lima alat AI yang popular. Wartawan teknologi Geoffrey Fowler membingkainya sebagai versi moden pertandingan membakar tradisional, mencabar kami untuk menilai sejauh mana alat AI ini dapat mengendalikan lima jenis e-mel kerja dan peribadi yang mencabar.

Mengapa E-mel?

Fowler menjelaskan bahawa penulisan e-mel ialah ‘salah satu perkara pertama yang benar-benar berguna yang boleh dilakukan oleh AI dalam hidup anda. Dan kemahiran yang ditunjukkan oleh AI dalam merangka e-mel juga terpakai untuk jenis tugas penulisan yang lain.’

Para hakim menilai sejumlah 150 e-mel dalam ujian buta ini. Walaupun satu alat AI muncul sebagai pemenang yang jelas, eksperimen itu menyoroti potensi manfaat dan batasan penting pembantu penulisan dan komunikasi AI.

Semasa penilaian, kami tidak menyedari e-mel mana yang dijana oleh ChatGPT, Microsoft Copilot, Google Gemini, DeepSeek atau Claude Anthropic. Fowler juga menyertakan e-mel yang telah ditulisnya sendiri, mencabar kami untuk membezakan antara kandungan yang dijana AI dan yang ditulis manusia.

Pembantu Penulisan AI Terbaik

Claude ialah pemenang yang tidak dipertikaikan.

Fowler menyatakan, ‘Secara purata, e-mel Claude terasa lebih manusiawi daripada yang lain.’ Erica Dhawan, hakim lain, menambah, ‘Claude menggunakan bahasa yang tepat dan hormat tanpa terlalu korporat atau tidak peribadi.’

DeepSeek mendapat tempat kedua, diikuti oleh Gemini, ChatGPT dan Copilot, yang menduduki tempat terakhir. Walaupun ketersediaannya yang meluas dalam Windows, Word dan Outlook, hakim mendapati bahawa e-mel Copilot kedengaran terlalu tiruan. Menurut Fowler, ‘Copilot memulakan mesej dengan beberapa variasi daripada ‘semoga anda sihat’ yang sangat generik pada tiga daripada lima ujian kami.’

Walaupun Claude menang dalam pertandingan keseluruhan, saya mendapati bahawa skor individu saya mendedahkan keutamaan untuk e-mel yang ditulis manusia. Keutamaan ini menggariskan batasan asas yang dikongsi oleh semua pembantu AI.

Fowler menegaskan bahawa hakim tidak selalu bersetuju mengenai e-mel mana yang terbaik, tetapi mereka berkumpul pada isu teras: keaslian. Dia menekankan bahawa ‘Walaupun AI secara teknikalnya ‘sopan’ dalam penulisannya, ia masih boleh dianggap tidak ikhlas kepada manusia.’

Pengajaran utama saya daripada eksperimen itu ialah alat AI cemerlang dalam menggariskan, menstruktur hujah dan memastikan kejelasan. Walau bagaimanapun, mereka sering menghasilkan penulisan yang kaku, terlalu formal, robotik, dan kekurangan pemperibadian, emosi dan empati.

Cabaran yang dihadapi pembantu AI dengan kreativiti berpunca daripada seni bina asas model bahasa yang besar. Model ini direka untuk menjana kandungan dengan ‘koheren sintaksis,’ yang bermaksud menyusun ayat bersama-sama yang mengalir secara semula jadi dan mematuhi peraturan tatabahasa. Walau bagaimanapun, seperti yang kita semua tahu, peraturan kadangkala dibuat untuk dilanggar.

Pelanggar Peraturan: Steve Jobs

Pada tahun 1997, Apple, di bawah kepimpinan Steve Jobs, melancarkan salah satu kempen pemasaran yang paling diingati dalam sejarah. Pada masa itu, syarikat itu terhuyung-hayang di ambang muflis dan sangat memerlukan kempen yang akan menarik perhatian dan membezakannya daripada pesaing.

Iklan televisyen yang terhasil, yang terkenal sebagai ‘yang gila,’ menampilkan potret hitam putih tokoh pemberontak dan berwawasan seperti Bob Dylan, John Lennon, dan Martin Luther King Jr. Kempen ini secara meluas dikreditkan dengan menghidupkan semula identiti jenama Apple dan memainkan peranan penting dalam pemulihan kewangan syarikat.

Jika AI ditugaskan untuk mencipta kempen Apple, ia mungkin tidak akan berlaku.

Bagaimana saya boleh begitu pasti? Kerana Claude sendiri mengakuinya.

Claude mengakui bahawa ‘Jika diminta untuk mencipta slogan seperti kempen terkenal Apple dalam mod lalai saya, saya hampir pasti akan menulis ‘Fikir Secara Berbeza’ dan bukannya ‘Fikir Berbeza.’ Latihan saya menekankan ketepatan tatabahasa. Bentuk keterangan yang betul untuk mengubah suai kata kerja ‘fikir’ ialah ‘secara berbeza,’ dan saya cenderung untuk mengikuti peraturan yang ditetapkan ini.’

Menurut Claude, ia boleh menganalisis mengapa kempen itu bergema selepas fakta itu. Walau bagaimanapun, ‘menjana jenis pemberontakan tatabahasa yang disengajakan itu tidak datang secara semula jadi kepada saya.’

AI tidak mempunyai semangat memberontak hanya kerana ia bukan manusia. Walaupun sesetengah bot AI mungkin lebih mahir daripada yang lain dalam mensimulasikan kualiti manusia dalam penulisan mereka, mereka akhirnya kekurangan suara unik yang dibentuk oleh pengalaman peribadi dan pandangan kreatif yang mentakrifkan komunikasi manusia.

AI harus dilihat sebagai pembantu yang berguna yang boleh membantu dalam mencetuskan idea, menjelaskan pemikiran, meringkaskan dokumen, dan mengumpul dan menyusun maklumat. Ini semua adalah tugas yang penting dan memakan masa. Walau bagaimanapun, walaupun AI pastinya boleh meningkatkan komunikasi, ia tidak seharusnya menggantikan komunikator manusia.

Memandangkan semakin ramai orang bergantung pada pembantu AI untuk mengarang e-mel, resume, memo, dan persembahan, terdapat risiko peningkatan penghomogenan, di mana individu mula kedengaran serupa. Perekrut korporat sudah menyedari trend ini.

Setiap individu mempunyai kisah yang unik dan berkuasa untuk dikongsi. Adalah penting untuk tidak membenarkan suara buatan menenggelamkan suara asli seseorang.