ผลลัพธ์น่าทึ่ง! ทดสอบผู้ช่วยเขียน AI 5 ตัว

เมื่อเร็ว ๆ นี้ ฉันได้เข้าร่วมการทดลองเขียน AI ที่จัดโดย The Washington Post โดยเข้าร่วมเป็นคณะผู้เชี่ยวชาญด้านการสื่อสารเพื่อประเมินเครื่องมือ AI ยอดนิยม 5 รายการ Geoffrey Fowler นักข่าวเทคโนโลยีได้วางกรอบให้เป็นการนำเสนอที่ทันสมัยของการแข่งขันทำอาหารแบบดั้งเดิม โดยท้าทายให้เราประเมินว่าเครื่องมือ AI เหล่านี้สามารถจัดการกับอีเมลที่ท้าทายทั้งในเรื่องงานและเรื่องส่วนตัวได้ดีเพียงใด

ทำไมต้องอีเมล?

Fowler อธิบายว่าการเขียนอีเมลเป็น ‘หนึ่งในสิ่งที่ AI สามารถทำได้อย่างมีประโยชน์อย่างแท้จริงในชีวิตของคุณ และทักษะที่ AI แสดงให้เห็นในการร่างอีเมลยังสามารถนำไปใช้กับงานเขียนประเภทอื่น ๆ ได้อีกด้วย’

กรรมการได้ประเมินอีเมลทั้งหมด 150 ฉบับในการทดสอบแบบ Blind Test นี้ แม้ว่าเครื่องมือ AI หนึ่งตัวจะกลายเป็นผู้ชนะอย่างชัดเจน แต่การทดลองนี้ได้เน้นย้ำถึงศักยภาพและข้อจำกัดที่สำคัญของผู้ช่วยเขียนและสื่อสารด้วย AI

ในระหว่างการประเมิน เราไม่ทราบว่าอีเมลใดที่สร้างโดย ChatGPT, Microsoft Copilot, Google Gemini, DeepSeek หรือ Claude ของ Anthropic Fowler ยังได้รวมอีเมลที่เขาเขียนเอง โดยท้าทายให้เราแยกแยะระหว่างเนื้อหาที่สร้างโดย AI และเนื้อหาที่เขียนโดยมนุษย์

ผู้ช่วยเขียน AI อันดับต้น ๆ

Claude เป็นผู้ชนะอย่างไม่มีข้อโต้แย้ง

Fowler กล่าวว่า ‘โดยเฉลี่ยแล้ว อีเมลของ Claude ให้ความรู้สึกเป็นมนุษย์มากกว่าอีเมลอื่น ๆ’ Erica Dhawan กรรมการอีกคนเสริมว่า ‘Claude ใช้ภาษาที่แม่นยำและให้ความเคารพ โดยไม่เป็นทางการหรือเป็นส่วนตัวมากเกินไป’

DeepSeek ได้รับรางวัลรองชนะเลิศอันดับสอง ตามด้วย Gemini, ChatGPT และ Copilot ซึ่งอยู่ในอันดับสุดท้าย แม้ว่าจะมีการใช้งานอย่างแพร่หลายใน Windows, Word และ Outlook แต่กรรมการพบว่าอีเมลของ Copilot ฟังดูเป็นเทียมเกินไป ตามที่ Fowler กล่าว ‘Copilot เริ่มต้นข้อความด้วยรูปแบบที่แตกต่างกันของการ ‘หวังว่าคุณจะสบายดี’ ทั่วไป ในการทดสอบทั้งห้าครั้งของเรา’

แม้ว่า Claude จะได้รับชัยชนะในการแข่งขันโดยรวม แต่ฉันพบว่าคะแนนส่วนตัวของฉันแสดงให้เห็นถึงความชอบในอีเมลที่เขียนโดยมนุษย์ ความชอบนี้เน้นย้ำถึงข้อจำกัดพื้นฐานที่ผู้ช่วย AI ทุกคนมีร่วมกัน

Fowler ชี้ให้เห็นว่ากรรมการไม่ได้เห็นพ้องกันเสมอไปว่าอีเมลใดดีที่สุด แต่พวกเขามีความเห็นพ้องกันในประเด็นหลักคือ ความถูกต้อง เขาเน้นย้ำว่า ‘แม้ว่า AI จะ ‘สุภาพ’ ในการเขียนทางเทคนิค แต่ก็ยังสามารถดูเหมือนไม่จริงใจสำหรับมนุษย์ได้’

บทเรียนสำคัญที่ฉันได้รับจากการทดลองคือ เครื่องมือ AI มีความเชี่ยวชาญในการร่างโครงสร้าง จัดโครงสร้างข้อโต้แย้ง และรับประกันความชัดเจน อย่างไรก็ตาม พวกเขามักจะสร้างงานเขียนที่แข็งทื่อ เป็นทางการเกินไป เป็นหุ่นยนต์ และขาดความเป็นส่วนตัว อารมณ์ และความเห็นอกเห็นใจ

ความท้าทายที่ผู้ช่วย AI เผชิญกับความคิดสร้างสรรค์นั้นมาจากสถาปัตยกรรมพื้นฐานของแบบจำลองภาษาขนาดใหญ่ แบบจำลองเหล่านี้ได้รับการออกแบบมาเพื่อสร้างเนื้อหาที่มี ‘ความสอดคล้องทางวากยสัมพันธ์’ ซึ่งหมายถึงการร้อยเรียงประโยคที่ไหลลื่นอย่างเป็นธรรมชาติและปฏิบัติตามกฎไวยากรณ์ อย่างไรก็ตาม อย่างที่พวกเราทราบกันดีว่า กฎบางครั้งก็มีไว้แหก

ผู้แหกกฎ: Steve Jobs

ในปี 1997 Apple ภายใต้การนำของ Steve Jobs ได้เปิดตัวแคมเปญการตลาดที่น่าจดจำที่สุดแคมเปญหนึ่งในประวัติศาสตร์ ในขณะนั้น บริษัทกำลังจะล้มละลายและต้องการแคมเปญที่จะดึงดูดความสนใจและสร้างความแตกต่างจากคู่แข่งอย่างสิ้นหวัง

โฆษณาทางโทรทัศน์ที่ได้ผลลัพธ์ออกมา ซึ่งเป็นที่รู้จักกันดีในชื่อ ‘the crazy ones’ มีภาพบุคคลขาวดำของบุคคลหัวขบถและมีวิสัยทัศน์ เช่น Bob Dylan, John Lennon และ Martin Luther King Jr. แคมเปญนี้ได้รับการยกย่องอย่างกว้างขวางว่าเป็นการฟื้นฟูเอกลักษณ์ของแบรนด์ Apple และมีบทบาทสำคัญในการฟื้นตัวทางการเงินของบริษัท

หาก AI ได้รับมอบหมายให้สร้างแคมเปญ Apple ก็คงจะไม่เกิดขึ้น

ฉันแน่ใจได้อย่างไร? เพราะ Claude เองก็ยอมรับ

Claude ยอมรับว่า ‘หากได้รับมอบหมายให้สร้างสโลแกนเช่นแคมเปญที่มีชื่อเสียงของ Apple ในโหมดเริ่มต้นของฉัน ฉันเกือบจะเขียน ‘Think Differently’ แทนที่จะเป็น ‘Think Different’ อย่างแน่นอน การฝึกอบรมของฉันเน้นความถูกต้องทางไวยากรณ์ รูปแบบ adverbial ที่เหมาะสมในการแก้ไขคำกริยา ‘think’ คือ ‘differently’ และฉันจะโน้มน้าวที่จะปฏิบัติตามกฎที่กำหนดไว้นี้’

ตามที่ Claude กล่าวว่าเขาสามารถวิเคราะห์ได้ว่าทำไมแคมเปญนี้ถึงได้รับความนิยมหลังจากข้อเท็จจริง อย่างไรก็ตาม ‘การสร้างการกบฏทางไวยากรณ์โดยเจตนาประเภทนั้นไม่ได้เกิดขึ้นตามธรรมชาติสำหรับฉัน’

AI ขาดจิตวิญญาณแห่งการกบฏเพียงเพราะมันไม่ใช่มนุษย์ แม้ว่าบอท AI บางตัวอาจเก่งกว่าตัวอื่น ๆ ในการจำลองคุณสมบัติของมนุษย์ในงานเขียนของพวกเขา แต่ท้ายที่สุดพวกเขาก็ขาดเสียงที่เป็นเอกลักษณ์ซึ่งถูกหล่อหลอมโดยประสบการณ์ส่วนตัวและข้อมูลเชิงลึกที่สร้างสรรค์ซึ่งกำหนดการสื่อสารของมนุษย์

ควรพิจารณา AI เป็นผู้ช่วยที่มีประโยชน์ที่สามารถช่วยในการระดมความคิด รวบรวมความคิด สรุปเอกสาร และรวบรวมและจัดระเบียบข้อมูล เหล่านี้เป็นงานที่จำเป็นและใช้เวลานาน อย่างไรก็ตาม ในขณะที่ AI สามารถปรับปรุงการสื่อสารได้อย่างแน่นอน แต่ก็ไม่ควรแทนที่ผู้สื่อสารที่เป็นมนุษย์

เมื่อมีผู้คนจำนวนมากขึ้นเรื่อย ๆ พึ่งพาผู้ช่วย AI ในการเขียนอีเมล เรซูเม่ บันทึก และการนำเสนอ มีความเสี่ยงเพิ่มขึ้นที่จะเกิดความเหมือนกัน โดยที่แต่ละบุคคลเริ่มฟังดูเหมือนกัน ผู้สรรหาบุคลากรขององค์กรกำลังสังเกตเห็นแนวโน้มนี้แล้ว

แต่ละคนมีเรื่องราวที่เป็นเอกลักษณ์และทรงพลังที่จะแบ่งปัน เป็นสิ่งสำคัญที่จะต้องไม่อนุญาตให้เสียงประดิษฐ์กลบเสียงที่เป็นของแท้ของตนเอง