最近、私はワシントン・ポストが主催するAI文章作成実験に参加しました。コミュニケーションの専門家が集まり、人気のある5つのAIツールを評価するというものです。テックレポーターのジェフリー・ファウラー氏は、これを従来の料理コンテストの現代版として位置づけ、AIツールが5種類の難易度の高い仕事用および個人的なメールをどれだけうまく処理できるかという挑戦を私たちに課しました。
なぜメールなのか?
ファウラー氏は、メールの作成が「AIがあなたの生活の中でできる、本当に役に立つことの1つです。そして、AIがメールの下書きで示すスキルは、他の種類の文章作成タスクにも応用できます」と説明しました。
審査員は、このブラインドテストで合計150通のメールを評価しました。1つのAIツールが明確な勝者として浮上しましたが、実験はAIによる文章作成およびコミュニケーションアシスタントの潜在的な利点と大きな限界の両方を浮き彫りにしました。
評価中、私たちはどのメールがChatGPT、Microsoft Copilot、Google Gemini、DeepSeek、またはAnthropicのClaudeによって生成されたものなのかを知りませんでした。ファウラー氏はまた、自身が書いたメールも含まれており、AIが生成したコンテンツと人間が書いたコンテンツを区別するように私たちに求めました。
トップのAI文章作成アシスタント
Claudeは、間違いなく勝者でした。
ファウラー氏は、「平均して、Claudeのメールは他のものよりも人間らしく感じられました」と述べています。別の審査員であるエリカ・ダーワン氏は、「Claudeは、過度に企業的または非個人的になることなく、正確で丁寧な言葉遣いをしています」と付け加えました。
DeepSeekが2位、続いてGemini、ChatGPT、Copilotの順で、Copilotは最下位でした。Windows、Word、Outlookで広く利用可能であるにもかかわらず、審査員はCopilotのメールがあまりにも人工的に聞こえると判断しました。ファウラー氏によると、「Copilotは、5つのテストのうち3つで、非常に一般的な『お元気ですか』というバリエーションでメッセージを開始しました。」
Claudeが全体的な競争で勝利したにもかかわらず、私の個々のスコアは、人間が書いたメールを好むことを明らかにしていることがわかりました。この好みは、すべてのAIアシスタントに共通する根本的な限界を浮き彫りにしました。
ファウラー氏は、審査員はどのメールが最高であるかについて常に同意していたわけではありませんが、核心的な問題に収束したと指摘しました。それは、信憑性です。彼は、「AIがその文章で技術的に『丁寧』であったとしても、人間には不誠実に感じられる可能性があります」と強調しました。
この実験から私が得た主な教訓は、AIツールは、アウトラインの作成、議論の構成、および明確さの確保に優れているということです。ただし、それらはしばしば、ぎこちなく、過度に形式的で、ロボット的で、パーソナライズ、感情、および共感に欠ける文章を作成します。
AIアシスタントが創造性に直面する課題は、大規模言語モデルの基盤となるアーキテクチャに由来します。これらのモデルは、「構文的コヒーレンス」を備えたコンテンツを生成するように設計されています。つまり、自然に流れ、文法規則に従う文章を文字列としてつなぎ合わせます。しかし、私たち全員が知っているように、規則は破られるために作られることもあります。
ルールブレーカー:スティーブ・ジョブズ
1997年、スティーブ・ジョブズのリーダーシップの下、Appleは歴史の中で最も記憶に残るマーケティングキャンペーンの1つを開始しました。当時、同社は倒産の危機に瀕しており、注目を集め、競合他社と差別化するキャンペーンが切実に必要でした。
その結果、有名な「クレイジーワンズ」として知られるテレビ広告は、ボブ・ディラン、ジョン・レノン、マーティン・ルーサー・キング・ジュニアなどの反抗的で先見の明のある人物の白黒のポートレートをフィーチャーしました。このキャンペーンは、Appleのブランドアイデンティティを活性化し、同社の財政回復において重要な役割を果たしたとして広く評価されています。
もしAIがAppleのキャンペーンを作成するように指示されていたら、おそらく実現しなかったでしょう。
なぜそう確信できるのでしょうか?それは、Claude自身が認めたからです。
Claudeは、「Appleの有名なキャンペーンのようなスローガンを作成するようにデフォルトモードで依頼された場合、『Think Different』ではなく、ほぼ確実に『Think Differently』と書いたでしょう。私のトレーニングは、文法的な正しさを重視しています。動詞『think』を修飾する適切な副詞の形は『differently』であり、私はこの確立された規則に従う傾向があります」と認めました。
Claudeによると、キャンペーンが後に共感を呼んだ理由を分析することはできます。ただし、「そのような意図的な文法的な反抗を生み出すことは、私にとっては自然なことではありません。」
AIには反抗的な精神が欠けています。それは単に人間ではないからです。一部のAIボットは、他のボットよりも人間の資質を文章でシミュレートすることに長けているかもしれませんが、最終的には、個人的な経験と創造的な洞察によって形作られた独自の声が欠けており、それが人間のコミュニケーションを定義します。
AIは、アイデアのブレインストーミング、思考の明確化、ドキュメントの要約、情報の収集と整理に役立つアシスタントとして捉えられるべきです。これらはすべて不可欠で時間のかかるタスクです。ただし、AIは確かにコミュニケーションを強化することができますが、人間のコミュニケーターに取って代わるべきではありません。
ますます多くの人々がメール、履歴書、メモ、プレゼンテーションの作成にAIアシスタントを利用するにつれて、個人が同じように聞こえ始める均質化のリスクが高まっています。企業の採用担当者はすでにこの傾向に気づいています。
各個人は、共有すべきユニークで強力なストーリーを持っています。人工的な声が自分の本物の声をかき消すことのないようにすることが不可欠です。