กังวล DeepSeek? Gemini ร้ายกว่าเรื่องข้อมูล

ข้อถกเถียงเรื่อง DeepSeek และการตอบสนองของอุตสาหกรรมเทคโนโลยีอเมริกัน

ในเดือนมกราคม DeepSeek บริษัทสัญชาติจีนได้เปิดตัวโมเดล AI แบบโอเพนซอร์ส ซึ่งสร้างความกังวลให้กับอุตสาหกรรมเทคโนโลยีของอเมริกา องค์กรเอกชนและภาครัฐต่างแสดงความกังวลเกี่ยวกับความเป็นส่วนตัวและความปลอดภัย และมีการสั่งห้ามใช้ DeepSeek ทั้งในประเทศและต่างประเทศ

ความกังวลหลักเกิดจากความเชื่อที่ว่า DeepSeek ซึ่งมีต้นกำเนิดในประเทศจีน อาจเป็นภัยต่อชาวอเมริกัน มีการกล่าวถึงความกลัวเกี่ยวกับการสอดแนม สงครามไซเบอร์ และภัยคุกคามความมั่นคงของชาติอื่นๆ นโยบายความเป็นส่วนตัวของ DeepSeek ระบุว่า: ‘ข้อมูลส่วนบุคคลที่เราเก็บรวบรวมจากคุณอาจถูกจัดเก็บไว้ในเซิร์ฟเวอร์ที่อยู่นอกประเทศที่คุณอาศัยอยู่ เราจัดเก็บข้อมูลที่เรารวบรวมไว้ในเซิร์ฟเวอร์ที่ปลอดภัยซึ่งตั้งอยู่ในสาธารณรัฐประชาชนจีน’

ข้อความนี้ถูกตีความว่าอาจเป็นช่องทางให้รัฐบาลจีนเข้าถึงข้อมูลผู้ใช้ที่ละเอียดอ่อน ความก้าวหน้าอย่างรวดเร็วของการพัฒนา AI ทั่วโลก และ ‘การแข่งขันด้าน AI’ ระหว่างสหรัฐอเมริกาและจีน ยิ่งเพิ่มความกังวลเหล่านี้ สร้างบรรยากาศของความไม่ไว้วางใจและคำถามทางจริยธรรม

การเปิดเผยที่น่าประหลาดใจ: ความอยากข้อมูลของ Gemini

อย่างไรก็ตาม ท่ามกลางความโกลาหลเกี่ยวกับ DeepSeek มีการเปิดเผยที่น่าประหลาดใจ แม้ว่าโมเดล AI ของจีนจะถูกตรวจสอบอย่างเข้มงวด แต่ DeepSeek ไม่ใช่ผู้รวบรวมข้อมูลที่สำคัญที่สุดในแวดวงแชทบอท การตรวจสอบล่าสุดโดย Surfshark ผู้ให้บริการ VPN ที่มีชื่อเสียง ได้เปิดเผยแนวทางปฏิบัติในการรวบรวมข้อมูลของแอปพลิเคชันแชทบอท AI ที่ได้รับความนิยมมากที่สุด

นักวิจัยได้วิเคราะห์รายละเอียดความเป็นส่วนตัวของแชทบอท 10 ตัว ที่มีอยู่ใน Apple App Store ได้แก่ ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude และ Pi การวิเคราะห์มุ่งเน้นไปที่สามประเด็นหลัก:

  1. ประเภทของข้อมูลที่รวบรวม: แอปพลิเคชันแต่ละตัวรวบรวมข้อมูลผู้ใช้ประเภทใดบ้าง
  2. การเชื่อมโยงข้อมูล: ข้อมูลที่รวบรวมมีการเชื่อมโยงโดยตรงกับข้อมูลประจำตัวของผู้ใช้หรือไม่
  3. ผู้โฆษณาบุคคลที่สาม: แอปพลิเคชันแบ่งปันข้อมูลผู้ใช้กับหน่วยงานโฆษณาภายนอกหรือไม่

ผลลัพธ์ที่ได้นั้นน่าตกใจ Gemini ของ Google กลายเป็นแอปแชทบอท AI ที่เก็บข้อมูลมากที่สุด แซงหน้าคู่แข่งในด้านปริมาณและความหลากหลายของข้อมูลส่วนบุคคลที่รวบรวม แอปพลิเคชันรวบรวมข้อมูลผู้ใช้ 22 ประเภท จาก 35 ประเภทที่เป็นไปได้ ซึ่งรวมถึงข้อมูลที่ละเอียดอ่อน เช่น:

  • ข้อมูลตำแหน่งที่แม่นยำ: ระบุตำแหน่งทางภูมิศาสตร์ที่แน่นอนของผู้ใช้
  • เนื้อหาของผู้ใช้: บันทึกเนื้อหาของการโต้ตอบของผู้ใช้ภายในแอป
  • รายชื่อผู้ติดต่อ: เข้าถึงรายชื่อผู้ติดต่อในอุปกรณ์ของผู้ใช้
  • ประวัติการเข้าชม: ติดตามกิจกรรมการท่องเว็บของผู้ใช้

การรวบรวมข้อมูลที่ครอบคลุมนี้ มากกว่าแชทบอทอื่น ๆ ที่ได้รับความนิยมในการศึกษานี้ DeepSeek ซึ่งเป็นประเด็นถกเถียงกันมาก อยู่ในอันดับที่ 5 จาก 10 แอปพลิเคชัน โดยรวบรวมข้อมูลที่ไม่ซ้ำกัน 11 ประเภท

ข้อมูลตำแหน่งและการแบ่งปันกับบุคคลที่สาม: การตรวจสอบอย่างใกล้ชิด

การศึกษายังเปิดเผยแนวโน้มที่น่ากังวลเกี่ยวกับข้อมูลตำแหน่งและการแบ่งปันข้อมูลกับบุคคลที่สาม มีเพียง Gemini, Copilot และ Perplexity เท่านั้นที่รวบรวมข้อมูลตำแหน่งที่แม่นยำ ซึ่งเป็นข้อมูลที่ละเอียดอ่อนซึ่งสามารถเปิดเผยข้อมูลเกี่ยวกับการเคลื่อนไหวและพฤติกรรมของผู้ใช้ได้มาก

ในวงกว้าง ประมาณ 30% ของแชทบอทที่วิเคราะห์ พบว่ามีการแบ่งปันข้อมูลผู้ใช้ที่ละเอียดอ่อน รวมถึงข้อมูลตำแหน่งและประวัติการเข้าชม กับหน่วยงานภายนอก เช่น นายหน้าข้อมูล การปฏิบัตินี้ทำให้เกิดความกังวลด้านความเป็นส่วนตัวอย่างมาก เนื่องจากเป็นการเปิดเผยข้อมูลผู้ใช้ไปยังเครือข่ายที่กว้างขึ้น ซึ่งอาจมีวัตถุประสงค์เกินกว่าที่ผู้ใช้จะรับรู้หรือควบคุมได้

การติดตามข้อมูลผู้ใช้: การโฆษณาแบบกำหนดเป้าหมายและอื่น ๆ

การค้นพบที่น่าตกใจอีกประการหนึ่งคือ การติดตามข้อมูลผู้ใช้สำหรับการโฆษณาแบบกำหนดเป้าหมายและวัตถุประสงค์อื่น ๆ 30% ของแชทบอท ได้แก่ Copilot, Poe และ Jasper พบว่ามีการรวบรวมข้อมูลเพื่อติดตามผู้ใช้ ซึ่งหมายความว่าข้อมูลผู้ใช้ที่รวบรวมจากแอปจะเชื่อมโยงกับข้อมูลของบุคคลที่สาม ทำให้สามารถโฆษณาแบบกำหนดเป้าหมายหรือวัดประสิทธิภาพการโฆษณาได้

Copilot และ Poe พบว่ามีการรวบรวม ID อุปกรณ์เพื่อวัตถุประสงค์นี้ ในขณะที่ Jasper รวบรวมข้อมูล ID อุปกรณ์ ข้อมูลการโต้ตอบกับผลิตภัณฑ์ ข้อมูลการโฆษณา และ ‘ข้อมูลอื่น ๆ เกี่ยวกับกิจกรรมของผู้ใช้ในแอป’ ตามที่ผู้เชี่ยวชาญของ Surfshark กล่าว

DeepSeek: ไม่ดีที่สุด ไม่แย่ที่สุด

โมเดล DeepSeek R1 ที่เป็นข้อถกเถียง แม้จะถูกตรวจสอบอย่างเข้มงวด แต่ก็อยู่ในระดับกลางในแง่ของการรวบรวมข้อมูล โดยรวบรวมข้อมูลที่ไม่ซ้ำกันโดยเฉลี่ย 11 ประเภท โดยเน้นที่:

  • ข้อมูลติดต่อ: ชื่อ ที่อยู่อีเมล หมายเลขโทรศัพท์ ฯลฯ
  • เนื้อหาของผู้ใช้: เนื้อหาที่สร้างโดยผู้ใช้ภายในแอป
  • การวินิจฉัย: ข้อมูลที่เกี่ยวข้องกับประสิทธิภาพของแอปและการแก้ไขปัญหา

แม้ว่าจะไม่ใช่แชทบอทที่เคารพความเป็นส่วนตัวมากที่สุด แต่แนวทางปฏิบัติในการรวบรวมข้อมูลของ DeepSeek นั้นน้อยกว่าคู่แข่งบางรายในสหรัฐอเมริกา โดยเฉพาะ Gemini

ChatGPT: มุมมองเปรียบเทียบ

สำหรับการเปรียบเทียบ ChatGPT ซึ่งเป็นหนึ่งในแชทบอท AI ที่ใช้กันอย่างแพร่หลายที่สุด รวบรวมข้อมูลที่ไม่ซ้ำกัน 10 ประเภท ซึ่งรวมถึง:

  • ข้อมูลติดต่อ
  • เนื้อหาของผู้ใช้
  • ตัวระบุ
  • ข้อมูลการใช้งาน
  • การวินิจฉัย

สิ่งสำคัญคือต้องทราบว่า ChatGPT ยังรวบรวมประวัติการแชท อย่างไรก็ตาม ผู้ใช้มีตัวเลือกในการใช้ ‘Temporary chat’ ซึ่งเป็นคุณสมบัติที่ออกแบบมาเพื่อลดปัญหานี้โดยไม่จัดเก็บประวัติการสนทนา

นโยบายความเป็นส่วนตัวของ DeepSeek: การควบคุมของผู้ใช้และการลบข้อมูล

นโยบายความเป็นส่วนตัวของ DeepSeek แม้ว่าจะเป็นแหล่งที่มาของความกังวลสำหรับบางคน แต่ก็มีข้อกำหนดสำหรับการควบคุมของผู้ใช้เกี่ยวกับประวัติการแชท นโยบายระบุว่าผู้ใช้สามารถจัดการประวัติการแชทและมีตัวเลือกในการลบผ่านการตั้งค่า ซึ่งให้ระดับการควบคุมที่ไม่ได้มีอยู่ในแอปพลิเคชันแชทบอทอื่น ๆ เสมอไป

บริบทที่กว้างขึ้น: การพัฒนา AI และพลวัตของสหรัฐฯ-จีน

ความกังวลเกี่ยวกับ DeepSeek และการถกเถียงในวงกว้างเกี่ยวกับความเป็นส่วนตัวของข้อมูล AI เชื่อมโยงอย่างแยกไม่ออกกับการเร่งตัวของการพัฒนา AI ทั่วโลก และการแข่งขันด้าน AI ระหว่างสหรัฐอเมริกาและจีน บริบททางภูมิรัฐศาสตร์นี้เพิ่มความซับซ้อนให้กับปัญหา ทำให้เกิดความวิตกกังวลเกี่ยวกับความมั่นคงของชาติ และศักยภาพในการใช้เทคโนโลยี AI ในทางที่ผิด

อย่างไรก็ตาม ผลการศึกษาของ Surfshark เป็นเครื่องเตือนใจที่สำคัญว่า ความกังวลด้านความเป็นส่วนตัวของข้อมูลไม่ได้จำกัดอยู่แค่โมเดล AI ที่พัฒนาในประเทศใดประเทศหนึ่ง ผู้รวบรวมข้อมูลที่ร้ายแรงที่สุดในบรรดาแชทบอทที่ได้รับความนิยมที่วิเคราะห์ คือ แอปพลิเคชันในสหรัฐอเมริกา สิ่งนี้เน้นย้ำถึงความจำเป็นในการใช้แนวทางที่ครอบคลุมและละเอียดอ่อนยิ่งขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูล AI ซึ่งอยู่เหนือพรมแดนของประเทศ และมุ่งเน้นไปที่แนวทางปฏิบัติของแต่ละบริษัท และมาตรการป้องกันที่พวกเขาใช้ ผู้ใช้จำเป็นต้องได้รับแจ้งเกี่ยวกับแนวทางปฏิบัติในการรวบรวมข้อมูลของเครื่องมือ AI ที่พวกเขาใช้ โดยไม่คำนึงถึงแหล่งที่มา และต้องมีกฎระเบียบที่เข้มงวดเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ในภูมิทัศน์ AI ที่มีการพัฒนาอย่างรวดเร็ว การมุ่งเน้นควรอยู่ที่การกำหนดมาตรฐานที่ชัดเจนสำหรับการรวบรวม การใช้ และการแบ่งปันข้อมูล การรับรองความโปร่งใสและการควบคุมของผู้ใช้ และการให้บริษัทรับผิดชอบต่อแนวทางปฏิบัติด้านข้อมูลของตน