Google Gemini ยกระดับเครื่องมือสร้างภาพ

Google ได้ทำการอัปเกรดแอปพลิเคชันแชทบอท Gemini ซึ่งช่วยให้คุณสามารถแก้ไขภาพที่สร้างโดย AI รวมถึงภาพที่อัปโหลดจากโทรศัพท์หรือคอมพิวเตอร์ของคุณได้ การแก้ไขภาพแบบเนทีฟใน Gemini จะเริ่มทยอยเปิดตัวตั้งแต่วันนี้เป็นต้นไป บริการนี้จะขยายไปยังผู้คนในประเทศส่วนใหญ่ในอีกไม่กี่สัปดาห์ข้างหน้า และจะรองรับมากกว่า 45 ภาษา

การเปิดตัวครั้งนี้เกิดขึ้นหลังจากที่ Google ได้ทดลองใช้โมเดลแก้ไขภาพ AI ในแพลตฟอร์ม AI Studio ในเดือนมีนาคม ซึ่งโมเดลนี้แพร่กระจายอย่างรวดเร็วเนื่องจากความสามารถที่เป็นที่ถกเถียงกันในการลบลายน้ำออกจากภาพใดๆ ก็ตาม เช่นเดียวกับเครื่องมือแก้ไขภาพที่ได้รับการอัปเกรดล่าสุดของ ChatGPT เครื่องมือแก้ไขภาพแบบเนทีฟใหม่ของ Gemini ในทางทฤษฎีแล้วสามารถให้ผลลัพธ์ที่ดีกว่าเครื่องมือสร้างภาพ AI แบบสแตนด์อโลน

Gemini นำเสนอขั้นตอนการแก้ไข ‘หลายขั้นตอน’ ซึ่งให้สิ่งที่บริษัทเรียกว่าการตอบสนองที่ ‘สมบูรณ์และมีบริบทมากขึ้น’ โดยแต่ละข้อความแจ้งจะรวมข้อความและรูปภาพเข้าด้วยกัน คุณสามารถเปลี่ยนพื้นหลังของรูปภาพ แทนที่วัตถุ เพิ่มองค์ประกอบ และอื่นๆ ใน Gemini ได้

ตัวอย่างเช่น คุณสามารถอัปโหลดภาพถ่ายบุคคลและแจ้งให้ Gemini สร้างภาพถ่ายของคุณที่มีสีผมต่างกัน คุณสามารถขอให้ Gemini สร้างฉบับร่างเรื่องก่อนนอนเกี่ยวกับมังกรและจัดเตรียมรูปภาพที่เข้ากับเรื่องราวได้

หากฟังดูมีความเสี่ยงที่จะเกิด Deepfake นั่นก็เป็นเรื่องที่สมเหตุสมผล เพื่อลดความกังวล ตามข้อมูลของ Google รูปภาพที่สร้างหรือแก้ไขโดยใช้การสร้างภาพแบบเนทีฟของ Gemini จะมีลายน้ำที่มองไม่เห็น นอกจากนี้ บริษัทยัง ‘ทดลอง’ ลายน้ำที่มองเห็นได้บนรูปภาพที่สร้างโดย Gemini ทั้งหมด

เจาะลึกฟังก์ชันแก้ไขภาพของ Gemini

การอัปเกรดล่าสุดของ Google สำหรับแชทบอท Gemini ถือเป็นก้าวสำคัญในด้านการประมวลผลภาพด้วยปัญญาประดิษฐ์ Gemini มีความสามารถในการแก้ไขภาพที่สร้างโดย AI รวมถึงภาพที่ผู้ใช้อัปโหลด ซึ่งมีแนวโน้มที่จะปฏิวัติวิธีที่เราโต้ตอบกับเนื้อหาภาพดิจิทัล มาเจาะลึกคุณสมบัติและความหมายที่การอัปเดตนี้มอบให้

การควบคุมผู้ใช้ที่เพิ่มขึ้น

คุณสมบัติที่โดดเด่นอย่างหนึ่งของ Gemini คือการควบคุมผู้ใช้ที่เพิ่มขึ้น ในอดีต ผู้ใช้ส่วนใหญ่มักถูกจำกัดด้วยเอาต์พุตของเครื่องมือสร้างภาพ AI แม้ว่าเครื่องมือสร้างเหล่านี้จะสามารถสร้างภาพที่น่าประทับใจได้ แต่ความสามารถในการปรับแต่งและปรับแต่งด้านต่างๆ โดยเฉพาะนั้นมีจำกัด Gemini แก้ไขข้อจำกัดนี้โดยอนุญาตให้ผู้ใช้แก้ไขภาพที่สร้างโดย AI

ผู้ใช้สามารถอัปโหลดภาพของตนเองและใช้เครื่องมือของ Gemini เพื่อทำการเปลี่ยนแปลงได้ การควบคุมในระดับนี้เปิดโอกาสใหม่ๆ สำหรับการแสดงออกอย่างสร้างสรรค์และการปรับเปลี่ยนในแบบของคุณ ไม่ว่าจะเป็นการปรับสี การเพิ่มองค์ประกอบ หรือการเปลี่ยนพื้นหลัง ตอนนี้ผู้ใช้สามารถมีอิสระอย่างที่ไม่เคยมีมาก่อนในการสร้างเนื้อหาภาพ

ขั้นตอนการแก้ไขหลายขั้นตอน

ขั้นตอนการแก้ไข ‘หลายขั้นตอน’ ที่ Gemini นำมาใช้ช่วยเพิ่มประสบการณ์การใช้งานมากยิ่งขึ้น ขั้นตอนนี้อนุญาตให้ผู้ใช้โต้ตอบกับ AI ในลักษณะที่วนซ้ำและมีบริบท ผู้ใช้สามารถเริ่มต้นคำขอแก้ไขได้โดยการให้ข้อความแจ้งและรูปภาพ จากนั้น Gemini จะวิเคราะห์ข้อมูลที่ป้อนและสร้างการตอบสนองที่รวมข้อความและรูปภาพเข้าด้วยกัน

วิธีการหลายขั้นตอนนี้ช่วยให้การแก้ไขที่ซับซ้อนและละเอียดอ่อนยิ่งขึ้น ตัวอย่างเช่น ผู้ใช้สามารถขอให้ Gemini เปลี่ยนพื้นหลังของรูปภาพ จากนั้น AI จะวิเคราะห์รูปภาพและสร้างเวอร์ชันที่แก้ไขด้วยพื้นหลังที่แตกต่างกัน ผู้ใช้สามารถปรับแต่งคำขอเพิ่มเติม โดยระบุองค์ประกอบหรือสไตล์พื้นหลังที่เฉพาะเจาะจง Gemini จะตอบสนองต่อข้อความแจ้งเหล่านี้ซ้ำๆ จนกว่าจะได้ผลลัพธ์ที่ต้องการ

แอปพลิเคชั่นสร้างสรรค์ที่ไร้ขีดจำกัด

ฟังก์ชันแก้ไขภาพของ Gemini มีแอปพลิเคชั่นสร้างสรรค์มากมาย ตัวอย่างบางส่วน ได้แก่:

  • อวตารส่วนบุคคล: ผู้ใช้สามารถอัปโหลดรูปภาพของตนเองและใช้ Gemini เพื่อลองทรงผม เสื้อผ้า และเครื่องประดับต่างๆ สิ่งนี้สามารถช่วยให้พวกเขาเห็นภาพรูปลักษณ์ที่แตกต่างกัน หรือเพียงเพื่อความสนุกสนาน
  • การปรับปรุงภาพถ่าย: ผู้ใช้สามารถใช้ Gemini เพื่อซ่อมแซมภาพถ่ายเก่าหรือปรับปรุงคุณภาพของภาพถ่าย AI สามารถลบรอยขีดข่วน ปรับสี และเพิ่มความคมชัดของรายละเอียด ทำให้ความทรงจำอันล้ำค่ากลับมามีชีวิตชีวาอีกครั้ง
  • การสร้างมีมและภาพตลก: Gemini สามารถใช้เพื่อสร้างมีมและภาพตลก ผู้ใช้สามารถอัปโหลดรูปภาพและขอให้ AI เพิ่มข้อความ สติกเกอร์ หรือองค์ประกอบอื่นๆ เพื่อสร้างเนื้อหาที่ตลกขบขันหรือน่าสนใจ
  • การออกแบบสื่อการตลาด: Gemini สามารถใช้เพื่อออกแบบสื่อการตลาด เช่น โพสต์บนโซเชียลมีเดีย แบนเนอร์โฆษณา และโปสเตอร์ AI สามารถช่วยผู้ใช้สร้างภาพที่ดึงดูดสายตา ซึ่งทั้งสวยงามและมีประสิทธิภาพ
  • การสร้างงานศิลปะ: Gemini สามารถใช้เพื่อสร้างงานศิลปะ ผู้ใช้สามารถให้ข้อความแจ้งหรือแรงบันดาลใจ และ AI จะสร้างภาพที่ไม่เหมือนใครและสร้างสรรค์ สิ่งนี้สามารถใช้เป็นแหล่งแรงบันดาลใจสำหรับศิลปินและนักออกแบบ หรือเพียงเพื่อสนุกกับการสร้างสรรค์งานศิลปะ

ความเสี่ยงที่อาจเกิดขึ้นและมาตรการบรรเทาผลกระทบ

แม้ว่าฟังก์ชันแก้ไขภาพของ Gemini จะมีประโยชน์มากมาย แต่ก็จำเป็นต้องตระหนักถึงความเสี่ยงที่อาจเกิดขึ้น ข้อกังวลหลักอย่างหนึ่งคือการสร้าง Deepfake Deepfake หมายถึงรูปภาพหรือวิดีโอที่ถูกดัดแปลงโดยใช้เทคโนโลยี AI เพื่อแสดงให้เห็นว่าใครบางคนกำลังทำหรือพูดในสิ่งที่พวกเขาไม่ได้ทำหรือพูดจริงๆ

Deepfake มีศักยภาพในการเผยแพร่ข้อมูลเท็จ ทำลายชื่อเสียง และยุยงให้เกิดความไม่ไว้วางใจ เพื่อลดความเสี่ยงเหล่านี้ Google กำลังใช้มาตรการรักษาความปลอดภัยหลายอย่าง ประการแรก รูปภาพที่สร้างหรือแก้ไขโดยใช้การสร้างภาพแบบเนทีฟของ Gemini จะมีลายน้ำที่มองไม่เห็น ลายน้ำนี้สามารถช่วยระบุรูปภาพที่ได้รับการดัดแปลงโดยใช้เทคโนโลยี AI ได้

นอกจากนี้ Google ยัง ‘ทดลอง’ ลายน้ำที่มองเห็นได้บนรูปภาพที่สร้างโดย Gemini ทั้งหมด ลายน้ำที่มองเห็นได้เหล่านี้จะช่วยยับยั้งการใช้งานเครื่องมือในทางที่ผิด สิ่งสำคัญที่ควรทราบคือมาตรการรักษาความปลอดภัยเหล่านี้ไม่ได้สมบูรณ์แบบ ผู้กระทำที่ไม่หวังดีอาจยังพบวิธีหลีกเลี่ยงมาตรการเหล่านี้ อย่างไรก็ตาม มาตรการเหล่านี้ให้การป้องกันเพิ่มเติมอีกชั้นหนึ่งและช่วยลดความเสี่ยงของ Deepfake

ผลกระทบของ Gemini

การเปิดตัวฟังก์ชันแก้ไขภาพของ Gemini มีผลกระทบอย่างมีนัยสำคัญต่อผู้มีส่วนได้ส่วนเสียต่างๆ

ผู้สร้างเนื้อหา

ผู้สร้างเนื้อหาสามารถใช้ Gemini เพื่อปรับปรุงเนื้อหาภาพของตนและปรับปรุงขั้นตอนการทำงาน ด้วยความสามารถในการแก้ไขภาพ ผู้สร้างสามารถทำการเปลี่ยนแปลงอย่างรวดเร็ว ทดลองกับสไตล์ที่แตกต่างกัน และสร้างภาพที่น่าสนใจ สิ่งนี้สามารถประหยัดเวลาและความพยายาม ในขณะที่ยังปรับปรุงคุณภาพโดยรวมของเนื้อหา

ธุรกิจ

ธุรกิจสามารถใช้ Gemini เพื่อสร้างภาพที่น่าสนใจสำหรับแคมเปญการตลาดของตน AI สามารถช่วยสร้างภาพที่ดึงดูดสายตาและสอดคล้องกับภาพลักษณ์ของแบรนด์ นอกจากนี้ ธุรกิจสามารถใช้ Gemini เพื่อสร้างแบบจำลองที่เหมือนจริงสำหรับผลิตภัณฑ์ของตน ช่วยให้ลูกค้า ‘ลอง’ ผลิตภัณฑ์ก่อนตัดสินใจซื้อ

นักการศึกษา

นักการศึกษาสามารถใช้ Gemini เพื่อสร้างสื่อช่วยสอนที่น่าสนใจและประสบการณ์การเรียนรู้แบบโต้ตอบ AI สามารถช่วยสร้างภาพประกอบ แผนภาพ และการแสดงภาพอื่นๆ ทำให้แนวคิดที่ซับซ้อนเข้าใจได้ง่ายขึ้น นอกจากนี้ นักการศึกษาสามารถใช้ Gemini เพื่อสร้างประสบการณ์การเรียนรู้ส่วนบุคคลที่ตอบสนองความต้องการเฉพาะของนักเรียนแต่ละคน

นักวิจัย

นักวิจัยสามารถใช้ Gemini เพื่อวิเคราะห์และแสดงภาพข้อมูล AI สามารถช่วยสร้างการแสดงภาพของปรากฏการณ์ที่ซับซ้อน ทำให้ง่ายต่อการระบุรูปแบบและแนวโน้ม นอกจากนี้ นักวิจัยสามารถใช้ Gemini เพื่อจำลองสถานการณ์ในโลกแห่งความเป็นจริงและทดสอบสมมติฐานที่แตกต่างกัน

บุคคลทั่วไป

บุคคลทั่วไปสามารถใช้ Gemini เพื่อความบันเทิง หรือปรับปรุงโครงการส่วนตัวของตน AI สามารถช่วยสร้างอวตารที่ไม่เหมือนใคร ปรับแต่งภาพถ่าย และสร้างงานศิลปะดิจิทัล นอกจากนี้ บุคคลทั่วไปสามารถใช้ Gemini เพื่อซ่อมแซมภาพถ่ายเก่า ปรับปรุงคุณภาพของภาพถ่าย และเก็บรักษาความทรงจำอันล้ำค่า

การพัฒนาในอนาคต

ฟังก์ชันแก้ไขภาพของ Gemini เป็นเพียงจุดเริ่มต้นในด้านการประมวลผลภาพด้วยปัญญาประดิษฐ์ เมื่อเทคโนโลยี AI พัฒนาอย่างต่อเนื่อง เราสามารถคาดหวังถึงความก้าวหน้าที่น่าตื่นเต้นยิ่งขึ้นในอนาคต การพัฒนาในอนาคตที่เป็นไปได้บางส่วน ได้แก่:

  • ความสมจริงที่เพิ่มขึ้น: ภาพที่สร้างโดย AI จะมีความสมจริงมากขึ้นเรื่อยๆ จนยากที่จะแยกแยะออกจากภาพถ่ายจริง สิ่งนี้จะเปิดโอกาสใหม่ๆ สำหรับแอปพลิเคชั่นต่างๆ เช่น ความเป็นจริงเสมือน ความเป็นจริงเสริม และเกม
  • ระบบอัตโนมัติที่สูงขึ้น: AI จะมีความสามารถในการทำงานโดยอัตโนมัติในการแก้ไขภาพมากขึ้น ลดปริมาณงานด้วยตนเองที่ผู้ใช้ต้องทำ ตัวอย่างเช่น AI อาจปรับปรุงคุณภาพของภาพถ่ายโดยอัตโนมัติ ลบวัตถุที่ไม่ต้องการ หรือเปลี่ยนสไตล์ของภาพ
  • ความคิดสร้างสรรค์ที่มากขึ้น: AI จะมีความสามารถในการสร้างภาพที่สร้างสรรค์และเป็นต้นฉบับมากขึ้น AI อาจได้รับแรงบันดาลใจจากข้อความแจ้งหรือแรงบันดาลใจที่ผู้ใช้ให้มา และสร้างภาพที่ไม่เหมือนใครและสร้างสรรค์ สิ่งนี้จะเปิดโอกาสใหม่ๆ สำหรับศิลปินและนักออกแบบ และนำไปสู่การเกิดขึ้นของรูปแบบศิลปะใหม่ๆ
  • มาตรการรักษาความปลอดภัยที่ปรับปรุงแล้ว: AI จะมีความสามารถในการตรวจจับและป้องกันการสร้าง Deepfake มากขึ้น AI อาจวิเคราะห์รูปภาพและวิดีโอเพื่อระบุสัญญาณของการถูกดัดแปลง สิ่งนี้จะช่วยลดการแพร่กระจายของข้อมูลเท็จและปกป้องผู้คนจากอันตรายของ Deepfake
  • การเข้าถึงที่กว้างขึ้น: เทคโนโลยีแก้ไขภาพ AI จะมีการใช้งานอย่างแพร่หลายมากขึ้น ในราคาที่ต่ำกว่า สิ่งนี้จะช่วยให้บุคคลและองค์กรสามารถใช้ประโยชน์จากเทคโนโลยีเหล่านี้เพื่อวัตถุประสงค์ในการสร้างสรรค์ ทางวิชาชีพ หรือส่วนตัว

โดยสรุป การอัปเกรดแชทบอท Gemini ของ Google ถือเป็นความก้าวหน้าที่สำคัญในด้านการประมวลผลภาพด้วยปัญญาประดิษฐ์ ด้วยความสามารถในการแก้ไขภาพที่สร้างโดย AI และภาพที่ผู้ใช้อัปโหลด Gemini เปิดโอกาสใหม่ๆ สำหรับการแสดงออกอย่างสร้างสรรค์ การปรับเปลี่ยนในแบบของคุณ และประสิทธิภาพ แม้ว่าจะมี