Google Gemini ใน Chrome: อนาคตของ Agentic | th

Google ได้ทำการรวม Gemini เข้ากับ Chrome ซึ่งถือเป็นก้าวแรกที่สำคัญสู่ยุคแห่ง Agentic สำหรับยักษ์ใหญ่ด้านเทคโนโลยีรายนี้ คุณสมบัติใหม่นี้ฝังผู้ช่วย AI ไว้ใน Browser ของคุณโดยตรง ช่วยให้สามารถ “มองเห็น” กิจกรรมออนไลน์ของคุณและให้ข้อมูลสรุปและคำตอบที่เกี่ยวข้องกับเนื้อหาบนหน้าจอของคุณได้

เช้าวันหนึ่งกับ Gemini ใน Chrome

การทดลองของฉันกับ Gemini ใน Chrome ซึ่งเป็นการผสานรวมรูปแบบใหม่นี้ ใช้เวลาตลอดช่วงเช้าของฉัน แทนที่จะไปยังแอปพลิเคชันบนเว็บเฉพาะของ Chatbot เพียงแค่คลิกที่ไอคอน Gemini ใหม่ ซึ่งตั้งอยู่ในมุมขวาบนของ Chrome อย่างสะดวก ก็จะเริ่มการสนทนาได้ ลักษณะสำคัญของการผสานรวมนี้อยู่ที่ความสามารถของ Browser ในการ “มองเห็น” เนื้อหาที่แสดงบนหน้าจอของคุณขณะที่คุณท่องเว็บ

การผสานรวมนี้ทำให้ฉันรู้สึกเหมือนเป็นก้าวแรกในวิสัยทัศน์อันยิ่งใหญ่ของ Google ในการสร้าง AI ที่เป็น Agentic มากขึ้น ฉันพบว่าตัวเองปรารถนาฟังก์ชันการทำงานที่มากกว่าความสามารถในปัจจุบันบ่อยครั้ง ปัจจุบัน การเข้าถึง Gemini ใน Chrome เวอร์ชันเข้าใช้งานล่วงหน้านั้น จำกัดเฉพาะสมาชิกของ AI Pro หรือ AI Ultra โดยใช้ Chrome เวอร์ชัน Beta, Dev หรือ Canary เท่านั้น

การสำรวจครั้งแรกของฉันเกี่ยวข้องกับการใช้ Gemini เพื่อสรุปบทความใน The Verge นอกจากนี้ยังขยายไปถึงการค้นหาข่าวสารที่เกี่ยวข้องกับการเล่นเกมบนหน้าแรก ซึ่ง AI ได้เน้นย้ำถึงการเพิ่มเกม Game Boy ใหม่ของ Nintendo ในบริการ Switch Online, ภาพยนตร์ Elden Ring ที่กำลังจะมาถึง และการอัปเดต Steam Deck ครั้งใหญ่ของ Valve อย่างเหมาะสม

ขอบเขตการมองเห็นของ Gemini จำกัดอยู่แค่สิ่งที่แสดงบนแต่ละหน้าเว็บโดยตรง หากคุณต้องการสรุปองค์ประกอบเฉพาะบนหน้า เช่น ส่วนความคิดเห็นของ The Verge จะต้องขยายก่อนที่ Chatbot จะให้การตอบสนอง นอกจากนี้ Gemini ยังสามารถติดตามคุณผ่านหลาย Tab ได้ แต่จะรวบรวมข้อมูลจากครั้งละหนึ่ง Tab เท่านั้น

สำหรับผู้ที่ไม่ชอบพิมพ์ Gemini ใน Chrome มีคุณสมบัติ “สด” ซึ่งสามารถเข้าถึงได้ผ่านปุ่มที่มุมล่างขวาของกล่องโต้ตอบ การเปิดใช้งานคุณสมบัตินี้จะช่วยให้คุณถามคำถามด้วยวาจาได้ โดย Gemini จะตอบกลับด้วยเสียง

ฉันพบว่าสิ่งนี้มีประโยชน์อย่างยิ่งเมื่อดูวิดีโอ YouTube ตัวอย่างเช่น เมื่อฉันกำลังดูวิดีโอเกี่ยวกับการปรับปรุงห้องน้ำ ฉันถามว่า “เขาใช้เครื่องมืออะไรอยู่” Gemini ตอบว่า “ดูเหมือนว่าเขากำลังใช้ปืนยิงตะปูเพื่อยึดชิ้นส่วนไม้เข้าด้วยกัน” ในระหว่างวิดีโออื่น Gemini ระบุตัวเก็บประจุบนเมนบอร์ดได้อย่างถูกต้อง พร้อมกับแหนบและเครื่องมือลมร้อนที่ YouTuber ใช้ในการถอดออก นอกจากนี้ยังมีขีดความสามารถในการให้ข้อมูลสรุปของวิดีโอและข้อมูลเกี่ยวกับส่วนที่คุณข้ามไป อย่างไรก็ตาม ฉันพบว่าสิ่งนี้ไม่ถูกต้องเสมอไปหากวิดีโอไม่มีบทที่ระบุ

หนึ่งในกรณีการใช้งานที่สำคัญที่สุดสำหรับการผสานรวมนี้คือ Gemini ดึงสูตรอาหารจากวิดีโอ YouTube ซึ่งหมายความว่าฉันไม่ต้องจดสูตรอาหารเองหรือค้นหาลิงก์ในคำอธิบาย นอกจากนี้ยังมีประโยชน์เมื่อฉันขอให้ชี้เป้าไปที่กระเป๋ากันน้ำในหน้าค้นหา Amazon

ความไม่สอดคล้องกันและข้อจำกัด

อย่างไรก็ตาม ประสิทธิภาพของ Gemini ก็ไม่ได้ปราศจากความไม่สอดคล้องกัน เมื่อถูกถามเกี่ยวกับสถานที่ตั้งของ MrBeast ในระหว่างวิดีโอที่แสดงการสำรวจเมืองมายันโบราณของเขา รวมถึง Chichén Itzá AI ตอบว่า “ฉันไม่สามารถเข้าถึงข้อมูลแบบเรียลไทม์ได้ ดังนั้นฉันจึงไม่สามารถระบุสถานที่ตั้งปัจจุบันที่แน่นอนของ MrBeast ได้” เมื่อเรียบเรียงคำถามใหม่ AI ก็อ้างถึงสถานที่ที่กล่าวถึงในคำอธิบายของวิดีโอได้อย่างแม่นยำ: เม็กซิโก ในโอกาสอื่น เมื่อต้องการลิงก์สำหรับซื้อคีมเฉพาะที่แสดงในวิดีโอ Gemini ย้ำถึงการขาดการเข้าถึงข้อมูลแบบเรียลไทม์ รวมถึงรายการผลิตภัณฑ์หรือสินค้าคงคลังของร้านค้า แม้จะมีข้อจำกัดนี้ แต่ก็ให้ลิงก์ไปยังผลิตภัณฑ์ทางเลือกอื่นได้อย่างง่ายดายเมื่อมีการร้องขอ

ในบางครั้ง ความยาวของการตอบสนองของ Gemini ดูเหมือนจะไม่สมส่วนกับพื้นที่จำกัดที่จัดเตรียมไว้ให้โดยหน้าต่าง Pop-up ใน Chrome แม้ว่าหน้าต่างจะสามารถขยายได้ แต่ก็รุกล้ำพื้นที่หน้าจอที่จำกัดอยู่แล้วของ MacBook Air ขนาด 13 นิ้วได้อย่างมาก สิ่งที่ดึงดูดใจหลักของ AI อยู่ที่ความสามารถในการเร่งงานโดยการให้คำตอบที่กระชับและตรงประเด็น ซึ่งเป็นสัญญาที่ Gemini ไม่ได้ปฏิบัติตามเสมอไปเว้นแต่จะมีการแจ้งอย่างชัดเจน นอกจากนี้ คำถามติดตามผลซ้ำๆ ของ AI ที่ถามว่าฉันต้องการข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อใดหัวข้อหนึ่งหรือไม่ กลายเป็นเรื่องที่น่าเบื่อหน่ายไปบ้าง

เส้นทางสู่ Agentic AI

แม้จะมีข้อบกพร่องเหล่านี้ แต่ก็เป็นเรื่องง่ายที่จะจินตนาการถึง Google ที่ขยายการใช้ Gemini ให้มากกว่าเพียงแค่คำถามและคำตอบง่ายๆ Google ต้องการให้ AI ของตนกลายเป็น "Agentic" ซึ่งหมายความว่าสามารถทำงานในนามของคุณได้ และ Gemini ใน Chrome ดูเหมือนจะพร้อมที่จะนำคุณสมบัติเหล่านี้มาใช้ในวันหนึ่ง ตัวอย่างเช่น หลังจากขอให้ Gemini สรุปเมนูของร้านอาหาร ฉันถึงกับคิดที่จะขอให้สั่งอาหารมารับประทาน ซึ่งเป็นงานของ Agentic ที่ยังทำไม่ได้ ในอนาคต ฉันอาจเห็นว่ามันมีประโยชน์โดยให้คั่นหน้าหน้าเว็บที่เกี่ยวข้องกับการวิจัยการเดินทางให้ฉัน หรือแม้แต่ค้นหาและบันทึกวิดีโอ YouTube ของสูตรอาหารต่างๆ ลงในเพลย์ลิสต์ดูภายหลังของฉัน

Google ดูเหมือนจะก้าวหน้าไปสู่การตระหนักถึงวิสัยทัศน์นี้ด้วย "Agent Mode" ของ Project Mariner ที่มีกำหนดสำหรับแอป Gemini คุณสมบัติ นี้จะให้อำนาจแก่ AI ในการจัดการงานได้มากถึง 10 งานพร้อมกันและค้นหาเว็บอย่างอิสระ โดยมีศักยภาพในการปูทางสำหรับการรวมความสามารถเหล่านี้เข้ากับ Gemini ใน Chrome ในอนาคต ซึ่งจะนำไปสู่การที่ Gemini มีส่วนร่วมในการค้นหาเว็บมากขึ้น และทำให้การจัดระเบียบงานและการสอบถามง่ายขึ้น

แอปพลิเคชันในอนาคตที่มีศักยภาพ

ความเป็นไปได้สำหรับแอปพลิเคชันในอนาคตของ Gemini ภายใน Chrome นั้นมีมากมายและน่าสนใจ ลองจินตนาการถึงสถานการณ์ที่ AI ผสานรวมเข้ากับประสบการณ์การ Shopping ออนไลน์ของคุณได้อย่างราบรื่น โดยระบุข้อเสนอที่ดีที่สุด เปรียบเทียบราคาระหว่างผู้ค้าปลีกต่างๆ และแม้กระทั่งดำเนินการซื้อแทนคุณ ทั้งหมดนี้เป็นไปตามความชอบและงบประมาณที่กำหนดไว้ล่วงหน้าของคุณ ระดับของการผสานรวมนี้จะเปลี่ยน Shopping ออนไลน์จากงานที่น่าเบื่อหน่ายให้กลายเป็นกระบวนการที่คล่องตัวและมีประสิทธิภาพ

นอกจากนี้ ให้พิจารณาถึงศักยภาพของ Gemini ในการปฏิวัติการวิจัยออนไลน์ แทนที่จะต้องค้นหาบทความและเว็บไซต์นับไม่ถ้วนด้วยตนเอง คุณสามารถมอบหมายงานให้ Gemini รวบรวมข้อมูลเกี่ยวกับหัวข้อเฉพาะ ระบุความลึกของการวิเคราะห์ที่ต้องการ แหล่งที่มาที่ต้องการ และรูปแบบที่คุณต้องการให้ข้อมูลนำเสนอได้ จากนั้น Gemini สามารถรวบรวมรายงานที่ครอบคลุม พร้อมด้วยการอ้างอิงและข้อมูลสรุป ช่วยให้คุณประหยัดเวลาในการวิจัยที่น่าเบื่อหน่ายได้นับไม่ถ้วน

ในด้านประสิทธิภาพการทำงาน Gemini สามารถเป็นผู้ช่วยส่วนตัวที่ดีที่สุดของคุณ จัดการตารางเวลา จัดลำดับความสำคัญของงาน และแม้กระทั่งร่างอีเมลและการนำเสนอตามคำแนะนำของคุณ ลองจินตนาการถึงการบอกความคิดและแนวคิดของคุณให้ Gemini ซึ่งจะเปลี่ยนให้เป็นการนำเสนอที่ขัดเกลาและเป็นมืออาชีพ พร้อมด้วยภาพและข้อมูลที่เกี่ยวข้อง สิ่งนี้จะช่วยให้คุณไม่ต้องเสียเวลาในการสร้างงานนำเสนอตั้งแต่เริ่มต้น ช่วยให้คุณมุ่งเน้นไปที่ด้านเชิงกลยุทธ์ของงานของคุณได้มากขึ้น

สำหรับนักเรียน Gemini สามารถทำหน้าที่เป็นแหล่งเรียนรู้ที่มีค่า ให้คำแนะนำส่วนบุคคล ตอบคำถาม และแม้กระทั่งช่วยเหลืองานวิจัย ลองจินตนาการถึงการที่สามารถขอให้ Gemini อธิบายแนวคิดที่ซับซ้อนด้วยภาษาที่เรียบง่าย หรือให้ตัวอย่างและภาพประกอบเพื่อช่วยให้คุณเข้าใจเนื้อหาได้ดีขึ้น สิ่งนี้จะทำให้การเรียนรู้มีส่วนร่วมและมีประสิทธิภาพมากขึ้น และจะช่วยให้นักเรียนสามารถควบคุมการศึกษาของตนเองได้

การจัดการกับข้อกังวลและความท้าทาย

อย่างไรก็ตาม การรวม AI เข้ากับชีวิตประจำวันของเรายังก่อให้เกิดข้อกังวลที่ถูกต้องตามกฎหมาย ซึ่งจะต้องได้รับการแก้ไขอย่างเชิงรุก หนึ่งในข้อกังวลที่เร่งด่วนที่สุดคือศักยภาพของอคติในอัลกอริทึม AI หากข้อมูลที่ใช้ในการฝึกอบรมอัลกอริทึมเหล่านี้สะท้อนถึงอคติทางสังคมที่มีอยู่ AI อาจทำให้เกิดอคติเหล่านี้และอาจขยายอคติเหล่านี้ให้มากขึ้น สิ่งสำคัญคือต้องตรวจสอบให้แน่ใจว่าอัลกอริทึม AI ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่หลากหลายและเป็นตัวแทน และมีการตรวจสอบอคติเป็นประจำ

อีกข้อกังวลหนึ่งคือศักยภาพในการเคลื่อนย้ายงานที่เกิดจากการทำงานอัตโนมัติของ AI ในขณะที่ AI มีความสามารถในการทำงานที่เคยทำโดยมนุษย์มากขึ้นเรื่อยๆ มีความเสี่ยงที่งานจำนวนมากจะถูกกำจัด เพื่อลดความเสี่ยงนี้ สิ่งสำคัญคือต้องลงทุนในโครงการการศึกษาและการฝึกอบรมที่ช่วยให้คนงานมีทักษะที่จำเป็นในการเติบโตในยุค AI ซึ่งรวมถึงการส่งเสริมทักษะต่างๆ เช่น การคิดเชิงวิพากษ์ การแก้ปัญหา และความคิดสร้างสรรค์ ซึ่งเป็นสิ่งที่ AI ทำซ้ำได้ยาก

สุดท้ายนี้ มีข้อพิจารณาด้านจริยธรรมเกี่ยวกับการใช้ AI โดยเฉพาะอย่างยิ่งในด้านต่างๆ เช่น ความเป็นส่วนตัวและความปลอดภัย สิ่งสำคัญคือต้องกำหนดแนวทางและข้อบังคับที่ชัดเจนในการพัฒนาและการใช้งาน AI เพื่อให้มั่นใจว่ามีการใช้งานอย่างมีความรับผิดชอบและมีจริยธรรม ซึ่งรวมถึงการปกป้องความเป็นส่วนตัวของบุคคล การป้องกันการใช้ AI ในทางที่ผิดเพื่อวัตถุประสงค์ที่เป็นอันตราย และการตรวจสอบให้แน่ใจว่าระบบ AI มีความโปร่งใสและมีความรับผิดชอบ

อนาคตของการรวม AI

Google Gemini ใน Chrome เป็นก้าวที่น่าหวังสู่วิธีการท่องเว็บที่ผสานรวมและชาญฉลาดมากขึ้น แม้ว่าการใช้งานในปัจจุบันจะมีข้อจำกัด แต่ก็แสดงให้เห็นถึงศักยภาพของ AI ในการเปลี่ยนแปลงวิธีที่เราโต้ตอบกับเว็บ ในขณะที่เทคโนโลยี AI ยังคงพัฒนาต่อไป เราคาดว่าจะได้เห็นการรวม AI ที่ซับซ้อนและราบรื่นยิ่งขึ้นเข้ากับชีวิตประจำวันของเรา กุญแจสำคัญคือการจัดการกับความท้าทายด้านจริยธรรมและสังคมที่เกี่ยวข้องกับ AI อย่างเชิงรุก โดยตรวจสอบให้แน่ใจว่ามีการใช้งานเพื่อประโยชน์ของมนุษยชาติโดยรวม

วิวัฒนาการของการรวม AI ใน Browser เช่น Chrome ยังจำเป็นต้องมีการประเมินมาตรฐานเว็บและโปรโตคอลความปลอดภัยที่มีอยู่ใหม่ เมื่อ AI ได้รับความสามารถในการตีความและโต้ตอบกับเนื้อหาเว็บในเชิงลึกมากขึ้น ช่องโหว่ใหม่อาจเกิดขึ้นซึ่งผู้ไม่ประสงค์ดีอาจใช้ประโยชน์ได้ ดังนั้นจึงเป็นสิ่งสำคัญสำหรับผู้พัฒนา Browser และผู้เชี่ยวชาญด้านความปลอดภัยที่จะต้องร่วมมือกันในการพัฒนามาตรการรักษาความปลอดภัยใหม่ที่สามารถปกป้องผู้ใช้จากภัยคุกคามที่เกิดขึ้นใหม่เหล่านี้ ซึ่งรวมถึงการเสริมสร้างการป้องกันการโจมตีแบบ Phishing, Malware และการฉ้อโกงออนไลน์รูปแบบอื่นๆ

นอกจากนี้ การพึ่งพา AI ใน Browser ที่เพิ่มขึ้นยังอาจนำไปสู่การสร้างรูปแบบใหม่ของการแบ่งแยกทางดิจิทัล บุคคลที่ขาดการเข้าถึงอินเทอร์เน็ตความเร็วสูงหรืออุปกรณ์คอมพิวเตอร์ขั้นสูงอาจเสียเปรียบ เนื่องจากจะไม่สามารถใช้ความสามารถของ Browser ที่ขับเคลื่อนด้วย AI ได้อย่างเต็มที่ เพื่อแก้ไขปัญหานี้ สิ่งสำคัญคือต้องลงทุนในการปรับปรุงโครงสร้างพื้นฐานและโครงการความรู้ด้านดิจิทัล ที่สามารถตรวจสอบให้แน่ใจว่าทุกคนมีโอกาสได้รับประโยชน์จากความก้าวหน้าในเทคโนโลยี AI

นอกจากนี้ การรวม AI เข้ากับ Browser ยังอาจมีผลกระทบอย่างมีนัยสำคัญต่ออุตสาหกรรมการโฆษณา ในขณะที่ AI เข้าใจความชอบและพฤติกรรมของผู้ใช้ได้ดีขึ้น อาจถูกใช้เพื่อส่งมอบโฆษณาที่ตรงเป้าหมายและเป็นส่วนตัวมากขึ้น แม้ว่าสิ่งนี้อาจนำไปสู่ประสบการณ์การโฆษณาที่เกี่ยวข้องและมีส่วนร่วมมากขึ้น แต่ก็ก่อให้เกิดข้อกังวลเกี่ยวกับความเป็นส่วนตัวและความปลอดภัยของข้อมูล สิ่งสำคัญคือหน่วยงานกำกับดูแลและผู้มีส่วนได้ส่วนเสียในอุตสาหกรรมจะต้องกำหนดแนวทางและข้อบังคับที่ชัดเจนในการใช้ AI ในการโฆษณา เพื่อให้มั่นใจว่าความเป็นส่วนตัวของผู้ใช้ได้รับการปกป้องและมีการใช้ข้อมูลอย่างมีความรับผิดชอบ

อัปเดตเมื่อ 2025-05-27

# Google # Gemini # Agent