เปิดตัว Gemini: AI เจนเนอเรชั่นถัดไปของ Google
Gemini คือความพยายามอันทะเยอทะยานของ Google ในการก้าวเข้าสู่ยุคต่อไปของโมเดล AI พัฒนาขึ้นจากความร่วมมือของ DeepMind และ Google Research ซึ่งเป็นห้องปฏิบัติการวิจัย AI ชั้นนำของ Google, Gemini ไม่ได้เป็นเพียงสิ่งเดียว แต่เป็นตระกูลของโมเดล ซึ่งแต่ละโมเดลได้รับการปรับแต่งสำหรับงานเฉพาะและระดับประสิทธิภาพที่แตกต่างกัน ตระกูลนี้ประกอบด้วย:
- Gemini Ultra: รุ่นใหญ่ของตระกูล ออกแบบมาสำหรับงานที่มีความซับซ้อนสูง ซึ่งต้องการพลังการประมวลผลจำนวนมาก (ปัจจุบันยังไม่เปิดตัว)
- Gemini Pro: โมเดลที่แข็งแกร่ง มีขนาดเล็กกว่า Ultra แต่สามารถจัดการงานได้หลากหลาย Gemini 2.0 Pro ซึ่งเป็นรุ่นล่าสุด ปัจจุบันเป็นรุ่นเรือธงของ Google
- Gemini Flash: รุ่นที่คล่องตัว “กลั่น” มาจาก Pro โดยเน้นที่ความเร็วและประสิทธิภาพ
- Gemini Flash-Lite: รุ่นที่ลดขนาดลงเล็กน้อยและเร็วกว่าของ Gemini Flash
- Gemini Flash Thinking: โมเดลที่แสดงความสามารถในการ “ให้เหตุผล”
- Gemini Nano: ประกอบด้วยสองโมเดลขนาดกะทัดรัด Nano-1 และ Nano-2 ที่มีประสิทธิภาพมากกว่าเล็กน้อย ออกแบบมาสำหรับการทำงานแบบออฟไลน์บนอุปกรณ์
ลักษณะเฉพาะของโมเดล Gemini ทั้งหมดคือความสามารถในการทำงานหลายรูปแบบ (multimodality) โดยธรรมชาติ ไม่เหมือนกับโมเดลที่ได้รับการฝึกฝนเฉพาะข้อมูลข้อความ เช่น LaMDA ของ Google โมเดล Gemini มีความเชี่ยวชาญในการประมวลผลและวิเคราะห์ข้อมูลประเภทต่างๆ ได้รับการฝึกฝนบนชุดข้อมูลขนาดใหญ่ที่ครอบคลุมเสียง รูปภาพ วิดีโอ โค้ดเบส และข้อความในหลายภาษา ทั้งที่เป็นสาธารณะ เป็นกรรมสิทธิ์ และได้รับอนุญาต
ลักษณะการทำงานหลายรูปแบบนี้ช่วยให้ Gemini ก้าวข้ามขีดจำกัดของโมเดลเฉพาะข้อความ ในขณะที่ LaMDA ถูกจำกัดให้อยู่เฉพาะอินพุตและเอาต์พุตที่เป็นข้อความ โมเดล Gemini โดยเฉพาะอย่างยิ่ง Flash และ Pro เวอร์ชันใหม่กว่า สามารถสร้างรูปภาพและเสียงควบคู่ไปกับข้อความได้
อย่างไรก็ตาม ผลกระทบทางจริยธรรมและกฎหมายของการฝึกอบรมโมเดล AI บนข้อมูลที่เปิดเผยต่อสาธารณะ ซึ่งมักจะไม่มีความยินยอมอย่างชัดแจ้งจากเจ้าของข้อมูล ยังคงเป็นปัญหาที่ซับซ้อน แม้ว่า Google จะเสนอนโยบายการชดใช้ค่าเสียหาย AI เพื่อปกป้องลูกค้า Google Cloud บางรายจากการฟ้องร้องที่อาจเกิดขึ้น แต่นโยบายนี้มีข้อจำกัด ผู้ใช้ โดยเฉพาะผู้ที่ตั้งใจจะใช้ Gemini เพื่อวัตถุประสงค์ทางการค้า ควรใช้ความระมัดระวัง
แอป Gemini กับ โมเดล Gemini: ทำความเข้าใจความแตกต่าง
สิ่งสำคัญคือต้องแยกความแตกต่างระหว่างโมเดล Gemini และแอป Gemini ที่มีอยู่บนเว็บและแพลตฟอร์มมือถือ (เดิมเรียกว่า Bard)
แอป Gemini ทำหน้าที่เป็นไคลเอนต์ เชื่อมต่อกับโมเดล Gemini ต่างๆ และนำเสนออินเทอร์เฟซที่ใช้งานง่ายเหมือนแชทบอท ทำหน้าที่เป็นส่วนหน้าสำหรับการโต้ตอบกับความสามารถ AI แบบ Generative ของ Google
บนอุปกรณ์ Android แอป Gemini จะแทนที่แอป Google Assistant บน iOS แอป Google และ Google Search จะทำหน้าที่เป็นไคลเอนต์ Gemini
ผู้ใช้ Android สามารถเรียกใช้ Gemini overlay เพื่อถามคำถามเกี่ยวกับเนื้อหาที่แสดงบนหน้าจอ เช่น วิดีโอ YouTube การวางซ้อนนี้จะถูกเรียกใช้โดยการกดปุ่มเปิด/ปิดของสมาร์ทโฟนที่รองรับค้างไว้ หรือโดยใช้คำสั่งเสียง “Hey Google”
แอป Gemini มีความหลากหลาย โดยรับรูปภาพ คำสั่งเสียง และข้อความเป็นอินพุต สามารถประมวลผลไฟล์ เช่น PDF ไม่ว่าจะอัปโหลดโดยตรงหรือนำเข้าจาก Google Drive และสร้างรูปภาพได้ การสนทนาที่เริ่มต้นด้วยแอป Gemini บนมือถือจะซิงโครไนซ์กับ Gemini บนเว็บได้อย่างราบรื่น หากผู้ใช้ลงชื่อเข้าใช้บัญชี Google เดียวกัน
Gemini Advanced: ปลดล็อกคุณสมบัติ AI ระดับพรีเมียม
แอป Gemini ไม่ได้เป็นช่องทางเดียวในการใช้ประโยชน์จากพลังของโมเดล Gemini Google กำลังรวมคุณสมบัติที่ขับเคลื่อนด้วย Gemini เข้ากับแอปพลิเคชันและบริการหลักของตนอย่างต่อเนื่อง รวมถึง Gmail และ Google Docs
เพื่อให้สามารถใช้ประโยชน์จากความสามารถเหล่านี้ได้อย่างเต็มที่ ผู้ใช้มักจะต้องมีแผน Google One AI Premium แผนนี้ ซึ่งในทางเทคนิคแล้วเป็นส่วนประกอบของ Google One มีค่าใช้จ่าย $20 ต่อเดือน และให้สิทธิ์เข้าถึง Gemini ภายในแอปพลิเคชัน Google Workspace เช่น Docs, Maps, Slides, Sheets, Drive และ Meet นอกจากนี้ยังปลดล็อก “Gemini Advanced” ซึ่งให้การเข้าถึงโมเดล Gemini ที่ซับซ้อนยิ่งขึ้นของ Google ภายในแอป Gemini
ผู้ใช้ Gemini Advanced จะได้รับสิทธิประโยชน์เพิ่มเติม เช่น สิทธิ์เข้าถึงคุณสมบัติและโมเดลใหม่ๆ ก่อนใคร ความสามารถในการเรียกใช้และแก้ไขโค้ด Python โดยตรงภายใน Gemini และขีดจำกัดที่ขยายขึ้นสำหรับ NotebookLM ซึ่งเป็นเครื่องมือของ Google สำหรับการแปลง PDF เป็นพอดแคสต์ที่สร้างโดย AI คุณสมบัติใหม่ที่เพิ่มเข้ามาใน Gemini Advanced คือคุณสมบัติหน่วยความจำที่จัดเก็บค่ากำหนดของผู้ใช้และช่วยให้ Gemini อ้างอิงการสนทนาที่ผ่านมาได้ โดยให้บริบทสำหรับการโต้ตอบในปัจจุบัน
หนึ่งในคุณสมบัติที่น่าสนใจที่สุดเฉพาะสำหรับ Gemini Advanced คือ “Deep Research” คุณสมบัตินี้ใช้ประโยชน์จากโมเดล Gemini ที่มีความสามารถในการให้เหตุผลที่ได้รับการปรับปรุงเพื่อสร้างบทสรุปโดยละเอียด เพื่อตอบสนองต่อข้อความแจ้ง เช่น “ฉันควรออกแบบห้องครัวใหม่ของฉันอย่างไร” Deep Research จะกำหนดแผนการวิจัยหลายขั้นตอน ค้นหาเว็บ และรวบรวมคำตอบที่ครอบคลุม
ภายใน Gmail, Gemini จะอยู่ในแผงด้านข้าง ซึ่งสามารถเขียนอีเมลและสรุปหัวข้อข้อความได้ แผงที่คล้ายกันจะปรากฏใน Docs ช่วยในการเขียนเนื้อหา การปรับแต่ง และการระดมความคิด ใน Slides, Gemini จะสร้างสไลด์และรูปภาพที่กำหนดเอง ใน Google Sheets จะช่วยในการติดตามข้อมูล การจัดระเบียบ และการสร้างสูตร
การมีอยู่ของ Gemini ขยายไปถึง Google Maps ซึ่งจะรวบรวมรีวิวเกี่ยวกับธุรกิจในท้องถิ่นและเสนอคำแนะนำ เช่น คำแนะนำแผนการเดินทางสำหรับการเยี่ยมชมเมืองในต่างประเทศ ความสามารถของแชทบอทยังครอบคลุมถึง Drive ซึ่งสามารถสรุปไฟล์และโฟลเดอร์ และให้ข้อมูลสรุปเกี่ยวกับโครงการได้
Gemini ได้รับการรวมเข้ากับเบราว์เซอร์ Chrome ของ Google เมื่อเร็วๆ นี้ในฐานะเครื่องมือเขียน AI เครื่องมือนี้สามารถใช้เพื่อสร้างเนื้อหาใหม่ทั้งหมดหรือเขียนข้อความที่มีอยู่ใหม่ โดยคำนึงถึงบริบทของหน้าเว็บปัจจุบันเพื่อให้คำแนะนำที่ปรับให้เหมาะสม
นอกเหนือจากแอปพลิเคชันหลักเหล่านี้แล้ว ร่องรอยของ Gemini ยังสามารถพบได้ในผลิตภัณฑ์ฐานข้อมูลของ Google เครื่องมือรักษาความปลอดภัยบนคลาวด์ และแพลตฟอร์มการพัฒนาแอป (รวมถึง Firebase และ Project IDX) นอกจากนี้ยังขับเคลื่อนคุณสมบัติในแอปต่างๆ เช่น Google Photos (การสืบค้นด้วยภาษาธรรมชาติ), YouTube (การระดมความคิดเกี่ยวกับวิดีโอ) และ Meet (การแปลคำบรรยาย)
Code Assist (เดิมชื่อ Duet AI for Developers) ซึ่งเป็นชุดเครื่องมือที่ขับเคลื่อนด้วย AI ของ Google สำหรับการเติมโค้ดและการสร้างโค้ดให้สมบูรณ์ อาศัย Gemini สำหรับงานที่ต้องใช้การประมวลผลมาก ในทำนองเดียวกัน ผลิตภัณฑ์รักษาความปลอดภัยของ Google เช่น Gemini ใน Threat Intelligence ใช้ Gemini เพื่อวิเคราะห์โค้ดที่อาจเป็นอันตราย และอำนวยความสะดวกในการค้นหาภัยคุกคามและตัวบ่งชี้การประนีประนอมด้วยภาษาธรรมชาติ
Gemini Extensions และ Gems: ปรับแต่งประสบการณ์ AI
ผู้ใช้ Gemini Advanced มีความสามารถในการสร้าง “Gems” แชทบอทแบบกำหนดเองที่ขับเคลื่อนโดยโมเดล Gemini ซึ่งสามารถเข้าถึงได้ทั้งบนเดสก์ท็อปและแพลตฟอร์มมือถือ Gems สามารถสร้างขึ้นจากคำอธิบายภาษาธรรมชาติ เช่น “คุณเป็นโค้ชวิ่งของฉัน ให้แผนการวิ่งประจำวันแก่ฉัน” และสามารถแชร์กับผู้ใช้รายอื่นหรือเก็บไว้เป็นส่วนตัวได้
แอป Gemini สามารถรวมเข้ากับบริการต่างๆ ของ Google ผ่าน “Gemini extensions” ส่วนขยายเหล่านี้ช่วยให้ Gemini โต้ตอบกับ Drive, Gmail, YouTube และบริการอื่นๆ ได้ ทำให้สามารถตอบคำถามต่างๆ เช่น “คุณช่วยสรุปอีเมลสามฉบับล่าสุดของฉันได้ไหม”
Gemini Live: มีส่วนร่วมในการสนทนาด้วยเสียงเชิงลึก
“Gemini Live” มอบประสบการณ์ที่ดื่มด่ำ ช่วยให้ผู้ใช้มีส่วนร่วมในการสนทนาด้วยเสียงโดยละเอียดกับ Gemini คุณสมบัตินี้มีอยู่ในแอป Gemini บนอุปกรณ์เคลื่อนที่และบน Pixel Buds Pro 2 ซึ่งสามารถเข้าถึงได้แม้ในขณะที่โทรศัพท์ล็อกอยู่
ด้วย Gemini Live ผู้ใช้สามารถขัดจังหวะ Gemini ในขณะที่กำลังพูดเพื่อถามคำถามที่ชัดเจน และแชทบอทจะปรับให้เข้ากับรูปแบบการพูดแบบเรียลไทม์ Live ยังได้รับการออกแบบมาเพื่อทำหน้าที่เป็นโค้ชเสมือน ช่วยในการเตรียมงาน การระดมความคิด และงานอื่นๆ ตัวอย่างเช่น Live สามารถแนะนำทักษะที่จะเน้นในระหว่างการสัมภาษณ์งาน และให้คำแนะนำในการพูดในที่สาธารณะ
Gemini สำหรับวัยรุ่น: ประสบการณ์ AI ที่ปรับให้เหมาะกับนักเรียน
Google มอบประสบการณ์ Gemini ที่ปรับแต่งมาโดยเฉพาะสำหรับนักเรียนวัยรุ่น
Gemini เวอร์ชันที่เน้นวัยรุ่นนี้รวม “นโยบายและการป้องกันเพิ่มเติม” รวมถึงกระบวนการเริ่มต้นใช้งานที่กำหนดเองและคู่มือความรู้ด้าน AI นอกเหนือจากการปรับเปลี่ยนเหล่านี้แล้ว จะคล้ายกับประสบการณ์ Gemini มาตรฐาน รวมถึงคุณสมบัติ “double-check” ที่ตรวจสอบความถูกต้องของคำตอบของ Gemini โดยการอ้างอิงข้อมูลบนเว็บ
สำรวจความสามารถของโมเดล Gemini
ลักษณะการทำงานหลายรูปแบบของโมเดล Gemini ช่วยให้สามารถทำงานได้หลากหลาย ตั้งแต่การถอดเสียงพูดไปจนถึงการใส่คำบรรยายภาพและวิดีโอแบบเรียลไทม์ ความสามารถเหล่านี้จำนวนมากได้รวมอยู่ในผลิตภัณฑ์ของ Google แล้ว โดยสัญญาว่าจะมีความก้าวหน้าเพิ่มเติมในอนาคตอันใกล้นี้
อย่างไรก็ตาม สิ่งสำคัญคือต้องรับทราบว่า Google เช่นเดียวกับคู่แข่ง ยังไม่ได้แก้ไขปัญหาที่เกี่ยวข้องกับเทคโนโลยี AI แบบ Generative อย่างเต็มที่ เช่น อคติที่เข้ารหัสและแนวโน้มที่จะสร้างข้อมูล (ภาพหลอน) ควรพิจารณาข้อจำกัดเหล่านี้เมื่อประเมินการใช้ Gemini โดยเฉพาะอย่างยิ่งสำหรับการใช้งานที่สำคัญ
ความสามารถของ Gemini Pro
Google ยืนยันว่าโมเดล Pro ล่าสุด Gemini 2.0 Pro เป็นข้อเสนอที่ทันสมัยที่สุดสำหรับการเขียนโค้ดและการจัดการข้อความแจ้งที่ซับซ้อน 2.0 Pro มีประสิทธิภาพเหนือกว่ารุ่นก่อน Gemini 1.5 Pro ในเกณฑ์มาตรฐานการประเมินการเขียนโปรแกรม การให้เหตุผล คณิตศาสตร์ และความถูกต้องของข้อเท็จจริง
ภายในแพลตฟอร์ม Vertex AI ของ Google นักพัฒนาสามารถปรับแต่ง Gemini Pro สำหรับบริบทและกรณีการใช้งานเฉพาะผ่านการปรับแต่งอย่างละเอียดหรือ “grounding” ตัวอย่างเช่น Pro (พร้อมกับโมเดล Gemini อื่นๆ) สามารถได้รับคำแนะนำให้ใช้ข้อมูลจากผู้ให้บริการบุคคลที่สาม เช่น Moody’s, Thomson Reuters, ZoomInfo และ MSCI หรือเพื่อจัดหาข้อมูลจากชุดข้อมูลขององค์กรหรือ Google Search แทนที่จะเป็นฐานความรู้ที่กว้างขึ้น Gemini Pro ยังสามารถเชื่อมต่อกับ API ภายนอกของบุคคลที่สามเพื่อดำเนินการเฉพาะ เช่น การทำงานอัตโนมัติของเวิร์กโฟลว์ back-office
แพลตฟอร์ม AI Studio ของ Google มีเทมเพลตสำหรับสร้างข้อความแจ้งการแชทที่มีโครงสร้างด้วย Pro นักพัฒนาสามารถควบคุมช่วงความคิดสร้างสรรค์ของโมเดล ให้ตัวอย่างเพื่อเป็นแนวทางในน้ำเสียงและสไตล์ และปรับแต่งการตั้งค่าความปลอดภัยของ Pro
Gemini Flash: ประสิทธิภาพน้ำหนักเบาและความสามารถในการให้เหตุผลของ Gemini Flash Thinking
Gemini 2.0 Flash สามารถใช้ Google search และ API ภายนอกอื่นๆ ได้ แม้ว่าจะมีขนาดเล็กกว่า แต่ก็มีประสิทธิภาพเหนือกว่าโมเดล 1.5 ที่ใหญ่กว่าบางรุ่นในเกณฑ์มาตรฐานการวัดการเขียนโค้ดและการวิเคราะห์ภาพ ในฐานะที่เป็นอนุพันธ์ของ Gemini Pro, Flash ได้รับการออกแบบมาเพื่อประสิทธิภาพ โดยกำหนดเป้าหมายไปที่งาน AI แบบ Generative ที่แคบและมีความถี่สูง
Google เน้นย้ำถึงความเหมาะสมของ Flash สำหรับแอปพลิเคชันต่างๆ เช่น การสรุป แอปพลิเคชันแชท การใส่คำบรรยายภาพและวิดีโอ และการแยกข้อมูลจากเอกสารและตารางขนาดยาว ในขณะเดียวกัน Gemini 2.0 Flash-Lite ซึ่งเป็นรุ่นที่กะทัดรัดกว่าของ Flash มีประสิทธิภาพเหนือกว่า Gemini 1.5 Flash ในด้านประสิทธิภาพในขณะที่ยังคงราคาและความเร็วเท่าเดิม ตามข้อมูลของ Google
ในเดือนธันวาคมของปีที่แล้ว Google ได้เปิดตัว Gemini 2.0 Flash รุ่น “thinking” ที่มีความสามารถในการ “ให้เหตุผล” โมเดล AI นี้ใช้เวลาสองสามวินาทีในการทำงานย้อนกลับผ่านปัญหาก่อนที่จะให้คำตอบ ซึ่งอาจช่วยเพิ่มความน่าเชื่อถือ
Gemini Nano: พลัง AI บนอุปกรณ์
Gemini Nano เป็น Gemini เวอร์ชันกะทัดรัดอย่างน่าทึ่ง ออกแบบมาเพื่อทำงานโดยตรงบนอุปกรณ์ที่รองรับ โดยไม่จำเป็นต้องส่งงานไปยังเซิร์ฟเวอร์ระยะไกล ปัจจุบัน Nano ขับเคลื่อนคุณสมบัติหลายอย่างบน Pixel 8 Pro, Pixel 8, Pixel 9 Pro, Pixel 9 และ Samsung Galaxy S24 รวมถึง Summarize in Recorder และ Smart Reply ใน Gboard
แอป Recorder ซึ่งช่วยให้ผู้ใช้สามารถบันทึกและถอดเสียงได้ รวมคุณสมบัติการสรุปที่ขับเคลื่อนด้วย Gemini สำหรับการสนทนาที่บันทึกไว้ การสัมภาษณ์ การนำเสนอ และตัวอย่างเสียงอื่นๆ บทสรุปเหล่านี้สร้างขึ้นแม้ไม่มีการเชื่อมต่อเครือข่าย และเพื่อความเป็นส่วนตัว จะไม่มีข้อมูลออกจากอุปกรณ์ของผู้ใช้ในระหว่างกระบวนการ
Nano ยังพบตำแหน่งใน Gboard ซึ่งเป็นแป้นพิมพ์แทนที่ของ Google ซึ่งขับเคลื่อน Smart Reply คุณสมบัตินี้แนะนำการตอบกลับในแอปส่งข้อความ เช่น WhatsApp ทำให้การสนทนาคล่องตัวขึ้น
Android เวอร์ชันอนาคตมีกำหนดจะใช้ประโยชน์จาก Nano เพื่อแจ้งเตือนผู้ใช้เกี่ยวกับการหลอกลวงที่อาจเกิดขึ้นระหว่างการโทร แอปสภาพอากาศใหม่บนโทรศัพท์ Pixel ใช้ Gemini Nano เพื่อสร้างรายงานสภาพอากาศส่วนบุคคล นอกจากนี้ TalkBack ซึ่งเป็นบริการการเข้าถึงของ Google ใช้ Nano เพื่อสร้างคำอธิบายเสียงของวัตถุสำหรับผู้ใช้ที่มีความบกพร่องทางการมองเห็น
Gemini Ultra: รอการกลับมา
Gemini Ultra ค่อนข้างจะหายไปจากสปอตไลท์ในช่วงไม่กี่เดือนที่ผ่านมา ขณะนี้โมเดลนี้ไม่สามารถใช้งานได้ภายในแอป Gemini และไม่ได้ระบุไว้ในหน้าการกำหนดราคา Gemini API ของ Google อย่างไรก็ตาม สิ่งนี้ไม่ได้ตัดความเป็นไปได้ที่ Google จะเปิดตัว Ultra อีกครั้งในอนาคต
โครงสร้างราคาสำหรับโมเดล Gemini
Gemini 1.5 Pro, 1.5 Flash, 2.0 Flash และ 2.0 Flash-Lite สามารถเข้าถึงได้ผ่าน Gemini API ของ Google สำหรับการพัฒนาแอปพลิเคชันและบริการ ทำงานบนพื้นฐานการจ่ายตามการใช้งานจริง ราคาพื้นฐาน ไม่รวมส่วนเสริม ณ วันที่ 22 กุมภาพันธ์ 2025 มีดังนี้:
- Gemini 1.5 Pro: $1.25 ต่อ 1 ล้านโทเค็นอินพุต (สำหรับข้อความแจ้งสูงสุด 128K โทเค็น) หรือ $2.50 ต่อ 1 ล้านโทเค็นอินพุต (สำหรับข้อความแจ้งที่ยาวกว่า 128K โทเค็น); $5 ต่อ 1 ล้านโทเค็นเอาต์พุต (สำหรับข้อความแจ้งสูงสุด 128K โทเค็น) หรือ $10 ต่อ 1 ล้านโทเค็นเอาต์พุต (สำหรับข้อความแจ้งที่ยาวกว่า 128K โทเค็น)
- Gemini 1.5 Flash: 7.5 เซ็นต์ต่อ 1 ล้านโทเค็นอินพุต (สำหรับข้อความแจ้งสูงสุด 128K โทเค็น), 15 เซ็นต์ต่อ 1 ล้านโทเค็นอินพุต (สำหรับข้อความแจ้งที่ยาวกว่า 128K โทเค็น), 30 เซ็นต์ต่อ 1 ล้านโทเค็นเอาต์พุต (สำหรับข้อความแจ้งสูงสุด 128K โทเค็น), 60 เซ็นต์ต่อ 1 ล้านโทเค็นเอาต์พุต (สำหรับข้อความแจ้งที่ยาวกว่า 128K โทเค็น)
- Gemini 2.0 Flash: 10 เซ็นต์ต่อ 1 ล้านโทเค็นอินพุต, 40 เซ็นต์ต่อ 1 ล้านโทเค็นเอาต์พุต สำหรับเสียง 70 เซ็นต์ต่อ 1 ล้านโทเค็นอินพุต
- Gemini 2.0 Flash-Lite: 7.5 เซ็นต์ต่อ 1 ล้านโทเค็นอินพุต, 30 เซ็นต์ต่อ 1 ล้านโทเค็นเอาต์พุต
โทเค็นแสดงถึงหน่วยย่อยของข้อมูลดิบ เช่น พยางค์ “fan”, “tas” และ “tic” ในคำว่า “fantastic” หนึ่งล้านโทเค็นมีค่าเท่ากับประมาณ 750,000 คำ “อินพุต” หมายถึงโทเค็นที่ป้อนเข้าสู่โมเดล ในขณะที่ “เอาต์พุต” หมายถึงโทเค็นที่สร้างโดยโมเดล
ยังไม่มีการประกาศราคาสำหรับ 2.0 Pro และ Nano ยังอยู่ในช่วงเริ่มต้น
การมาถึงที่เป็นไปได้ของ Gemini บน iPhone
ความเป็นไปได้ของการรวม Gemini เข้ากับ iPhone เป็นไปได้อย่างชัดเจน
Apple ได้ระบุว่ากำลังมีการหารือเพื่อใช้ Gemini และโมเดลของบุคคลที่สามอื่นๆ สำหรับคุณสมบัติต่างๆ ภายในชุด Apple Intelligence หลังจากนำเสนอประเด็นสำคัญที่ WWDC 2024, Craig Federighi รองประธานอาวุโสของ Apple ยืนยันแผนการที่จะทำงานร่วมกับโมเดลต่างๆ รวมถึง Gemini แต่ไม่ได้เปิดเผยรายละเอียดเพิ่มเติม