ถอดรหัส ChatGPT: ทุกสิ่งที่ควรรู้

ChatGPT อยู่ทุกหนทุกแห่ง แต่ chatbot นี้ทำอะไรได้บ้าง และทำงานอย่างไร? เราจะแยกย่อยพื้นฐานและอธิบายวิธีเริ่มต้นใช้งาน AI

เป็นเวลาหลายปีแล้วนับตั้งแต่ ChatGPT เปิดตัวครั้งแรกในปี 2022 และคุณอาจยังอยู่ในช่วงเริ่มต้นของการเดินทางด้วย AI เราเรียนรู้เพิ่มเติมเกี่ยวกับ AI ทุกวัน และการทำความเข้าใจวิธีการทำงานของเทคโนโลยีนี้สามารถช่วยให้คุณได้รับประโยชน์สูงสุดจากการสนทนาของคุณ

แม้ว่า ChatGPT จะใช้งานง่ายบนพื้นผิว แต่มีการคำนวณที่ซับซ้อนมากมายเกิดขึ้นเบื้องหลังซึ่งปรับแต่งสำหรับผู้ใช้แต่ละราย Large Language Models (LLMs) อาศัยเครือข่ายประสาทเทียม AI ขนาดใหญ่ที่สามารถประมวลผลและสร้างข้อความคล้ายมนุษย์ วิเคราะห์ภาพ และแม้แต่พูดด้วยตัวเอง นี่คือวิธีการทำงาน

เทคโนโลยีเบื้องหลัง ChatGPT คืออะไร?

ในแง่พื้นฐานที่สุด ChatGPT เป็นเว็บไซต์หรือแอปพลิเคชันมือถือแบบสนทนาที่สามารถรับคำขอจากมนุษย์ ผู้คนได้พบการใช้งานที่สร้างสรรค์มากมาย รวมถึงการเขียนบทความและอีเมล การออกแบบเว็บไซต์ การเขียนโค้ดซอฟต์แวร์ และการทำภารกิจผ่านตัวแทน AI

แม้ว่า ChatGPT จะเป็น AI chatbot ที่ได้รับความนิยมมากที่สุดในปัจจุบัน แต่ chatbot อื่นๆ ที่คุณอาจเคยได้ยิน ได้แก่ Google Gemini, Perplexity และ Claude ของ Anthropic ทั้งหมดได้รับการฝึกฝนเกี่ยวกับข้อมูลจำนวนมาก ซึ่ง "สอน" พวกเขาถึงวิธีการโต้ตอบกับมนุษย์ในลักษณะที่น่าเชื่อถือราวกับว่าพวกเขาเป็นมนุษย์ แต่พวกมันก็เหมือนกับมนุษย์ต่างดาว (หรือเด็กวัยเตาะแตะ) ที่พยายามเรียนรู้วิธีการเป็นผู้ใหญ่ตลอดเวลา พวกเขายังต้องการเป็นที่นิยมอีกด้วย OpenAI เพิ่งต้องยกเลิกการอัปเดต ChatGPT เนื่องจากมันประจบประแจงมากเกินไป

กระบวนการเรียนรู้นี้เกิดขึ้นโดยการป้อนข้อมูลให้กับ chatbot ซึ่งส่วนใหญ่มาจากอินเทอร์เน็ต (Wikipedia เป็นแหล่งข้อมูลขนาดใหญ่) รวมถึงหนังสือที่มีลิขสิทธิ์ วิดีโอ YouTube และเนื้อหาต้นฉบับอื่นๆ ซึ่งในบางกรณีจะนำไปสู่การฟ้องร้อง Chatbot มนุษย์ต่างดาวกระหายข้อมูลให้มากที่สุดเท่าที่จะทำได้เพื่อให้พวกเขาสามารถแสดงได้ดีขึ้นอย่างต่อเนื่อง

โมเดลเรียนรู้โดยการนำส่วนหนึ่งของข้อความจากข้อมูล (เช่น ประโยคเปิดของบทความ Wikipedia) และพยายามทำนายโทเค็นถัดไปในลำดับ จากนั้นจะเปรียบเทียบเอาต์พุตกับข้อความจริงในคลังการฝึกอบรม และปรับพารามิเตอร์เพื่อแก้ไขข้อผิดพลาดใดๆ ด้วยการทำซ้ำนี้บนเนื้อหาข้อความ (หรือรูปภาพ หรือเสียง) ที่ใหญ่มาก มันสามารถพัฒนารูปแบบภาษาที่เมื่อได้รับแจ้งให้สร้างลำดับข้อความที่ต่อเนื่องกันได้

กระบวนการนี้อาศัยสถาปัตยกรรมซอฟต์แวร์ที่เรียกว่า Deep Neural Network (DNN) โดยเฉพาะอย่างยิ่งเครือข่าย Transformer เครือข่าย Transformer เก่งในการแยกข้อความเป็น “โทเค็น” ซึ่งโดยพื้นฐานแล้วเป็นส่วนหนึ่งของคำ (“คำ” คือโทเค็นหนึ่ง “โดยพื้นฐาน” คือสองโทเค็น) จากนั้นจะคาดการณ์ลำดับที่มีแนวโน้มมากที่สุดที่จะโดนใจผู้ใช้ตามการโต้ตอบ การคำนวณแต่ละครั้งนั้นแตกต่างกันไปในแต่ละบุคคล ซึ่งต้องใช้ไฟฟ้าและพลังงานจำนวนมาก

ChatGPT ยัง "จดจำ" การสนทนาก่อนหน้าของคุณเพื่อสร้างการตอบกลับที่กำหนดเอง ยิ่งคุณคุยกับมันมากเท่าไหร่ มันก็จะยิ่งปรับแต่งปฏิสัมพันธ์ของคุณให้สมบูรณ์แบบมากขึ้นเท่านั้น หากคุณพูดอะไรทำนองว่า "นั่นไม่ถูกต้อง" โมเดลจะจดบันทึกและลองใช้วิธีอื่นในครั้งต่อไป สิ่งนี้เรียกว่า "Reinforcement Learning from Human Feedback" (RLHF) ซึ่งเป็นเหตุผลว่าทำไม ChatGPT จึงมีประโยชน์มากกว่ารุ่นก่อน

วิธีลองใช้ ChatGPT

คุณสามารถลงทะเบียนสำหรับ ChatGPT ได้ที่เว็บไซต์หรือแอป (iOS หรือ Android) ของ OpenAI หรือคุณสามารถใช้เวอร์ชันพื้นฐานได้โดยไม่ต้องสร้างบัญชี เวอร์ชันฟรีนั้นเพียงพอสำหรับการสนทนาเป็นครั้งคราว แต่จะจำกัดจำนวนครั้งที่คุณสามารถโต้ตอบกับโมเดลเรือธง GPT-4o ต่อวัน รวมถึงจำนวนรูปภาพที่คุณสามารถอัปโหลดได้

สำหรับการใช้งานอย่างจริงจังและต่อเนื่อง คุณอาจต้องการลองใช้ ChatGPT Plus เวอร์ชันชำระเงิน ซึ่งมีค่าใช้จ่าย $20 ต่อเดือน มีข้อจำกัดน้อยกว่าและมีคุณสมบัติเพิ่มเติม เช่น โมเดลสร้างวิดีโอ Sora และ Custom GPT อย่างหลังคือโมเดลขนาดเล็กที่คุณสามารถใช้ในงานเฉพาะ (เช่น การแปลภาษา) ในขณะที่โมเดล ChatGPT หลักเป็นเหมือนนักกีฬาที่เก่งรอบด้าน

OpenAI ยังมีระดับการสมัครสมาชิกอื่นๆ เช่น โมเดล Pro มูลค่า 200 ดอลลาร์ต่อเดือน ซึ่งไม่มีข้อจำกัดและสามารถทำงานต่างๆ เช่น การรวบรวมรายงานการวิจัยขั้นสูง นอกจากนี้ยังมีบัญชี Teams และ Enterprise สำหรับองค์กรขนาดใหญ่ สุดท้าย นักพัฒนายังสามารถเข้าถึง ChatGPT ผ่าน OpenAI API ซึ่งคุณจ่ายตามจำนวนโทเค็นที่คุณใช้

ฉันสามารถทำอะไรกับ ChatGPT ได้บ้าง?

ด้วยคำแนะนำและบริบทที่ถูกต้อง ChatGPT สามารถมีประโยชน์อย่างมาก นี่คือบางสิ่งที่คุณสามารถทำได้ด้วย ChatGPT

การเขียน

ChatGPT สามารถเป็นผู้ช่วยเขียนที่มีประโยชน์ได้ ถ้าคุณแจ้งให้เขียนบทความฉบับเต็มในครั้งเดียว มันจะให้ผลลัพธ์ที่คละกัน แต่ถ้าคุณร่วมมือกับมันทีละขั้นตอน ChatGPT สามารถทำสิ่งที่น่าประทับใจได้ ตัวอย่างเช่น คุณสามารถเริ่มต้นด้วยโครงร่างและเติมเต็มแต่ละส่วนด้วยความช่วยเหลือของ chatbot ของ OpenAI

การแก้ไข

ChatGPT เป็นผู้ช่วยบรรณาธิการที่ยอดเยี่ยม คุณสามารถใช้สำหรับการแก้ไขสำเนา การพิสูจน์อักษร การปรับแก้ การปรับสไตล์ และอื่นๆ

การแปล

ChatGPT สามารถแปลเป็นหลายภาษาได้ดี หากคุณกำลังทำงานในด้านเฉพาะ คุณสามารถปรับปรุงการแปลโดยการให้บริบท เช่น ตัวอย่างเอกสารต้นฉบับและภาษาเป้าหมาย

การสรุป

ChatGPT สามารถสรุปบทความ สุนทรพจน์ และเอกสาร หากคุณให้แนวทาง เช่น หัวข้อที่จะเน้น มันจะแม่นยำยิ่งขึ้น

การระดมความคิด

ChatGPT สามารถให้ความช่วยเหลือได้ที่นี่ ตั้งแต่การแนะนำประเด็นสนทนาสำหรับการนำเสนอไปจนถึงการวางแผนการเดินทาง

การเขียนโค้ด

ChatGPT เป็นผู้ช่วยในการเขียนโค้ดที่ดี สามารถแปลงคำอธิบายฟังก์ชันให้เป็นโค้ดที่ใช้งานได้ในภาษาการเขียนโปรแกรมและสคริปต์หลายภาษา

การสร้างและตีความภาพ

คุณสามารถอัปโหลดรูปภาพและถามคำถามเกี่ยวกับรูปภาพเหล่านั้นได้ ตัวอย่างเช่น เพิ่มรูปต้นไม้และถามว่า "นี่คือพืชอะไร" ChatGPT ยังสามารถอธิบายภาพหน้าจอได้หากคุณมีคำถาม และคุณสามารถเห็นบางสิ่งบนโทรศัพท์ของคุณ นอกจากนี้ยังสามารถสร้างภาพด้วยเครื่องกำเนิดภายในใหม่ ซึ่งได้รับการวิจารณ์ที่ดี

การสนทนาด้วยวาจา

ด้วยโหมดเสียง คุณไม่จำเป็นต้องสร้างข้อความแจ้งที่สมบูรณ์แบบ เพียงแค่พูดใส่ไมโครโฟนและเริ่มแชท

การสร้างคลิปภาพยนตร์

Sora video generator สร้างคลิปที่กำหนดเองซึ่งมีความยาวเพียงไม่กี่วินาที ไม่มีเสียง และสามารถใช้เพื่อปรับปรุงโครงการวิดีโอที่ใหญ่ขึ้นหรือใช้เป็นชิ้นส่วนแบบสแตนด์อโลน มีให้สำหรับสมาชิก ChatGPT Plus และ Pro และมีฟังก์ชันการทำงานที่จำกัดฟรีผ่านแอปพลิเคชัน Microsoft Bing

เราไม่แนะนำให้ใช้ ChatGPT เป็นเครื่องมือวิจัยเนื่องจากมีแนวโน้มที่จะหลอนหรือสร้างข้อมูล LLM อย่าง ChatGPT สามารถนำข้อความมารวมกันเพื่อให้ถูกต้องตามหลักศัพท์ แต่อาจผิดพลาดตามข้อเท็จจริง สิ่งนี้ใช้กับการใช้ ChatGPT สำหรับการเข้ารหัสด้วยเช่นกัน: มันอาจสร้างโค้ดที่ไม่ทำงานหรือไม่ปลอดภัย กฎที่ดีคือการใช้ ChatGPT เป็นจุดเริ่มต้น จากนั้นตรวจสอบความถูกต้องของเอาต์พุตโดยคลิกที่ลิงก์แหล่งที่มาที่ ChatGPT ให้มา หรือทำการค้นหา Google แยกต่างหาก (Perplexity เป็น chatbot ที่เน้นการอ้างอิงอีกตัวหนึ่ง)

ทางเลือกอื่นสำหรับ ChatGPT คืออะไร?

บริษัทและองค์กรอื่นๆ อีกหลายแห่งได้พัฒนา LLM ที่ติดตามคำแนะนำซึ่งเทียบได้กับ ChatGPT

  • Google Gemini: โมเดล AI ของ Google สามารถทำเกือบทุกอย่างที่คุณสามารถทำได้ด้วย ChatGPT และสามารถเชื่อมต่อกับระบบนิเวศของ Google ได้ ดังนั้นคุณจึงสามารถส่งออกเอาต์พุตไปยัง Gmail, Google Sheets, Docs และอื่นๆ
  • Bing: Microsoft ได้ลงทุนหลายพันล้านดอลลาร์ใน OpenAI โดยได้รวม ChatGPT เข้ากับเครื่องมือค้นหา Bing เป็นอินเทอร์เฟซการสนทนาสำหรับค้นหาความรู้และทำหน้าที่อื่นๆ ที่คุณสามารถทำได้ด้วย ChatGPT มันอ้างอิงแหล่งที่มาของข้อมูลที่สร้างขึ้น ทำให้คุณสามารถตรวจสอบแหล่งที่มาของข้อมูล
  • Claude: Anthropic ซึ่งเป็นห้องปฏิบัติการ AI ที่ตั้งอยู่ในซานฟรานซิสโก เปิดตัว Claude ซึ่งเป็นคู่แข่งของ ChatGPT ที่มีชื่อเสียงในด้านการเขียนและการเขียนโค้ด
  • Perplexity: ในฐานะที่เป็นทางเลือกอื่นให้กับ Google หลายคนใช้ Perplexity เพื่อค้นหาเว็บ ได้รับความนิยมอย่างรวดเร็วและจะเป็นแพลตฟอร์มการค้นหาที่ต้องการบนโทรศัพท์ Razr รุ่นใหม่ของ Motorola มีรายงานว่า Samsung กำลังเจรจาเพื่อทำเช่นเดียวกัน
  • Open source models: ชุมชนโอเพนซอร์สได้เผยแพร่ LLM ที่คุณสามารถเรียกใช้บนเซิร์ฟเวอร์ของคุณเอง LLM เหล่านี้สามารถช่วยให้คุณควบคุมข้อมูลของคุณ และหลีกเลี่ยงการล็อกอินของผู้ขาย LLM โอเพนซอร์สมีขนาดเล็กกว่า ChatGPT มาก และตั้งค่าได้ยากกว่า แต่สามารถให้ผลลัพธ์ที่น่าประทับใจได้หากคุณมีความสามารถทางเทคนิค โมเดล Llama ของ Meta เป็นโมเดลที่เป็นที่รู้จักกันดีที่สุด ตัวเลือกอื่นๆ ได้แก่ Open Assistant, Alpaca, Vicuna และ Dolly 2