ลมกระซิบ AI: OpenAI ปลุกฝันดิจิทัลสไตล์ Ghibli

ภูมิทัศน์ดิจิทัล ซึ่งมักเป็นผืนผ้าใบอันวุ่นวายของเทรนด์ที่ผ่านมาแล้วผ่านไปและเนื้อหาที่ไม่จีรังยั่งยืน เพิ่งผ่านการเปลี่ยนแปลงที่ชัดเจนและค่อนข้างน่าหลงใหล ดูเหมือนว่าในชั่วข้ามคืน ฟีดโซเชียลมีเดียเริ่มเบ่งบานด้วยสุนทรียศาสตร์เฉพาะอย่างหนึ่ง ซึ่งมีลักษณะเด่นคือแสงที่นุ่มนวลเหมือนภาพวาด ตัวละครที่แสดงออกและตาโต และทิวทัศน์ที่เต็มไปด้วยความรู้สึกมหัศจรรย์อันอ่อนโยน ผู้สังเกตการณ์ที่คุ้นเคยกับโลกแห่งแอนิเมชันจำสไตล์อันเป็นเอกลักษณ์ได้ทันที: Studio Ghibli สตูดิโอแอนิเมชันญี่ปุ่นอันเป็นที่รักซึ่งร่วมก่อตั้งโดย Hayao Miyazaki ผู้เป็นตำนาน การแพร่กระจายอย่างกะทันหันนี้ไม่ได้เป็นผลมาจากการเปิดตัวภาพยนตร์เรื่องใหม่หรือแคมเปญของแฟนคลับที่ประสานงานกัน แต่เป็นผลที่ไม่คาดคิดจากความก้าวหน้าทางเทคโนโลยีที่มาจากใจกลางของการปฏิวัติปัญญาประดิษฐ์: การอัปเดตโมเดล GPT-4o อันทรงพลังของ OpenAI อินเทอร์เน็ต ในแบบฉบับที่เลียนแบบไม่ได้ ได้คว้าเครื่องมือใหม่และแต่งแต้มเมืองให้เป็น Ghibli

จุดกำเนิดของขบวนการศิลปะดิจิทัล: ประกายไฟจาก GPT-4o

ตัวเร่งปฏิกิริยาสำหรับการระเบิดทางศิลปะนี้มาถึงโดยไม่มีการประโคมข่าวมากนักแต่มีผลกระทบอย่างมีนัยสำคัญ OpenAI ซึ่งเป็นผู้นำในสาขาปัญญาประดิษฐ์ที่พัฒนาอย่างรวดเร็ว ได้เปิดตัวการปรับปรุงโมเดลหลายรูปแบบ (multimodal model) อย่าง GPT-4o แม้ว่าการอัปเดตจะนำมาซึ่งการปรับปรุงต่างๆ แต่การพัฒนาที่สำคัญอยู่ที่ความสามารถในการสร้างภาพ ซึ่งรวมเข้ากับอินเทอร์เฟซ ChatGPT โดยตรง นี่ไม่ใช่แค่การอัปเกรดเล็กน้อย ผู้ใช้ค้นพบอย่างรวดเร็วว่าโมเดลมีความถนัดที่น่าตกใจในการตีความพรอมต์ (prompt) เชิงสไตล์ด้วยความเที่ยงตรงที่เพิ่งค้นพบใหม่ เมื่อได้รับพรอมต์ให้เลียนแบบภาษาภาพอันโดดเด่นของ Studio Ghibli ผลลัพธ์ที่ได้ สำหรับหลายๆ คนนั้น แม่นยำและกระตุ้นความรู้สึกได้อย่างน่าอัศจรรย์

เครื่องมือสร้างภาพ AI รุ่นก่อนๆ รวมถึงซีรีส์ DALL·E ของ OpenAI เอง ก็สามารถสร้างภาพที่มีสไตล์ได้อย่างแน่นอน อย่างไรก็ตาม การบรรลุถึงความแตกต่างเฉพาะของลายเซ็นทางศิลปะที่ชัดเจนอย่าง Ghibli เช่น วิธีที่แสงตกกระทบ การออกแบบตัวละครที่เป็นเอกลักษณ์ การผสมผสานระหว่างรายละเอียดและความนุ่มนวล มักเป็นเรื่องท้าทายหรือส่งผลให้เกิดการตีความทั่วไป แต่ GPT-4o แสดงให้เห็นถึงความเข้าใจที่ซับซ้อนมากขึ้น ดูเหมือนว่าจะสามารถเข้าใจ แก่นแท้ ของสุนทรียศาสตร์แบบ Ghibli โดยแปลพรอมต์ไม่ใช่แค่ตามตัวอักษร แต่ตามสไตล์ด้วย

กลไกเบื้องหลังความสามารถที่ได้รับการปรับปรุงนี้ส่วนหนึ่งอยู่ที่สถาปัตยกรรมและการฝึกฝนของโมเดล ซึ่งแตกต่างจากโมเดลรุ่นก่อนๆ บางรุ่นที่สร้างภาพในครั้งเดียว มีรายงานว่า GPT-4o สร้างภาพทีละน้อย ซึ่งอาจช่วยให้สามารถใช้องค์ประกอบเชิงสไตล์ได้อย่างเป็นชั้นๆ และมีความแตกต่างกันมากขึ้น นอกจากนี้ ชุดข้อมูลขนาดใหญ่ที่โมเดลภาษาขนาดใหญ่และโมเดลหลายรูปแบบเหล่านี้ได้รับการฝึกฝน ย่อมรวมถึงตัวอย่างนับไม่ถ้วนของงานศิลปะที่มีอิทธิพลของ Ghibli ทำให้ AI สามารถเรียนรู้และจำลองลักษณะเฉพาะที่กำหนดได้

การรวมเข้ากับอินเทอร์เฟซ ChatGPT ที่คุ้นเคยก็มีบทบาทสำคัญเช่นกัน มันลดอุปสรรคในการเข้าถึง ทำให้การสร้างภาพที่ซับซ้อนเข้าถึงได้ง่ายขึ้นสำหรับผู้ชมในวงกว้าง นอกเหนือจากนักออกแบบกราฟิกโดยเฉพาะหรือผู้ที่ชื่นชอบ AI พรอมต์เชิงสนทนาง่ายๆ ก็เพียงพอแล้วที่จะเสกสรรภาพที่ก่อนหน้านี้ต้องใช้ซอฟต์แวร์พิเศษหรือทักษะทางศิลปะอย่างมาก ความง่ายในการใช้งานนี้ รวมกับคุณภาพที่สูงอย่างน่าประหลาดใจของผลลัพธ์สไตล์ Ghibli ได้สร้างพายุที่สมบูรณ์แบบสำหรับการนำไปใช้ในวงกว้าง (viral adoption)

ไฟลามทุ่งแบบไวรัล: แต่งแต้มอินเทอร์เน็ตให้เป็น Ghibli

เมื่อมีการค้นพบครั้งแรก ปรากฏการณ์นี้ก็แพร่กระจายไปอย่างรวดเร็วทั่วแพลตฟอร์มโซเชียลมีเดียหลักๆ X (เดิมคือ Twitter), Instagram, Reddit และชุมชนออนไลน์อื่นๆ กลายเป็นแกลเลอรีที่จัดแสดงผลงานสร้างสรรค์สไตล์ Ghibli ที่สร้างโดย AI ความหลากหลายของหัวข้อนั้นน่าทึ่ง แสดงให้เห็นถึงความเก่งกาจที่ผู้ใช้พบในเครื่องมือนี้:

*ภาพบุคคล: ผู้ใช้ป้อนภาพเซลฟี่และภาพถ่ายของเพื่อนและครอบครัวเข้าไปใน AI โดยขอให้เปลี่ยนเป็นสไตล์ Ghibli ผลลัพธ์มักจะมีดวงตาโตที่แสดงออกถึงอารมณ์และลักษณะที่นุ่มนวลขึ้นซึ่งเกี่ยวข้องกับตัวละครของ Miyazaki

  • ภาพสัตว์เลี้ยง: สัตว์เลี้ยงแสนรัก – แมว สุนัข และเพื่อนร่วมทางที่แปลกใหม่กว่า – ถูกจินตนาการใหม่ให้เป็นสิ่งมีชีวิตที่แปลกประหลาดซึ่งอาจอาศัยอยู่ในป่าของ My Neighbor Totoro หรือท้องฟ้าของ Kiki’s Delivery Service
  • ทิวทัศน์แฟนตาซี: ฉากธรรมดาหรือทิวทัศน์ในจินตนาการถูกสร้างขึ้นด้วยโทนสีน้ำที่นุ่มนวล ใบไม้ที่มีรายละเอียด และแสงบรรยากาศที่เป็นแบบฉบับของภาพพื้นหลังของ Ghibli ทิวทัศน์เมืองกลายเป็นเมืองที่มีเสน่ห์และชวนให้นึกถึงอดีตเล็กน้อย ป่าไม้ลึกขึ้นและมีมนต์ขลังมากขึ้น
  • การผสมผสานวัฒนธรรมป๊อป: คนดัง บุคคลในประวัติศาสตร์ และตัวละครจากแฟรนไชส์อื่นๆ ได้รับการปรับแต่งสไตล์ Ghibli ทำให้เกิดการผสมผสานที่น่าขบขันและมักจะเข้ากันได้อย่างน่าประหลาดใจ
  • วัตถุไม่มีชีวิต: แม้แต่วัตถุในชีวิตประจำวัน เช่น จักรยานหรือแก้วกาแฟ ก็ยังเต็มไปด้วยเสน่ห์และบุคลิกบางอย่างเมื่อแสดงผลในสไตล์ Ghibli ราวกับว่าพวกมันอาจมีชีวิตขึ้นมาได้ทุกเมื่อ

แฮชแท็ก เช่น #GhibliStyle, #AIGhibli, และ #GPT4oArt เริ่มได้รับความนิยมอย่างรวดเร็ว รวบรวมผลงานสร้างสรรค์และเพิ่มการมองเห็น ผู้ใช้ไม่เพียงแต่แบ่งปันผลลัพธ์ของตนเท่านั้น แต่ยังรวมถึงพรอมต์ที่พวกเขาใช้ด้วย ส่งเสริมสภาพแวดล้อมการทำงานร่วมกันที่ผู้อื่นสามารถทดลองและปรับปรุงเทคนิคของตนได้ เสน่ห์นั้นไม่อาจปฏิเสธได้ – มันเป็นหนทางสำหรับบุคคล โดยไม่คำนึงถึงความสามารถทางศิลปะของพวกเขา ที่จะเข้าร่วมในโลกทัศน์ของสตูดิโอแอนิเมชันอันเป็นที่รักอย่างสุดซึ้ง

เทรนด์นี้ยังได้รับความสนใจจากบุคคลสำคัญในอุตสาหกรรมเทคโนโลยีอีกด้วย Sam Altman ซีอีโอของ OpenAI เองก็แสดงความคิดเห็นอย่างติดตลกเกี่ยวกับปรากฏการณ์นี้ผ่านทาง X โดยสะท้อนถึงการประยุกต์ใช้เทคโนโลยีอันทรงพลังที่บางครั้งก็คาดไม่ถึง โพสต์ของเขา ซึ่งยอมรับถึงข้อความจำนวนมากที่เปลี่ยนเขาให้กลายเป็น ‘twink Ghibli style’ ได้เน้นย้ำถึงเสียงสะท้อนทางวัฒนธรรมและทิศทางที่ค่อนข้างไร้สาระที่ความสามารถของ AI ได้รับในสายตาของสาธารณชน ซึ่งตรงกันข้ามกับเป้าหมายที่สูงส่งและเปลี่ยนแปลงโลกที่มักเกี่ยวข้องกับการพัฒนา AI การยอมรับจากผู้บริหารระดับสูงนี้ยิ่งกระตุ้นการสนทนาและยืนยันความสำคัญของเทรนด์นี้

การนำทางฟีเจอร์ใหม่: การเข้าถึงและความผิดปกติ

ฟีเจอร์เฉพาะที่ขับเคลื่อนเทรนด์นี้มีชื่อเรียกว่า ‘Images in ChatGPT’ ซึ่งรวมเข้ากับความสามารถในการสนทนาของโมเดล GPT-4o ได้อย่างราบรื่น แม้ว่า OpenAI จะทำให้ฟีเจอร์นี้พร้อมใช้งานในวงกว้าง แต่การเปิดตัวก็ไม่ได้ราบรื่นทั้งหมด ซึ่งตอกย้ำถึงความท้าทายในการปรับใช้ AI ที่ล้ำสมัยในวงกว้าง

ในตอนแรก ความต้องการที่ล้นหลามนำไปสู่ข้อจำกัดและความล่าช้า โดยเฉพาะอย่างยิ่งสำหรับผู้ใช้ที่เข้าถึง ChatGPT ผ่านระดับฟรี ทรัพยากรการคำนวณที่จำเป็นสำหรับการสร้างภาพคุณภาพสูงนั้นมีจำนวนมาก และการจัดการภาระงานของเซิร์ฟเวอร์ในขณะที่รับประกันประสบการณ์ผู้ใช้ที่ดีนั้นเป็นการรักษาสมดุลอย่างต่อเนื่องสำหรับบริษัท AI ผู้สมัครสมาชิกแบบชำระเงินโดยทั่วไปจะได้รับการเข้าถึงที่สม่ำเสมอมากขึ้น ซึ่งสะท้อนถึงรูปแบบบริการแบบแบ่งระดับที่พบได้ทั่วไปในอุตสาหกรรม

นอกเหนือจากปัญหาการเข้าถึงแล้ว เทคโนโลยีเองก็แสดงข้อบกพร่องบางอย่าง มีรายงานว่าข้อบกพร่องในช่วงแรกทำให้โมเดลตอบสนองต่อพรอมต์ที่ขอ ‘sexy men’ แตกต่างจาก ‘sexy women’ โดยไม่สามารถสร้างภาพหลังได้ในขณะที่ตอบสนองต่อภาพแรก OpenAI รับทราบและแก้ไขปัญหานี้แล้ว แต่มันทำหน้าที่เป็นเครื่องเตือนใจถึงความท้าทายอย่างต่อเนื่องในการลดอคติและรับประกันพฤติกรรมที่สอดคล้องและเหมาะสมในระบบ AI ที่ซับซ้อน โมเดลเหล่านี้เรียนรู้จากชุดข้อมูลขนาดใหญ่ที่มนุษย์สร้างขึ้น และอคติที่ไม่ได้ตั้งใจหรือพฤติกรรมที่เกิดขึ้นใหม่ที่ไม่คาดคิดเป็นประเด็นของการวิจัยและพัฒนาอย่างต่อเนื่อง

แม้จะมีข้อสะดุดในช่วงแรกเหล่านี้ เทคโนโลยีพื้นฐานก็แสดงถึงก้าวสำคัญไปข้างหน้า วิธีการสร้างภาพทีละส่วนตามที่มีรายงาน ซึ่งตรงกันข้ามกับแนวทางแบบทำทั้งหมดในคราวเดียวของโมเดลรุ่นก่อนๆ เช่น DALL·E ชี้ให้เห็นถึงกระบวนการที่ละเอียดอ่อนยิ่งขึ้น การปรับแต่งแบบวนซ้ำนี้อาจส่งผลให้เกิดความสอดคล้อง รายละเอียด และการยึดมั่นในสไตล์ที่ดีขึ้นที่สังเกตได้ในผลลัพธ์ของ GPT-4o โดยเฉพาะอย่างยิ่งความสามารถในการจับภาพความละเอียดอ่อนของสุนทรียศาสตร์แบบ Ghibli

เสน่ห์อันยั่งยืนของ Ghibli: ทำไมสไตล์นี้ถึงโดนใจ

คำถามเกิดขึ้น: ทำไมสไตล์ Ghibli เหนือสิ่งอื่นใด จึงกลายเป็นสุนทรียศาสตร์ที่กำหนดช่วงเวลา AI นี้? คำตอบอยู่ที่ผลกระทบทางวัฒนธรรมที่ลึกซึ้งและยั่งยืนของ Studio Ghibli เอง

  • การยอมรับและความรักในระดับโลก: ภาพยนตร์ของ Studio Ghibli รวมถึงผลงานชิ้นเอกอย่าง Spirited Away, My Neighbor Totoro, Howl’s Moving Castle, และ Princess Mononoke ได้รับความนิยมอย่างล้นหลามทั่วโลก พวกเขาก้าวข้ามความแตกแยกทางวัฒนธรรมและรุ่นอายุ เป็นที่รักในการเล่าเรื่อง ศิลปะ และความลึกซึ้งทางอารมณ์
  • สุนทรียศาสตร์ที่โดดเด่นและน่าดึงดูด: สไตล์ภาพของ Ghibli เป็นที่จดจำได้ทันทีและได้รับการชื่นชมอย่างกว้างขวาง มันผสมผสานรายละเอียดที่พิถีพิถันเข้ากับคุณภาพที่นุ่มนวลเหมือนภาพวาด สร้างโลกที่ให้ความรู้สึกทั้งเพ้อฝันและติดดิน การออกแบบตัวละครนั้นแสดงออกและเข้าถึงได้ง่าย ในขณะที่ทิวทัศน์กระตุ้นความรู้สึกถึงความคิดถึง ความพิศวง และความกลมกลืนกับธรรมชาติ สุนทรียศาสตร์นี้ดึงดูดใจผู้คนจำนวนมากที่เติบโตมากับการชมภาพยนตร์เหล่านี้
  • ความผูกพันทางอารมณ์: ภาพยนตร์ Ghibli มักสำรวจธีมสากลของวัยเด็ก การอนุรักษ์สิ่งแวดล้อม สันติภาพ ความรัก และการสูญเสียด้วยความละเอียดอ่อนและความแตกต่าง ผู้ชมสร้างความผูกพันทางอารมณ์อย่างลึกซึ้งกับตัวละครและการเดินทางของพวกเขา ความสามารถในการก้าวเข้าสู่โลกทัศน์นั้นชั่วขณะ แม้จะผ่านภาพที่สร้างโดย AI ก็ตาม เป็นการแตะเข้าไปในแหล่งสะสมทางอารมณ์ที่มีอยู่เดิมนี้
  • เนื้อหาที่ ‘ดีงาม’: ในยุคดิจิทัลที่มักจะมองโลกในแง่ร้าย ธรรมชาติโดยทั่วไปที่ดีงามและมองโลกในแง่ดีของโลก Ghibli มอบการหลีกหนีที่ปลอบโยน การสร้างภาพในสไตล์นี้ช่วยให้ผู้ใช้สามารถสร้างและแบ่งปันเนื้อหาที่เต็มไปด้วยความรู้สึกอบอุ่นและแง่บวกนี้

ดังนั้น GPT-4o ไม่เพียงแต่ให้เครื่องมือเท่านั้น แต่ยังให้เครื่องมือที่สามารถจำลองสุนทรียศาสตร์ที่ฝังลึกอยู่ในจิตสำนึกทางวัฒนธรรมและเกี่ยวข้องกับอารมณ์เชิงบวกและการชื่นชมทางศิลปะ AI ทำหน้าที่เป็นท่อส่ง ช่วยให้ผู้คนนับล้านมีส่วนร่วมอย่างสร้างสรรค์กับสไตล์อันเป็นที่รัก ทำให้ความสามารถในการผลิตภาพที่สะท้อนความมหัศจรรย์ของ Miyazaki และผู้ร่วมงานของเขาเป็นประชาธิปไตย

นัยยะที่กว้างขึ้น: ศิลปะ, AI, และความเป็นผู้สร้างสรรค์

ในขณะที่เทรนด์สไตล์ Ghibli ส่วนใหญ่เป็นการเฉลิมฉลอง แต่ก็หลีกเลี่ยงไม่ได้ที่จะแตะต้องบทสนทนาที่กว้างขึ้นเกี่ยวกับปัญญาประดิษฐ์และความคิดสร้างสรรค์

ความง่ายดายที่ผู้ใช้สามารถสร้างภาพที่สวยงามน่าพึงพอใจในสไตล์ที่เฉพาะเจาะจงและซับซ้อนได้ ทำให้เกิดคำถามเกี่ยวกับธรรมชาติของการสร้างสรรค์งานศิลปะ มันลดคุณค่าทักษะและความพยายามของศิลปินมนุษย์ที่ใช้เวลาหลายปีในการฝึกฝนฝีมือของตนหรือไม่? หรือมันเป็นตัวแทนของรูปแบบใหม่ของการแสดงออกทางความคิดสร้างสรรค์ ที่ซึ่งการป้อนพรอมต์และการคัดสรรกลายเป็นการกระทำทางศิลปะในตัวเอง? เทรนด์นี้แสดงให้เห็นถึงการทำให้เป็นประชาธิปไตยในรูปแบบหนึ่ง ทำให้บุคคลที่ไม่มีการฝึกอบรมทางศิลปะแบบดั้งเดิมสามารถสร้างภาพความคิดของตนในสไตล์ที่ซับซ้อนได้

นอกจากนี้ ความสามารถของ AI ในการเลียนแบบลายเซ็นทางศิลปะที่โดดเด่นยังนำข้อพิจารณาด้านลิขสิทธิ์และทรัพย์สินทางปัญญามาสู่แถวหน้า ในขณะที่การสร้างแฟนอาร์ตโดยทั่วไปเป็นที่ยอมรับ การผลิตภาพจำนวนมากที่หยิบยืมอย่างหนักจากสไตล์ของสตูดิโอเฉพาะ ซึ่งเปิดใช้งานโดยเครื่องมือ AI เชิงพาณิชย์นั้น อยู่ในพื้นที่สีเทา ข้อมูลการฝึกอบรมที่ใช้สำหรับโมเดลเหล่านี้มักรวมถึงงานที่มีลิขสิทธิ์ ซึ่งนำไปสู่การถกเถียงอย่างต่อเนื่องเกี่ยวกับการใช้งานโดยชอบธรรม (fair use) และค่าตอบแทนสำหรับผู้สร้างดั้งเดิม แม้ว่าเทรนด์เฉพาะนี้ดูเหมือนจะขับเคลื่อนด้วยความชื่นชมมากกว่าการแสวงหาผลประโยชน์เชิงพาณิชย์ แต่ก็เน้นย้ำถึงกรอบกฎหมายและจริยธรรมที่พยายามดิ้นรนเพื่อให้ทันกับความก้าวหน้าทางเทคโนโลยี

ปฏิกิริยาจากศิลปินมืออาชีพมักจะผสมปนเปกัน บางคนมองเครื่องมือเหล่านี้ด้วยความสงสัย กลัวการถูกแทนที่งานหรือการทำให้ศิลปะกลายเป็นเนื้อเดียวกัน คนอื่นๆ ยอมรับ AI ในฐานะผู้ช่วยที่มีศักยภาพ เครื่องมือสำหรับการระดมสมอง หรือวิธีเอาชนะอุปสรรคทางความคิดสร้างสรรค์ เทรนด์ Ghibli ซึ่งได้รับแรงหนุนจากความรักในเนื้อหาต้นฉบับ อาจช่วยลดความกังวลเหล่านี้ลงได้บ้าง โดยวางกรอบให้เป็นการแสดงความเคารพมากกว่าการทดแทน ทว่า ความสามารถพื้นฐาน – พลังของ AI ในการจำลองสไตล์ – ยังคงเป็นพลังที่ทรงพลังและอาจก่อกวนได้

คลื่นของภาพที่ได้รับแรงบันดาลใจจาก Ghibli นี้ทำหน้าที่เป็นกรณีศึกษาที่น่าสนใจในจุดตัดของเทคโนโลยีขั้นสูงและวัฒนธรรมสมัยนิยม มันแสดงให้เห็นว่าเครื่องมือ AI ไม่ได้จำกัดอยู่แค่ในห้องปฏิบัติการวิจัยหรือแอปพลิเคชันเฉพาะกลุ่มอีกต่อไป แต่กำลังกำหนดรูปแบบการแสดงออกและการโต้ตอบออนไลน์อย่างแข็งขัน สิ่งที่เริ่มต้นจากการอัปเดตซอฟต์แวร์ได้พัฒนาอย่างรวดเร็วจนกลายเป็นขบวนการศิลปะแบบมีส่วนร่วม ซึ่งขับเคลื่อนโดยความชื่นชมร่วมกันในสุนทรียศาสตร์ที่เป็นเอกลักษณ์และความสามารถที่น่าประหลาดใจของปัญญาประดิษฐ์รุ่นใหม่ ลมดิจิทัล ในช่วงเวลาหนึ่ง ได้กระซิบด้วยโทนเสียงที่ไม่อาจเข้าใจผิดได้ของ Studio Ghibli ซึ่งเสกสรรขึ้นโดยบรรทัดของโค้ดและจินตนาการร่วมกันของอินเทอร์เน็ต