Trong một động thái được dự đoán sẽ định hình lại bối cảnh sáng tạo kỹ thuật số, OpenAI đã mở rộng cánh cửa cho khả năng tạo ảnh tinh vi của mình, tích hợp chúng trực tiếp vào ChatGPT và cung cấp cho toàn bộ cơ sở người dùng. Việc dân chủ hóa công cụ AI mạnh mẽ này, trước đây thường là đặc quyền dành riêng cho những người đăng ký trả phí trong thế giới công nghệ, đánh dấu một bước tiến lớn trong việc đưa trí tuệ nhân tạo tiên tiến vào dòng chính. Tính năng này, được hỗ trợ bởi mô hình GPT-4o đáng gờm, không còn bị giới hạn sau tường phí; cả người đăng ký trả phí và người dùng miễn phí giờ đây đều có thể khai thác tiềm năng của nó để tạo ra hình ảnh từ các lời nhắc văn bản. Tuy nhiên, sự mở rộng này diễn ra dưới một đám mây u ám, bị phủ bóng bởi một phản ứng dữ dội gần đây và mạnh mẽ liên quan đến xu hướng của công cụ trong việc bắt chước các phong cách nghệ thuật cụ thể, được yêu thích, đáng chú ý nhất là của hãng phim hoạt hình Nhật Bản được tôn kính, Studio Ghibli.
Thông báo, được CEO Sam Altman đưa ra một cách chiến lược qua một bài đăng trên nền tảng mạng xã hội X (trước đây là Twitter) vào ngày 1 tháng 4, ban đầu đã gây ra sự hoài nghi trong giới quan sát vốn quen với những trò đùa ngày Cá tháng Tư. Tuy nhiên, tin tức này đã được chứng minh là thật. Người dùng nhanh chóng xác nhận khả năng mới của họ trong việc tạo ảnh trực tiếp trong giao diện ChatGPT quen thuộc, ngay cả khi không sở hữu gói đăng ký ChatGPT Plus đáng mơ ước. Sự tích hợp liền mạch này đại diện cho việc hạ thấp đáng kể rào cản gia nhập cho các cá nhân muốn thử nghiệm hoặc sử dụng công nghệ tổng hợp hình ảnh AI tiên tiến. Tuy nhiên, Altman đã làm rõ rằng quyền truy cập mở này cho người dùng miễn phí sẽ đi kèm với những hạn chế nhất định, ám chỉ về các giới hạn tỷ lệ hàng ngày sắp tới – cụ thể là giới hạn người dùng không trả phí ở mức ba lần tạo ảnh mỗi ngày. Biện pháp này có khả năng nhằm quản lý tài nguyên tính toán trong khi vẫn cung cấp một trải nghiệm đáng kể về sức mạnh của công cụ.
Bóng ma của sự bắt chước phong cách: Vụ việc Ghibli
Thời điểm triển khai phổ cập này đặc biệt đáng chú ý, diễn ra ngay sau một thách thức quan hệ công chúng đáng kể đối với OpenAI. Khả năng của trình tạo ảnh ban đầu được giới thiệu trong một buổi trình diễn trực tiếp do Altman dẫn dắt vào ngày 25 tháng 3. Mặc dù ấn tượng về mặt kỹ thuật, buổi trình diễn và các thử nghiệm sau đó của người dùng đã nhanh chóng dẫn đến sự gia tăng của các hình ảnh gợi nhớ một cách nổi bật đến thẩm mỹ biểu tượng của Studio Ghibli. Làn sóng nghệ thuật do AI tạo ra này, lặp lại những khu rừng huyền ảo, các nhân vật đáng yêu và ngôn ngữ hình ảnh đặc biệt của các bộ phim như My Neighbor Totoro và Spirited Away, đã gây ra một cơn bão chỉ trích trực tuyến.
Phản ứng dữ dội bắt nguồn từ nhiều mối quan tâm giao nhau. Thứ nhất, có những câu hỏi ngay lập tức xung quanh bản quyền và quyền sở hữu nghệ thuật. Liệu AI, được huấn luyện trên các bộ dữ liệu khổng lồ có khả năng bao gồm các tác phẩm của Ghibli, có thể tái tạo một phong cách đặc biệt như vậy một cách hợp pháp hoặc có đạo đức mà không cần sự cho phép? Các nghệ sĩ và nhà sáng tạo đã bày tỏ lo ngại về khả năng giảm giá trị của nghệ thuật độc đáo của con người khi AI có thể tạo ra các bản sao chấp nhận được theo yêu cầu. Sự dễ dàng mà công cụ có thể tạo ra hình ảnh ‘theo phong cách Ghibli’ đã gióng lên hồi chuông báo động về tương lai của sở hữu trí tuệ trong thời đại AI tạo sinh. Nhiều người cho rằng mặc dù nguồn cảm hứng là nền tảng của sự sáng tạo, việc một cỗ máy sao chép phong cách trực tiếp vượt qua ranh giới đạo đức, đặc biệt là khi những người sáng tạo ban đầu không nhận được lợi ích hay sự công nhận nào.
Thứ hai, cuộc tranh cãi càng trở nên gay gắt bởi quan điểm được ghi nhận rõ ràng và bày tỏ mạnh mẽ của người đồng sáng lập Studio Ghibli, Hayao Miyazaki. Là một nhân vật huyền thoại trong lĩnh vực hoạt hình, Miyazaki đã công khai bày tỏ sự khinh miệt sâu sắc đối với trí tuệ nhân tạo, đặc biệt là trong bối cảnh sáng tạo nghệ thuật. Ông đã mô tả hoạt hình do AI tạo ra mà ông được xem là một ‘sự xúc phạm đến chính sự sống’, về cơ bản không đồng ý với quan điểm rằng máy móc thiếu kinh nghiệm hoặc cảm xúc thực sự của con người có thể tạo ra nghệ thuật có ý nghĩa. Do đó, việc tạo ra hình ảnh cố ý theo phong cách của studio của ông, đối với nhiều nhà bình luận và người hâm mộ, không chỉ là một hành vi vi phạm bản quyền tiềm ẩn, mà còn là một hành động thiếu tôn trọng sâu sắc đối với một bậc thầy thủ công và các nguyên tắc mà ông hết lòng tuân thủ. Các nền tảng mạng xã hội xôn xao với những người dùng nhấn mạnh các bình luận trước đây của Miyazaki, coi sản phẩm của công cụ OpenAI là sự xúc phạm trực tiếp đến chính đặc tính mà Ghibli đại diện.
Lập trường của OpenAI: Điều hướng ‘Tự do Sáng tạo’ và Ranh giới Nội dung
Đối mặt với sự chỉ trích ngày càng tăng này, OpenAI đã đưa ra các phản hồi tập trung vào nguyên tắc ‘tự do sáng tạo’. Công ty bảo vệ khả năng của công cụ, cho rằng người dùng nên có phạm vi rộng rãi trong việc khám phá các phong cách nghệ thuật và tạo ra hình ảnh đa dạng. Tuy nhiên, lập trường này ngay lập tức đặt ra những câu hỏi phức tạp về việc nên vẽ ra ranh giới ở đâu. Việc xác định ranh giới của ‘tự do’ chấp nhận được trong việc tạo ra AI đang chứng tỏ là một thách thức ghê gớm, đặc biệt là liên quan đến nội dung có khả năng ‘xúc phạm’ hoặc có vấn đề về đạo đức.
Trong buổi trình diễn ban đầu và trong các thông báo tiếp theo, Sam Altman đã giải thích chi tiết về triết lý của công ty. Ông bày tỏ mong muốn công cụ sẽ trao quyền cho người dùng, nói rằng, ‘Chúng tôi muốn mọi người thực sự để mọi người tạo ra những gì họ muốn’. Tuy nhiên, tham vọng này lại vấp phải những khó khăn cố hữu của việc kiểm duyệt nội dung ở quy mô lớn. Altman tiếp tục làm rõ cách tiếp cận đa sắc thái của công ty đối với tài liệu có khả năng gây khó chịu: ‘Điều chúng tôi muốn hướng tới là công cụ không tạo ra những thứ gây khó chịu trừ khi bạn muốn, trong trường hợp đó, trong giới hạn hợp lý, nó sẽ làm’. Tuyên bố này gợi ý một mô hình trong đó ý định của người dùng đóng một vai trò, cho phép tạo ra nội dung có khả năng gây tranh cãi trong các giới hạn không xác định, trong khi có lẽ lọc bỏ các kết quả đầu ra có hại nghiêm trọng theo mặc định.
Việc đi trên dây này giữa việc cho phép người dùng thể hiện và ngăn chặn lạm dụng đầy rẫy nguy hiểm. OpenAI thừa nhận sự căng thẳng này, với Altman lưu ý trong cùng một bài đăng trên X, ‘Như chúng tôi đã nói trong thông số kỹ thuật mô hình của mình, chúng tôi nghĩ rằng việc đặt quyền tự do trí tuệ và quyền kiểm soát này vào tay người dùng là điều đúng đắn, nhưng chúng tôi sẽ quan sát xem nó diễn ra như thế nào và lắng nghe xã hội’. Cam kết quan sát và phản hồi xã hội này cho thấy nhận thức rằng khuôn khổ hiện tại là tạm thời và có thể được sửa đổi dựa trên việc sử dụng trong thế giới thực và phản ứng của công chúng. Công ty dường như đã chuẩn bị để điều chỉnh các chính sách của mình khi thu thập dữ liệu về cách công cụ được sử dụng, đặc biệt là bây giờ khi nó có thể truy cập được bởi một cơ sở người dùng rộng lớn hơn, ít được kiểm soát hơn.
Thách thức nằm ở việc chuyển đổi những nguyên tắc trừu tượng này thành các lan can kỹ thuật và chính sách cụ thể.
- Làm thế nào AI phân biệt giữa khám phá nghệ thuật và định kiến có hại?
- Ranh giới được vẽ ra ở đâu giữa việc bắt chước một phong cách cho mục đích sáng tạo và vi phạm bản quyền hoặc tạo ra deepfake lừa đảo?
- Làm thế nào ‘xúc phạm’ có thể được định nghĩa một cách khách quan qua các bối cảnh văn hóa đa dạng?
- Liệu AI có thể thực sự hiểu ‘ý định’ của người dùng khi tạo ra nội dung có khả năng gây vấn đề?
Đây không chỉ đơn thuần là những rào cản kỹ thuật; chúng là những câu hỏi triết học sâu sắc mà OpenAI, và thực sự là toàn bộ ngành công nghiệp AI, phải vật lộn. Quyết định cấp quyền truy cập miễn phí càng làm tăng tính cấp bách của việc tìm ra các câu trả lời khả thi, vì tiềm năng cho cả sự phát triển sáng tạo và lạm dụng có vấn đề mở rộng theo cấp số nhân với cơ sở người dùng.
Dân chủ hóa vs. Khuếch đại: Con dao hai lưỡi của việc truy cập miễn phí
Việc cung cấp miễn phí các công cụ AI tinh vi như trình tạo ảnh được hỗ trợ bởi GPT-4o đại diện cho một bước tiến đáng kể hướng tới dân chủ hóa trí tuệ nhân tạo. Trong lịch sử, việc tiếp cận công nghệ tiên tiến thường bị phân tầng theo chi phí, giới hạn thử nghiệm và ứng dụng cho các tổ chức được tài trợ tốt hoặc các cá nhân trả phí. Bằng cách loại bỏ rào cản đăng ký, OpenAI cho phép sinh viên, nghệ sĩ có phương tiện hạn chế, nhà giáo dục, doanh nghiệp nhỏ và các cá nhân tò mò trên toàn thế giới tham gia trực tiếp vào các khả năng tạo sinh mạnh mẽ.
Quyền truy cập rộng rãi hơn này có khả năng:
- Thúc đẩy Đổi mới: Nhiều người dùng đa dạng hơn thử nghiệm công cụ có thể dẫn đến các ứng dụng không lường trước và những đột phá sáng tạo.
- Nâng cao Kiến thức Kỹ thuật số: Trải nghiệm thực tế giúp giải mã AI, thúc đẩy sự hiểu biết tốt hơn của công chúng về khả năng và hạn chế của nó.
- San bằng Sân chơi: Các nhà sáng tạo hoặc doanh nghiệp nhỏ có thể truy cập các công cụ trước đây chỉ dành cho các đối thủ cạnh tranh lớn hơn, có khả năng thúc đẩy sự năng động thị trường lớn hơn.
- Tăng tốc Chu kỳ Phản hồi: Cơ sở người dùng lớn hơn cung cấp cho OpenAI nhiều dữ liệu hơn để tinh chỉnh mô hình, xác định sai sót và hiểu tác động xã hội nhanh hơn.
Tuy nhiên, sự dân chủ hóa này gắn liền chặt chẽ với việc khuếch đại các thách thức hiện có. Chính những vấn đề đã nổi lên trong quá trình triển khai hạn chế – lo ngại về bản quyền, chiếm đoạt phong cách, khả năng tạo ra nội dung gây hiểu lầm hoặc xúc phạm – có khả năng sẽ gia tăng mạnh mẽ hơn bây giờ khi công cụ nằm trong tay hàng triệu người dùng. Tranh cãi về Ghibli đóng vai trò như một bản xem trước mạnh mẽ về các loại xung đột có thể trở nên thường xuyên và lan rộng hơn.
Việc giới thiệu giới hạn tỷ lệ cho người dùng miễn phí (ba hình ảnh mỗi ngày) hoạt động như một phanh hãm một phần, ngăn chặn việc tạo ra không giới hạn có thể làm quá tải máy chủ hoặc tạo điều kiện cho việc tạo ra hàng loạt nội dung có vấn đề. Tuy nhiên, ngay cả quyền truy cập hạn chế này cũng cho phép thử nghiệm và đầu ra đáng kể trên toàn bộ cơ sở người dùng toàn cầu. Quy mô sử dụng tiềm năng tuyệt đối có nghĩa là ngay cả các trường hợp lạm dụng nhỏ lẻ cũng có thể trở nên rất dễ thấy và có vấn đề. Hệ thống kiểm duyệt nội dung và cơ chế thực thi chính sách của OpenAI sẽ phải đối mặt với các bài kiểm tra căng thẳng chưa từng có. Khả năng ‘quan sát xem nó diễn ra như thế nào và lắng nghe xã hội’ của công ty sẽ rất quan trọng, đòi hỏi khả năng giám sát mạnh mẽ, khả năng phản ứng nhanh chóng và sẵn sàng điều chỉnh chính sách khi đối mặt với các vấn đề mới nổi. Câu hỏi vẫn là liệu các cơ chế kiểm soát có thể theo kịp với quyền tự do rộng lớn được cấp hay không. Tiềm năng lạm dụng, từ việc tạo ra hình ảnh không có sự đồng thuận đến việc lan truyền thông tin sai lệch bằng hình ảnh, đang hiện hữu rất lớn.
Thử nghiệm đang diễn ra
Quyết định của OpenAI về việc phổ cập quyền truy cập vào trình tạo ảnh của mình, bất chấp những xáo trộn gần đây xung quanh việc sao chép phong cách nghệ thuật, đánh dấu một bước đi táo bạo, có lẽ là cần thiết, trong sự phát triển của AI có sẵn công khai. Nó phản ánh sựtự tin vào sức hấp dẫn của công nghệ và một cú hích chiến lược hướng tới việc áp dụng rộng rãi hơn, có khả năng củng cố vị trí của ChatGPT như một trung tâm cho các tương tác AI đa dạng. Tuy nhiên, nó cũng đẩy OpenAI mạnh mẽ hơn vào đấu trường phức tạp của việc triển khai AI có đạo đức và kiểm duyệt nội dung quy mô lớn.
Sự hội tụ của quyền truy cập miễn phí, khả năng mạnh mẽ và các cuộc tranh luận đạo đức chưa được giải quyết tạo ra một hỗn hợp mạnh mẽ. Công ty về cơ bản đang khởi động một thử nghiệm khổng lồ trong thế giới thực. Mặc dù lợi ích tiềm năng của việc dân chủ hóa công nghệ như vậy là đáng kể, nhưng những rủi ro liên quan đến lạm dụng, tranh chấp bản quyền và việc tạo ra nội dung xúc phạm hoặc có hại cũng không kém phần quan trọng. Những tháng tới có thể sẽ chứng kiến thêm các cuộc tranh luận nổ ra khi người dùng đẩy ranh giới của công cụ, kiểm tra giới hạn của các chính sách của OpenAI và định nghĩa của nó về ‘tự do sáng tạo’. Kết quả của việc triển khai rộng rãi này sẽ không chỉ định hình quỹ đạo tương lai của các công cụ tạo ảnh của OpenAI mà còn có thể đặt ra tiền lệ cho cách các công nghệ AI mạnh mẽ khác được triển khai và quản lý trên toàn cầu. Sự cân bằng giữa việc trao quyền sáng tạo và giảm thiểu tác hại vẫn còn mong manh, và với cánh cửa giờ đây đã rộng mở, thế giới đang theo dõi để xem OpenAI điều hướng con đường phía trước như thế nào. Hành trình vào kỷ nguyên mới của việc tạo ảnh AI dễ tiếp cận này đã bắt đầu, mang theo cả lời hứa to lớn và nguy hiểm đáng kể.