GPT-4.5 của OpenAI: Đắt đỏ, lợi ích hạn chế

Cải tiến tăng dần, chi phí trên trời

OpenAI gần đây đã tiết lộ GPT-4.5, ban đầu được trình bày dưới dạng bản xem trước nghiên cứu. Phiên bản mới này của mô hình ngôn ngữ mạnh mẽ đã được cung cấp trên cơ sở hạn chế, với một mức giá đắt đỏ: Người dùng Pro phải đối mặt với khoản phí 200 đô la hàng tháng, trong khi người dùng Plus có thể truy cập nó với giá 20 đô la mỗi tháng. Trong khi Giám đốc điều hành của OpenAI, Sam Altman, đã quảng cáo GPT-4.5 là một mô hình tự nhiên và đàm thoại hơn, bản phát hành đã nhận được sự đón nhận trái chiều, đặc biệt là liên quan đến khả năng suy luận cốt lõi của nó.

GPT-4.5 tự hào có những cải tiến trong một số lĩnh vực chính. OpenAI tuyên bố cải thiện độ chính xác, giảm xu hướng ‘ảo giác’ (tạo ra thông tin sai lệch) và tăng cường khả năng thuyết phục. Tuy nhiên, những cải tiến này đi kèm với một cái giá đắt. Cơ cấu giá để sử dụng GPT-4.5 được đặt ở mức 75 đô la cho mỗi triệu token đầu vào và 150 đô la đáng kinh ngạc cho mỗi triệu token đầu ra. Mức giá này đã gây ra một cuộc tranh luận gay gắt trong cộng đồng AI, với các chuyên gia chia rẽ sâu sắc về việc liệu những cải tiến gia tăng có biện minh cho một khoản chi tài chính đáng kể như vậy hay không.

Câu hỏi cốt lõi xoay quanh đề xuất giá trị thực tế của GPT-4.5. Mặc dù các cuộc trò chuyện mượt mà hơn và độ chính xác được cải thiện một chút là đáng hoan nghênh, câu hỏi cơ bản vẫn là: liệu nó có đại diện cho một bước tiến đáng kể trong khả năng của AI hay không, hay nó chỉ là một sự cải tiến tốn kém của công nghệ hiện có?

Thử nghiệm thực tế: Mất kết nối với tuyên bố của OpenAI?

Các đánh giá độc lập về GPT-4.5 đã tiếp tục thúc đẩy cuộc tranh luận. Andrej Karpathy, một nhân vật nổi tiếng trong lĩnh vực AI, đã tiến hành một thử nghiệm so sánh giữa GPT-4 và GPT-4.5. Năm nhiệm vụ viết sáng tạo đã được trình bày cho người dùng, sau đó họ được yêu cầu đánh giá chất lượng đầu ra. Đáng ngạc nhiên, kết quả ủng hộ mô hình GPT-4 cũ hơn trong bốn trên năm nhiệm vụ. Kết quả này thách thức trực tiếp quan điểm rằng GPT-4.5 đại diện cho một phiên bản vượt trội toàn diện.

Các đánh giá kỹ thuật của Tiến sĩ Raj Dandeker mang lại kết quả đáng lo ngại tương tự. Các bài kiểm tra của ông tập trung vào các lĩnh vực mà OpenAI đã tuyên bố rõ ràng về sự cải thiện, chẳng hạn như suy luận toán học và suy luận logic. Tuy nhiên, GPT-4.5 được cho là đã gặp khó khăn trong các lĩnh vực này, cho thấy rất ít hoặc không có lợi thế nào so với phiên bản tiền nhiệm. Những phát hiện này mâu thuẫn trực tiếp với các khẳng định của OpenAI và đặt ra những câu hỏi nghiêm trọng về tính minh bạch và chính xác của các tuyên bố tiếp thị của công ty.

Phản ứng của truyền thông và ngành: Một loạt các ý kiến

Phản ứng của giới truyền thông đối với GPT-4.5 đã phản ánh những ý kiến trái chiều trong cộng đồng AI. Tạp chí Wired, một tiếng nói nổi bật trong lĩnh vực báo chí công nghệ, đã đưa ra một quan điểm phê phán, đặt câu hỏi về việc OpenAI theo đuổi không ngừng Trí tuệ nhân tạo tổng quát (AGI) và mô tả GPT-4.5 là một bản nâng cấp đắt tiền chỉ với những lợi ích cận biên. Futurism, một ấn phẩm có ảnh hưởng khác, đã ghi nhận sự sụt giảm trong sự cường điệu ban đầu xung quanh bản phát hành, cho thấy sự hoài nghi ngày càng tăng về tiềm năng thực sự của công nghệ.

Tuy nhiên, không phải tất cả các phản ứng đều tiêu cực. Jacob Rintamaki, liên kết với Đại học Stanford, đã đưa ra một đánh giá tích cực hơn, đặc biệt ca ngợi khiếu hài hước được cải thiện của GPT-4.5. Ông lập luận rằng điều này thể hiện một bước tiến đáng kể trong khả năng của AI để hiểu và tham gia vào các tương tác xã hội. Điều này làm nổi bật một thị trường ngách tiềm năng cho GPT-4.5: vượt trội trong các lĩnh vực mà giao tiếp sắc thái và khiếu hài hước là tối quan trọng.

Đối thủ cạnh tranh cân nhắc

Ngay cả các mô hình AI cạnh tranh, theo một nghĩa nào đó, đã ‘bình luận’ về việc phát hành GPT-4.5. Grok của xAI, một mô hình ngôn ngữ đối thủ, đã thừa nhận những cải tiến của GPT-4.5 trong khả năng đàm thoại nhưng cũng chỉ ra tính chất tốn nhiều tài nguyên của nó. Điều này nhấn mạnh một mối quan tâm quan trọng: sức mạnh tính toán tuyệt đối cần thiết để chạy GPT-4.5, chuyển trực tiếp thành chi phí hoạt động cao hơn và lượng khí thải carbon lớn hơn.

Bản thân ChatGPT, khi được nhắc, đã nhấn mạnh khả năng duy trì ngữ cảnh, sáng tạo và độ chính xác được nâng cao của GPT-4.5. Tuy nhiên, nó cũng thừa nhận rằng mô hình vẫn còn những sai sót, đặc biệt là trong các cuộc hội thoại kéo dài, nơi đôi khi nó có thể mất dấu cuộc đối thoại đang diễn ra hoặc tạo ra các phản hồi không nhất quán. Sự tự đánh giá này, mặc dù có vẻ khách quan, càng củng cố thêm nhận thức rằng GPT-4.5, bất chấp những tiến bộ của nó, vẫn là một công nghệ không hoàn hảo.

Đi sâu hơn vào các chi tiết cụ thể

Để hiểu được sự đón nhận trái chiều, điều quan trọng là phải xem xét các tuyên bố và phản bác cụ thể xung quanh GPT-4.5 một cách chi tiết hơn.

1. Tuyên bố về độ chính xác nâng cao:

OpenAI khẳng định rằng GPT-4.5 chính xác hơn so với phiên bản tiền nhiệm. Mặc dù điều này có thể đúng trong một số nhiệm vụ được xác định hẹp, các bài kiểm tra độc lập của Karpathy và Dandeker đã đặt ra nghi ngờ về khả năng khái quát hóa của tuyên bố này. Có vẻ như những cải tiến về độ chính xác không đồng nhất trên tất cả các lĩnh vực và có thể ít quan trọng hơn so với quảng cáo ban đầu.

2. Lời hứa giảm ảo giác:

‘Ảo giác’, xu hướng của các mô hình ngôn ngữ tạo ra thông tin sai lệch hoặc vô nghĩa, là một thách thức dai dẳng trong lĩnh vực này. OpenAI tuyên bố rằng GPT-4.5 đã có những bước tiến trong việc giảm thiểu vấn đề này. Tuy nhiên, các báo cáo của người dùng và bằng chứng giai thoại cho thấy rằng ảo giác, mặc dù có lẽ ít thường xuyên hơn, vẫn còn là một vấn đề. Mô hình vẫn có thể tạo ra những thông tin không chính xác được tuyên bố một cách tự tin, đặc biệt là khi xử lý các chủ đề phức tạp hoặc sắc thái.

3. Nghệ thuật thuyết phục:

OpenAI làm nổi bật khả năng thuyết phục nâng cao của GPT-4.5. Điều này đặt ra những lo ngại về đạo đức, vì một AI có sức thuyết phục hơn có thể được sử dụng cho các mục đích thao túng, chẳng hạn như lan truyền thông tin sai lệch hoặc gây ảnh hưởng đến ý kiến theo những cách không mong muốn. Mức độ mà khả năng thuyết phục của GPT-4.5 thể hiện một sự cải thiện thực sự hay một rủi ro tiềm ẩn vẫn là một chủ đề tranh luận đang diễn ra.

4. Lợi thế đàm thoại:

GPT-4.5 chắc chắn là một người đối thoại trôi chảy và hấp dẫn hơn GPT-4. Đây có lẽ là cải tiến đáng kể và dễ nhận thấy nhất của nó. Mô hình tạo ra văn bản trôi chảy tự nhiên hơn, bắt chước các mẫu giọng nói giống con người hiệu quả hơn và thể hiện sự hiểu biết sâu sắc hơn về các sắc thái đàm thoại. Điều này làm cho nó phù hợp hơn với các ứng dụng như chatbot, trợ lý ảo và công cụ viết sáng tạo.

5. Thâm hụt lý luận:

Bất chấp những cải tiến về đàm thoại, việc thiếu tiến bộ đáng kể trong khả năng suy luận là một điểm mấu chốt đối với nhiều nhà phê bình. GPT-4.5 vẫn gặp khó khăn với các nhiệm vụ đòi hỏi suy luận logic, suy luận toán học và hiểu biết thông thường. Hạn chế này cản trở khả năng ứng dụng của nó trong các lĩnh vực đòi hỏi tư duy phân tích, chính xác, chẳng hạn như nghiên cứu khoa học, mô hình hóa tài chính và phân tích pháp lý.

6. Yếu tố chi phí:

Chi phí cắt cổ để sử dụng GPT-4.5 là một rào cản đáng kể đối với nhiều người dùng tiềm năng. Cơ cấu giá, dựa trên token đầu vào và đầu ra, khiến nó trở nên đắt đỏ đối với các ứng dụng quy mô lớn hoặc sử dụng bền vững. Điều này đặt ra những lo ngại về khả năng tiếp cận và công bằng, vì chỉ những tổ chức và cá nhân có nguồn tài chính dồi dào mới có thể đủ khả năng tận dụng công nghệ.

7. Nhãn ‘Bản xem trước nghiên cứu’:

Quyết định của OpenAI phát hành GPT-4.5 dưới dạng ‘bản xem trước nghiên cứu’ là đáng chú ý. Điều này cho thấy rằng mô hình vẫn đang được phát triển và có thể trải qua những cải tiến hơn nữa. Nó cũng ngụ ý rằng OpenAI nhận thức được những hạn chế và đang tìm kiếm phản hồi từ người dùng để hướng dẫn những cải tiến trong tương lai. Tuy nhiên, nhãn ‘bản xem trước nghiên cứu’ không hoàn toàn bào chữa cho chi phí cao hoặc sự khác biệt giữa các tuyên bố của OpenAI và hiệu suất thực tế của mô hình.

Bối cảnh rộng hơn: Cuộc chạy đua vũ trang AI

Việc phát hành GPT-4.5 phải được hiểu trong bối cảnh rộng hơn của ‘cuộc chạy đua vũ trang AI’ đang diễn ra. Các công ty như OpenAI, Google và Anthropic đang tham gia vào một cuộc cạnh tranh khốc liệt để phát triển các mô hình AI tiên tiến và có khả năng nhất. Áp lực cạnh tranh này có thể dẫn đến việc phát hành vội vàng, tuyên bố phóng đại và tập trung vào những cải tiến gia tăng thay vì những đột phá cơ bản.

Việc theo đuổi AGI, một AI giả định với trí thông minh cấp độ con người và khả năng giải quyết vấn đề chung, vẫn là động lực thúc đẩy phần lớn nghiên cứu và phát triển trong lĩnh vực này. Tuy nhiên, GPT-4.5, bất chấp những tiến bộ của nó, còn lâu mới đạt được mục tiêu đầy tham vọng này. Nó đóng vai trò như một lời nhắc nhở rằng con đường dẫn đến AGI có thể sẽ dài và gian nan, và những đột phá thực sự là rất hiếm và khó đạt được.

Tương lai của GPT-4.5

Số phận cuối cùng của GPT-4.5 vẫn chưa chắc chắn. Là một ‘bản xem trước nghiên cứu’, nó có thể sẽ phát triển theo thời gian. OpenAI có thể giải quyết các lời chỉ trích và cải thiện khả năng suy luận của mô hình, giảm chi phí hoặc tinh chỉnh hiệu suất của nó trong các lĩnh vực cụ thể.

Tuy nhiên, sự đón nhận trái chiều đối với GPT-4.5 làm nổi bật tầm quan trọng của việc đánh giá phê bình và thử nghiệm độc lập trong lĩnh vực AI. Nó cũng nhấn mạnh sự cần thiết phải minh bạch hơn từ các công ty như OpenAI, đặc biệt là liên quan đến khả năng và hạn chế của các mô hình của họ.

Hiện tại, GPT-4.5 là một minh chứng cho sự tiến bộ không ngừng trong AI, nhưng cũng là một câu chuyện cảnh báo về sự nguy hiểm của sự cường điệu, những thách thức trong việc đạt được những đột phá thực sự và tầm quan trọng của việc cân bằng giữa đổi mới với các cân nhắc đạo đức và thực tế. Mức giá cao, cùng với lợi tức đầu tư đáng ngờ, khiến nó trở thành một thứ xa xỉ mà ít người có thể mua được, và thậm chí ít người có thể biện minh được. Nó đóng vai trò như một lời nhắc nhở mạnh mẽ rằng tiến bộ trong AI không phải lúc nào cũng tuyến tính, và các mô hình lớn hơn, đắt tiền hơn không phải lúc nào cũng tốt hơn.