OpenAI Huy Động Vốn Kỷ Lục, Ra Mắt Mô Hình Open-Weight Mới | vi

Bối cảnh trí tuệ nhân tạo không ngừng thay đổi, được đánh dấu bằng những tiến bộ nhanh chóng và các khoản đầu tư tài chính đáng kinh ngạc. Trong một động thái gây tiếng vang trong thế giới công nghệ cũng như thị trường tài chính, OpenAI gần đây đã xác nhận những phát triển nhấn mạnh vị thế tiên phong của mình trong quá trình chuyển đổi này. Công ty không chỉ đảm bảo một nguồn vốn khổng lồ, lập kỷ lục và nâng định giá của mình lên tầm cao thiên văn, mà còn báo hiệu một sự thay đổi chiến lược trong cách tiếp cận khả năng truy cập mô hình, công bố kế hoạch phát hành mô hình ngôn ngữ ‘open-weight’ đầu tiên sau nhiều năm. Hai thông báo kép này vẽ nên bức tranh về một tổ chức dồi dào nguồn lực và sẵn sàng điều hướng sự tương tác phức tạp giữa đổi mới độc quyền và sự tham gia của cộng đồng.

Vòng Gọi Vốn Mang Tính Bước Ngoặt: Tiếp Nhiên Liệu Cho Biên Giới AI

Quỹ đạo tài chính của OpenAI đã có một bước ngoặt ngoạn mục với việc kết thúc vòng gọi vốn công nghệ tư nhân lớn nhất được ghi nhận cho đến nay. Công ty đã huy động thành công một khoản tiền ấn tượng 40 tỷ USD, một con số nói lên rất nhiều về niềm tin của nhà đầu tư vào tầm nhìn và năng lực công nghệ của công ty. Việc bơm vốn này được dẫn đầu bởi cam kết đáng kể từ SoftBank, đóng góp 30 tỷ USD, với 10 tỷ USD bổ sung được huy động từ một tập đoàn các nhà đầu tư khác.

Hậu quả tức thời của vòng gọi vốn khổng lồ này là việc đánh giá lại giá trị thị trường của OpenAI. Với số vốn mới được tính vào, định giá của công ty đã tăng vọt lên ước tính 300 tỷ USD. Con số này đặt OpenAI vào hàng ngũ các công ty tư nhân có giá trị nhất trên toàn cầu, không chỉ trong lĩnh vực công nghệ mà còn trên tất cả các ngành công nghiệp. Mức định giá như vậy phản ánh tiềm năng to lớn được nhận thấy của trí tuệ nhân tạo tổng quát (AGI) và vai trò dẫn đầu của công ty trong việc theo đuổi nó, đặc biệt thông qua các sản phẩm được công nhận rộng rãi như ChatGPT.

Theo tuyên bố chính thức của OpenAI, các quỹ mới huy động này được dành cho một số lĩnh vực quan trọng. Các mục tiêu chính bao gồm đẩy mạnh các giới hạn của nghiên cứu AI một cách tích cực, mở rộng cơ sở hạ tầng điện toán vốn đã đáng kể cần thiết để đào tạo và chạy các mô hình quy mô lớn, và nâng cao các công cụ có sẵn cho cơ sở người dùng rộng lớn của ChatGPT, được cho là lên tới 500 triệu người dùng hàng tuần. Chi phí khổng lồ liên quan đến việc phát triển AI tiên tiến – bao gồm các bộ dữ liệu khổng lồ, sức mạnh tính toán rộng lớn (thường liên quan đến hàng chục nghìn bộ xử lý chuyên dụng chạy trong nhiều tuần hoặc nhiều tháng) và tài năng nghiên cứu hàng đầu – đòi hỏi nguồn tài trợ đáng kể như vậy. Khoản đầu tư này được định vị là nhiên liệu thiết yếu để duy trì đà phát triển và đẩy nhanh tiến độ hướng tới các hệ thống AI tinh vi và có năng lực hơn. Quy mô của nguồn tài trợ nhấn mạnh bản chất thâm dụng vốn của việc dẫn đầu cuộc đua AI, nơi những đột phá đòi hỏi nguồn lực khổng lồ.

Bước Ngoặt Chiến Lược: Công Bố Mô Hình Open-Weight

Đồng thời với tin tức về việc củng cố tài chính, CEO OpenAI Sam Altman đã tiết lộ một bước phát triển quan trọng về mặt kỹ thuật: việc sớm tung ra một mô hình ngôn ngữ mới được đặc trưng bởi khả năng suy luận tiên tiến. Điều làm cho thông báo này đặc biệt đáng chú ý là phương thức phân phối dự kiến – nó sẽ được phát hành dưới dạng mô hình ‘open-weight’. Điều này đánh dấu một sự khác biệt so với quỹ đạo gần đây của công ty, đại diện cho lần phát hành đầu tiên như vậy kể từ khi giới thiệu GPT-2 vào năm 2019.

Hiểu khái niệm ‘open-weight’ là rất quan trọng để nắm bắt các hàm ý chiến lược. Nó chiếm một vị trí trung gian giữa hai mô hình quen thuộc hơn: hệ thống hoàn toàn mã nguồn mở và hoàn toàn độc quyền (hoặc mã nguồn đóng).

Mô hình Mã nguồn mở (Open-Source Models): Thường liên quan đến việc phát hành không chỉ các tham số của mô hình (trọng số) mà còn cả mã đào tạo, chi tiết về bộ dữ liệu được sử dụng và thường là thông tin về kiến trúc của mô hình. Điều này cho phép cộng đồng nghiên cứu và các nhà phát triển có được sự minh bạch tối đa và khả năng sao chép, nghiên cứu và xây dựng dựa trên công trình một cách tự do.
Mô hình Mã nguồn đóng (Closed-Source Models): Thường được cung cấp qua API (Application Programming Interfaces), giống như các phiên bản tiên tiến hơn của GPT. Người dùng có thể tương tác với mô hình và tích hợp các khả năng của nó vào ứng dụng của họ, nhưng trọng số, mã, dữ liệu và kiến trúc cơ bản vẫn là bí mật thương mại được bảo mật của công ty phát triển. Cách tiếp cận này tối đa hóa quyền kiểm soát và tiềm năng kiếm tiền cho người tạo ra.
Mô hình Open-Weight: Như OpenAI dự định với bản phát hành sắp tới, cách tiếp cận này liên quan đến việc chia sẻ các tham số đã được huấn luyện trước (trọng số) của mạng nơ-ron. Điều này cho phép các nhà phát triển và nhà nghiên cứu tải xuống các trọng số này và sử dụng mô hình cho các tác vụ như suy luận (chạy mô hình để tạo ra kết quả) và tinh chỉnh (điều chỉnh mô hình cho các tác vụ hoặc bộ dữ liệu cụ thể bằng cách đào tạo bổ sung). Tuy nhiên, các yếu tố quan trọng vẫn không được tiết lộ: mã đào tạo gốc, (các) bộ dữ liệu cụ thể được sử dụng cho quá trình đào tạo ban đầu và các chi tiết phức tạp liên quan đến kiến trúc và phương pháp đào tạo của mô hình.

Sự phân biệt này là rất quan trọng. Bằng cách phát hành trọng số, OpenAI cho phép một phạm vi người dùng rộng lớn hơn chạy mô hình cục bộ, thử nghiệm với nó và điều chỉnh nó theo nhu cầu của họ mà không chỉ dựa vào cơ sở hạ tầng API của OpenAI. Điều này có thể thúc đẩy sự đổi mới và có khả năng dân chủ hóa quyền truy cập vào một mức độ năng lực AI tiên tiến. Tuy nhiên, bằng cách giữ lại dữ liệu và mã đào tạo, OpenAI vẫn giữ quyền kiểm soát đáng kể. Nó ngăn chặn việc sao chép trực tiếp quá trình đào tạo, bảo vệ các bộ dữ liệu và kỹ thuật có khả năng độc quyền, và duy trì lợi thế kiến thức liên quan đến cấu trúc cơ bản của mô hình. Đó là một chiến lược cân bằng giữa việc trao quyền cho cộng đồng và bảo vệ tài sản trí tuệ cốt lõi.

Việc đề cập đến ‘khả năng suy luận tiên tiến’ cho thấy mô hình mới này nhằm mục đích vượt qua những hạn chế của các mô hình trước đó trong các tác vụ đòi hỏi logic, suy luận và giải quyết vấn đề nhiều bước. Mặc dù GPT-2 là đột phá vào thời điểm đó, lĩnh vực này đã tiến bộ đáng kể. Cung cấp một mô hình với khả năng suy luận tinh vi hơn theo giấy phép open-weight có thể tác động đáng kể đến các ứng dụng khác nhau, từ nghiên cứu khoa học đến phân tích dữ liệu phức tạp và AI đàm thoại sắc thái hơn. Động thái này diễn ra sau nhiều năm mà các mô hình mạnh mẽ nhất của OpenAI, như GPT-3 và GPT-4, phần lớn được giữ kín sau cánh cửa API đóng, khiến việc quay trở lại một hình thức cởi mở trở thành một quyết định chiến lược đáng chú ý.

Lý Do và Tương Tác Cộng Đồng: Góc Nhìn Của Altman

Bình luận của Sam Altman xung quanh thông báo về mô hình open-weight đã cung cấp cái nhìn sâu sắc về suy nghĩ của công ty. Thông qua một bài đăng trên nền tảng mạng xã hội X (trước đây là Twitter), ông chỉ ra rằng ý tưởng này không phải là mới lạ trong nội bộ OpenAI. “Chúng tôi đã suy nghĩ về điều này trong một thời gian dài,” Altman tuyên bố, thừa nhận rằng “các ưu tiên khác đã được đặt lên hàng đầu” trong những năm qua. Hàm ý là việc phát triển và phát hành các mô hình độc quyền ngày càng mạnh mẽ như GPT-3 và GPT-4, cùng với việc xây dựng dịch vụ ChatGPT và kinh doanh API, đã chiếm hết sự tập trung của công ty.

Tuy nhiên, tính toán chiến lược dường như đã thay đổi. “Bây giờ cảm thấy quan trọng phải làm điều đó,” Altman nói thêm, cho thấy sự hội tụ của các yếu tố đã khiến việc phát hành một mô hình open-weight trở thành một bước đi kịp thời và cần thiết. Mặc dù ông không nêu chi tiết tất cả các yếu tố này, bối cảnh của lĩnh vực AI đang phát triển nhanh chóng cung cấp những manh mối tiềm năng. Sự trỗi dậy của các lựa chọn thay thế mã nguồn mở mạnh mẽ, áp lực cạnh tranh và có lẽ là mong muốn tái tương tác với cộng đồng nghiên cứu và nhà phát triển rộng lớn hơn có thể đã đóng vai trò.

Quan trọng là, Altman cũng báo hiệu rằng các chi tiết cụ thể của việc phát hành vẫn đang được hoàn thiện. “Chúng tôi vẫn còn một số quyết định cần đưa ra,” ông lưu ý, nhấn mạnh ý định thu hút cộng đồng tham gia vào quá trình này. “Vì vậy, chúng tôi đang tổ chức các sự kiện dành cho nhà phát triển để thu thập phản hồi và sau đó thử nghiệm các nguyên mẫu ban đầu.” Cách tiếp cận này phục vụ nhiều mục đích. Nó cho phép OpenAI đánh giá nhu cầu và sở thích của nhà phát triển, có khả năng định hình sản phẩm cuối cùng để tối đa hóa tiện ích và sự chấp nhận của nó, đồng thời xây dựng sự mong đợi và thiện chí trong cộng đồng. Nó định khung việc phát hành không phải là một quyết định đơn phương mà là một nỗ lực hợp tác hơn, ngay cả trong những ràng buộc của khuôn khổ open-weight. Chiến lược tương tác này có thể rất quan trọng trong việc đảm bảo mô hình đạt được sức hút và được sử dụng hiệu quả sau khi phát hành. Nó cũng cho phép OpenAI quản lý kỳ vọng và có khả năng giải quyết các mối lo ngại trước khi trọng số cuối cùng được công bố.

Điều Hướng Bối Cảnh Cạnh Tranh: Nước Đi Có Tính Toán

Quyết định của OpenAI về việc phát hành một mô hình open-weight tiên tiến không thể được xem xét một cách biệt lập. Nó diễn ra trong một môi trường cạnh tranh khốc liệt, nơi các công ty công nghệ lớn và các công ty khởi nghiệp được tài trợ tốt đang tranh giành vị trí thống trị trong không gian AI. Động thái này dường như được tính toán một cách chiến lược để định vị OpenAI một cách thuận lợi so với các đối thủ của mình.

Một đối thủ cạnh tranh chính là Meta (trước đây là Facebook), công ty đã đạt được những bước tiến đáng kể với loạt mô hình Llama của mình. Đáng chú ý, Llama 2 được phát hành theo một giấy phép tùy chỉnh, mặc dù nhìn chung là dễ dãi, nhưng bao gồm một hạn chế cụ thể: các công ty có cơ sở người dùng rất lớn (hơn 700 triệu người dùng hoạt động hàng tháng) sẽ cần phải xin giấy phép đặc biệt từ Meta để sử dụng nó cho mục đích thương mại. Điều khoản này được nhiều người giải thích là nhắm vào các đối thủ cạnh tranh lớn như Google.

Sam Altman dường như đã trực tiếp đề cập đến điểm này trong một bài đăng tiếp theo trên X, có một cú châm chọc rõ ràng vào cách tiếp cận của Meta. “Chúng tôi sẽ không làm bất cứ điều gì ngớ ngẩn như nói rằng bạn không thể sử dụng mô hình mở của chúng tôi nếu dịch vụ của bạn có hơn 700 triệu người dùng hoạt động hàng tháng,” ông viết. Tuyên bố này phục vụ nhiều chức năng chiến lược:

Tạo sự khác biệt: Nó đối chiếu rõ ràng cách tiếp cận dự kiến của OpenAI với Meta, định vị OpenAI là có khả năng ít hạn chế hơn và thực sự ‘mở’ hơn trong khuôn khổ đã chọn, ít nhất là liên quan đến các giới hạn triển khai quy mô lớn.
Phát tín hiệu cạnh tranh: Đó là một thách thức trực tiếp đối với một đối thủ cạnh tranh lớn, ngầm chỉ trích chiến lược cấp phép của họ là ‘ngớ ngẩn’ và có khả năng chống cạnh tranh.
Thu hút nhà phát triển: Bằng cách hứa hẹn ít ràng buộc sử dụng hơn (ít nhất là loại cụ thể đó), OpenAI có thể hy vọng thu hút các nhà phát triển và các công ty lớn đã do dự hoặc bị loại trừ bởi các điều khoản cấp phép Llama 2 của Meta.

Ngoài Meta, OpenAI còn phải đối mặt với sự cạnh tranh từ Google (với các mô hình Gemini), Anthropic (với các mô hình Claude) và một hệ sinh thái ngày càng tăng của các mô hình mã nguồn mở hoàn toàn được phát triển bởi các nhóm nghiên cứu và công ty khác nhau (như Mistral AI).

So với các đối thủ cạnh tranh hoàn toàn mã nguồn đóng như các cấp cao nhất tiềm năng của Gemini của Google hoặc Claude của Anthropic, mô hình open-weight cung cấp cho các nhà phát triển sự linh hoạt hơn, kiểm soát cục bộ và khả năng tinh chỉnh, điều mà chỉ riêng quyền truy cập API không cung cấp được.
So với các mô hình hoàn toàn mã nguồn mở, sản phẩm của OpenAI có thể tự hào về khả năng ‘suy luận tiên tiến’ vượt trội bắt nguồn từ nguồn lực khổng lồ và trọng tâm nghiên cứu của mình, có khả năng cung cấp một đường cơ sở hiệu suất cao hơn ngay cả khi nó thiếu sự minh bạch hoàn toàn. Nó tự định vị mình là nhà cung cấp công nghệ tiên tiến, nhưng phần nào dễ tiếp cận.

Do đó, chiến lược open-weight dường như là một nỗ lực để tạo ra một phân khúc độc đáo: cung cấp một mô hình có khả năng mạnh mẽ hơn hoặc tinh tế hơn nhiều tùy chọn mã nguồn mở hiện tại, đồng thời cung cấp sự linh hoạt hơn và ít hạn chế sử dụng quy mô lớn hơn (dựa trên bình luận của Altman) so với một số mô hình cạnh tranh như Llama 2, nhưng vẫn giữ quyền kiểm soát nhiều hơn so với một bản phát hành hoàn toàn mã nguồn mở. Đó là một hành động cân bằng nhằm tối đa hóa tác động và sự chấp nhận trên các phân khúc khác nhau của cộng đồng AI trong khi bảo vệ các tài sản trí tuệ cốt lõi.

Hàm Ý và Quỹ Đạo Tương Lai

Sự hội tụ của nguồn tài trợ kỷ lục và sự thay đổi chiến lược hướng tới phân phối mô hình open-weight mang những hàm ý quan trọng đối với OpenAI và hệ sinh thái AI rộng lớn hơn. Kho bạc chiến tranh 40 tỷ USD cung cấp cho OpenAI nguồn lực vô song để theo đuổi các mục tiêu đầy tham vọng của mình, có khả năng đẩy nhanh tiến trình hướng tới Trí tuệ Nhân tạo Tổng quát (AGI), hoặc ít nhất là các hệ thống AI có năng lực hơn đáng kể trong tương lai gần. Mức tài trợ này cho phép các đặt cược nghiên cứu dài hạn, mở rộngquy mô cơ sở hạ tầng lớn và thu hút và giữ chân nhân tài hàng đầu, củng cố hơn nữa vị thế của OpenAI như một nhà lãnh đạo.

Mức định giá 300 tỷ USD, trong khi phản ánh sự lạc quan to lớn, cũng mang lại những kỳ vọng và áp lực cao hơn. Các nhà đầu tư sẽ mong đợi lợi nhuận đáng kể, điều này có thể ảnh hưởng đến các chiến lược sản phẩm trong tương lai của OpenAI, có khả năng thúc đẩy thương mại hóa mạnh mẽ hơn hoặc thậm chí là Phát hành Cổ phiếu lần đầu ra công chúng (IPO) cuối cùng. Cân bằng giữa sứ mệnh tập trung vào nghiên cứu ban đầu với các mệnh lệnh thương mại này sẽ là một thách thức chính.

Việc giới thiệu một mô hình open-weight tiên tiến có thể xúc tác sự đổi mới trong toàn ngành. Các nhà phát triển và nhà nghiên cứu có quyền truy cập vào một mô hình với khả năng suy luận tinh vi, ngay cả khi không có sự minh bạch hoàn toàn, có thể dẫn đến những đột phá trong các lĩnh vực khác nhau. Nó có thể hạ thấp rào cản gia nhập để phát triển các ứng dụng AI phức tạp, miễn là người dùng có phần cứng và chuyên môn cần thiết để chạy và tinh chỉnh mô hình. Điều này có thể thúc đẩy một làn sóng thử nghiệm và phát triển mới bên ngoài giới hạn của quyền truy cập dựa trên API.

Tuy nhiên, động thái này cũng đặt ra câu hỏi. Khả năng suy luận sẽ thực sự ‘tiên tiến’ đến mức nào so với các mô hình độc quyền tiên tiến nhất như GPT-4 hoặc những người kế nhiệm của nó? Các điều khoản cấp phép cụ thể nào sẽ đi kèm với bản phát hành open-weight, ngoài việc ám chỉ không có hạn chế về cơ sở người dùng? Câu trả lời sẽ quyết định tác động thực tế của mô hình. Hơn nữa, cách tiếp cận open-weight, mặc dù cung cấp nhiều quyền truy cập hơn API đóng, vẫn chưa đạt được sự minh bạch được ủng hộ bởi những người đề xuất mã nguồn mở. Điều này có thể dẫn đến cuộc tranh luận đang diễn ra về con đường tốt nhất cho việc phát triển và triển khai AI có trách nhiệm – cân bằng tốc độ đổi mới với sự an toàn, kiểm soát và quyền truy cập công bằng.

Con đường phía trước của OpenAI liên quan đến việc điều hướng các động lực phức tạp này. Nó phải tận dụng sức mạnh tài chính của mình để duy trì lợi thế nghiên cứu, quản lý nhu cầu tính toán khổng lồ, giải quyết các mối quan tâm xã hội ngày càng tăng về an toàn và đạo đức AI, và định vị chiến lược các sản phẩm của mình trong một thị trường năng động. Quyết định phát hành một mô hình open-weight cho thấy một chiến lược sắc thái, thừa nhận giá trị của sự tham gia của cộng đồng và sự chấp nhận rộng rãi hơn trong khi cẩn thận bảo vệ những đổi mới cốt lõi làm nền tảng cho định giá khổng lồ của nó. Cách tiếp cận kép này – tài trợ lớn cho phát triển nội bộ kết hợp với sự cởi mở có kiểm soát – có khả năng xác định quỹ đạo của OpenAI khi nó tiếp tục định hình tương lai của trí tuệ nhân tạo.

cập nhật lúc 2025-04-02

# OpenAI # GPT # AGI