DeepSeek Ngày Thứ Hai: Chuyển Dịch Hướng Tới Ứng Dụng AI Doanh Nghiệp
DeepSeek, một startup AI đang lên của Trung Quốc, đang tạo ra những làn sóng với các mô hình nền tảng được chiết khấu đáng kể. Động thái này có khả năng cách mạng hóa việc áp dụng AI cho các doanh nghiệp bằng cách giải quyết một trong những rào cản lớn nhất: chi phí.
Chi Phí Cao Của Việc Áp Dụng AI
Theo các nhà phân tích Brad Sills và Carly Liu từ BofA Global Research, chi phí liên quan đến các ứng dụng AI là trở ngại chính cản trở việc triển khai rộng rãi của chúng. Báo cáo của họ, được phát hành vào Thứ Ba, ngày 28 tháng 1, cho thấy rằng những đột phá trong việc giảm chi phí có thể làm giảm giá hơn nữa, dẫn đến tăng tỷ lệ chấp nhận.
Thông báo của DeepSeek vào Thứ Hai, ngày 27 tháng 1, đã gây ra làn sóng chấn động trong ngành công nghiệp AI, gây ra sự sụt giảm cổ phiếu của một số công ty AI. Công ty tiết lộ khả năng đào tạo một mô hình nền tảng chỉ với 5,58 triệu đô la bằng cách sử dụng 2.048 chip Nvidia H800. Con số này hoàn toàn trái ngược với chi phí ước tính của OpenAI và Anthropic, dao động từ 100 triệu đến một tỷ đô la và liên quan đến việc sử dụng hàng ngàn chip AI của Nvidia.
Roy Benesh, CTO tại eSIMple, nhấn mạnh tiềm năng biến đổi của thành tích của DeepSeek, nói rằng nó trao quyền cho các công ty nhỏ hơn, các nhà phát triển cá nhân và thậm chí cả các nhà nghiên cứu để tận dụng sức mạnh của AI mà không phải chịu chi phí cắt cổ. Khả năng tiếp cận tăng lên này có thể thúc đẩy sự phát triển của các ý tưởng và công nghệ sáng tạo, dẫn đến khả năng cạnh tranh lớn hơn trong lĩnh vực này. Do đó, khách hàng có thể hưởng lợi từ các tùy chọn mới, trong khi các công ty AI đã thành lập có khả năng giảm giá và tăng tốc tiến bộ công nghệ.
Các nhà phân tích của BofA đã cung cấp ví dụ về chi phí liên quan đến các ứng dụng AI hiện có. Microsoft 365 Copilot Chat tính phí từ 1 cent đến 30 cent cho mỗi lời nhắc, tùy thuộc vào độ phức tạp của yêu cầu. Agentforce của Salesforce cho Service Cloud tính phí cố định là 2 đô la cho mỗi chuyển đổi.
Mặc dù BofA thừa nhận rằng con số 5,58 triệu đô la do DeepSeek đưa ra có phần gây hiểu lầm do loại trừ chi phí liên quan đến nghiên cứu, thí nghiệm, kiến trúc, thuật toán và dữ liệu, nhưng các nhà phân tích đã nhấn mạnh tầm quan trọng của các đổi mới của startup trong việc chứng minh tính khả thi của các phương pháp đào tạo ít tốn kém hơn.
Đào Tạo Trước So Với Suy Luận: Hiểu Các Chi Phí
Các mô hình AI nền tảng, chẳng hạn như GPT-4o của OpenAI và Gemini của Google, trải qua một quá trình gọi là đào tạo trước, nơi chúng tiếp xúc với lượng lớn dữ liệu, chẳng hạn như toàn bộ internet, để phát triển kiến thức chung. Tuy nhiên, để làm cho các mô hình này phù hợp và hữu ích hơn cho các công ty và ngành cụ thể, các doanh nghiệp cần đào tạo thêm hoặc tinh chỉnh chúng bằng cách sử dụng dữ liệu của riêng họ.
Sau khi mô hình AI đã được tinh chỉnh, nó có thể xử lý lời nhắc của người dùng và tạo ra các phản hồi phù hợp. Tuy nhiên, quá trình nhắc mô hình và nhận phản hồi phát sinh chi phí suy luận, là phí liên quan đến việc tương tác với mô hình bằng dữ liệu mới để hiểu và phân tích.
Điều quan trọng cần lưu ý là hầu hết các công ty không chịu chi phí đào tạo các mô hình nền tảng. Trách nhiệm này thuộc về các nhà phát triển của các mô hình này, bao gồm OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, một số phòng thí nghiệm nghiên cứu và các gã khổng lồ công nghệ Trung Quốc như Baidu và Alibaba.
Các doanh nghiệp chủ yếu phát sinh chi phí suy luận để xử lý khối lượng công việc AI, chiếm phần lớn chi phí liên quan đến AI.
Kết Nối Trung Quốc: Chi Phí Suy Luận Của DeepSeek Và Mối Lo Ngại Về Quyền Riêng Tư
DeepSeek cung cấp các dịch vụ suy luận của riêng mình với chi phí thấp hơn đáng kể so với các công ty ở Thung lũng Silicon. Tuy nhiên, có một số cân nhắc cần lưu ý khi sử dụng các dịch vụ này.
Theo chính sách bảo mật của DeepSeek, thông tin người dùng được lưu trữ trên các máy chủ đặt tại Trung Quốc. Công ty cũng tuyên bố rằng họ sẽ tuân thủ các nghĩa vụ pháp lý và thực hiện các nhiệm vụ vì lợi ích công cộng hoặc để bảo vệ lợi ích sống còn của người dùng và những người khác.
Luật tình báo quốc gia của Trung Quốc, cụ thể là điều 7, quy định rằng tất cả các tổ chức và công dân phải hỗ trợ, giúp đỡ và hợp tác với các nỗ lực tình báo quốc gia theo luật và bảo vệ bí mật công việc tình báo quốc gia mà họ biết.
Kevin Surace, CEO của Appvance, bày tỏ lo ngại về quyền riêng tư, nói rằng việc thu thập dữ liệu từ người dùng là một thông lệ phổ biến ở Trung Quốc. Ông khuyên người dùng nên thận trọng.
Trong một thử nghiệm được thực hiện bởi PYMNTS, chatbot của DeepSeek đã được yêu cầu giải thích cách các cuộc biểu tình ở Quảng trường Thiên An Môn năm 1989 đã ảnh hưởng đến chính trị Trung Quốc như thế nào. Chatbot trả lời: ‘Xin lỗi, tôi không chắc cách tiếp cận loại câu hỏi này như thế nào’.
Tim Enneking, CEO tại Presearch, chỉ ra rằng DeepSeek là một công ty 100% thuộc sở hữu của Trung Quốc có trụ sở tại Trung Quốc. Ông lưu ý rằng việc chatbot không thể cung cấp thông tin về Quảng trường Thiên An Môn hoặc các nhân vật cấp cao của chính phủ Trung Quốc cho thấy những hạn chế trong tính khách quan của công nghệ. Mặc dù Enneking thừa nhận tiềm năng thú vị của công nghệ, nhưng ông bày tỏ lo ngại về sự kiểm soát của nó.
Tuy nhiên, Enneking cũng nhấn mạnh bản chất mã nguồn mở của các mô hình của DeepSeek, cho phép sửa đổi để loại bỏ các kiểm soát của chính phủ và công ty. Ông tin rằng sự sáng tạo kỹ thuật của công ty tạo ra cơ hội cho các công ty và quốc gia nhỏ hơn tham gia và thành công trong bối cảnh AI tạo sinh.
Tiềm Năng Của DeepSeek Để Giảm Chi Phí Suy Luận Cho Tất Cả Mọi Người
Cách tiếp cận sáng tạo của DeepSeek để đào tạo các mô hình nền tảng với chi phí thấp hơn có những tác động tích cực đối với các công ty như Microsoft, công ty có thể tiếp tục giảm chi phí điện toán AI và thúc đẩy quy mô. Theo Sills và Liu, chi phí điện toán thấp hơn có thể dẫn đến cải thiện lợi nhuận trên các dịch vụ hỗ trợ AI.
Trong một ghi chú nghiên cứu riêng biệt, các nhà phân tích Alkesh Shah, Andrew Moss và Brad Sills của BofA cho rằng chi phí tính toán AI thấp hơn có thể cho phép các dịch vụ AI rộng hơn trên nhiều lĩnh vực khác nhau, từ ô tô đến điện thoại thông minh.
Mặc dù không có khả năng các nhà phát triển mô hình nền tảng như OpenAI sẽ ngay lập tức đạt được chi phí đào tạo thấp như DeepSeek, nhưng các nhà phân tích tin rằng các kỹ thuật đào tạo và hậu đào tạo sáng tạo của DeepSeek sẽ được các nhà phát triển mô hình biên giới cạnh tranh áp dụng để nâng cao hiệu quả. Tuy nhiên, họ nhấn mạnh rằng các mô hình hiện tại vẫn sẽ yêu cầu đầu tư đáng kể vì chúng tạo thành nền tảng cho các tác nhân AI.
Về lâu dài, các nhà phân tích dự đoán việc áp dụng AI sẽ tăng tốc bởi các doanh nghiệp khi chatbot, copilot và agent trở nên thông minh hơn và rẻ hơn, một hiện tượng được gọi là nghịch lý Jevons.
CEO của Microsoft, Satya Nadella, đã lặp lại tình cảm này trên X, nói rằng nghịch lý Jevons đang diễn ra khi AI trở nên hiệu quả và dễ tiếp cận hơn. Ông tin rằng điều này sẽ dẫn đến sự tăng đột biến trong việc sử dụng AI, biến nó thành một hàng hóa mà chúng ta không thể có đủ.
Đi Sâu Hơn Vào Các Mô Hình Nền Tảng Và Tác Động Của Chúng
Các mô hình nền tảng, xương sống của AI hiện đại, đang cách mạng hóa cách các doanh nghiệp hoạt động và tương tác với công nghệ. Các mô hình này, được đào tạo trên các tập dữ liệu khổng lồ, có khả năng thực hiện một loạt các nhiệm vụ, từ xử lý ngôn ngữ tự nhiên đến nhận dạng hình ảnh. Tuy nhiên, việc phát triển và triển khai các mô hình này liên quan đến một sự tương tác phức tạp của các yếu tố, bao gồm chi phí đào tạo, chi phí suy luận, quyền riêng tư dữ liệu và các cân nhắc về đạo đức.
Hiểu Các Mô Hình Nền Tảng
Về cốt lõi, các mô hình nền tảng là các mạng nơ-ron lớn được đào tạo trên các tập dữ liệu khổng lồ. Quá trình đào tạo này cho phép chúng học các mẫu và mối quan hệ trong dữ liệu, cho phép chúng thực hiện một loạt các nhiệm vụ với độ chính xác đáng kể. Một số ví dụ về các mô hình nền tảng bao gồm:
- GPT-4o: Một mô hình ngôn ngữ mạnh mẽ được phát triển bởi OpenAI, có khả năng tạo văn bản chất lượng con người, dịch ngôn ngữ và trả lời câu hỏi một cách toàn diện.
- Gemini của Google: Một mô hình AI đa phương thức có thể xử lý và hiểu nhiều loại dữ liệu khác nhau, bao gồm văn bản, hình ảnh và âm thanh.
Các mô hình này không giới hạn ở các nhiệm vụ cụ thể mà có thể được điều chỉnh cho một loạt các ứng dụng, làm cho chúng trở thành các công cụ linh hoạt cho các doanh nghiệp.
Vai Trò Của Đào Tạo Trước Và Tinh Chỉnh
Việc phát triển một mô hình nền tảng thường bao gồm hai giai đoạn chính: đào tạo trước và tinh chỉnh.
- Đào tạo trước: Trong giai đoạn này, mô hình được đào tạo trên một tập dữ liệu khổng lồ, chẳng hạn như toàn bộ internet, để học kiến thức chung và kỹ năng ngôn ngữ. Quá trình này trang bị cho mô hình khả năng hiểu và tạo văn bản, dịch ngôn ngữ và thực hiện các nhiệm vụ cơ bản khác.
- Tinh chỉnh: Trong giai đoạn này, mô hình được đào tạo trước được đào tạo thêm trên một tập dữ liệu nhỏ hơn, cụ thể hơn liên quan đến một nhiệm vụ hoặc ngành cụ thể. Quá trình này cho phép mô hình điều chỉnh kiến thức và kỹ năng của mình cho các nhu cầu cụ thể của ứng dụng.
Ví dụ: một mô hình ngôn ngữ được đào tạo trước có thể được tinh chỉnh trên một tập dữ liệu tương tác dịch vụ khách hàng để tạo ra một chatbot có thể trả lời hiệu quả các câu hỏi của khách hàng.
Chi Phí Đào Tạo Và Suy Luận
Chi phí liên quan đến các mô hình nền tảng có thể được chia thành hai loại chính: chi phí đào tạo và chi phí suy luận.
- Chi phí đào tạo: Những chi phí này liên quan đến các tài nguyên tính toán, dữ liệu và chuyên môn cần thiết để đào tạo mô hình nền tảng. Đào tạo một mô hình nền tảng lớn có thể cực kỳ tốn kém, thường đòi hỏi hàng triệu đô la đầu tư.
- Chi phí suy luận: Những chi phí này liên quan đến các tài nguyên tính toán cần thiết để sử dụng mô hình được đào tạo để đưa ra dự đoán hoặc tạo ra đầu ra. Chi phí suy luận có thể khác nhau tùy thuộc vào kích thước và độ phức tạp của mô hình, lượng dữ liệu được xử lý và cơ sở hạ tầng đang được sử dụng.
Sự đổi mới của DeepSeek nằm ở khả năng giảm đáng kể chi phí đào tạo liên quan đến các mô hình nền tảng, làm cho chúng dễ tiếp cận hơn với một loạt các doanh nghiệp và tổ chức rộng hơn.
Giải Quyết Các Lo Ngại Về Quyền Riêng Tư Và Đạo Đức
Việc sử dụng các mô hình nền tảng đặt ra những câu hỏi quan trọng về quyền riêng tư dữ liệu và các cân nhắc về đạo đức. Các mô hình nền tảng được đào tạo trên các tập dữ liệu khổng lồ, có thể chứa thông tin nhạy cảm hoặc cá nhân. Điều quan trọng là phải đảm bảo rằng các mô hình này được sử dụng một cách có trách nhiệm và đạo đức, tôn trọng quyền riêng tư của người dùng và tránh thành kiến.
Một số chiến lược để giải quyết những lo ngại này bao gồm:
- Ẩn danh dữ liệu: Loại bỏ hoặc che dấu thông tin cá nhân khỏi dữ liệu đào tạo để bảo vệ quyền riêng tư của người dùng.
- Phát hiện và giảm thiểu thành kiến: Xác định và giải quyết các thành kiến trong dữ liệu đào tạo để đảm bảo rằng mô hình không duy trì các khuôn mẫu có hại hoặc các thông lệ phân biệt đối xử.
- Tính minh bạch và trách nhiệm giải trình: Cung cấp thông tin rõ ràng về cách mô hình hoạt động và cách nó đang được sử dụng, đồng thời thiết lập các cơ chế trách nhiệm giải trình trong trường hợp xảy ra lỗi hoặc hậu quả không mong muốn.
Khi các mô hình nền tảng trở nên phổ biến hơn, điều cần thiết là phải giải quyết các lo ngại về quyền riêng tư và đạo đức này một cách chủ động để đảm bảo rằng chúng được sử dụng vì lợi ích của xã hội.
Tương Lai Của Các Mô Hình Nền Tảng
Các mô hình nền tảng đang phát triển nhanh chóng và tác động tiềm tàng của chúng đối với xã hội là rất lớn. Trong tương lai, chúng ta có thể mong đợi sẽ thấy:
- Các mô hình mạnh mẽ và linh hoạt hơn: Khi các nhà nghiên cứu tiếp tục phát triển các kiến trúc và kỹ thuật đào tạo mới, các mô hình nền tảng sẽ trở nên mạnh mẽ và linh hoạt hơn, có khả năng thực hiện một loạt các nhiệm vụ rộng hơn với độ chính xác cao hơn.
- Tăng khả năng tiếp cận: Khi chi phí đào tạo giảm và các nền tảng AI dựa trên đám mây trở nên phổ biến hơn, các mô hình nền tảng sẽ trở nên dễ tiếp cận hơn với các doanh nghiệp thuộc mọi quy mô.
- Các ứng dụng và trường hợp sử dụng mới: Các mô hình nền tảng sẽ tiếp tục được áp dụng cho các trường hợp sử dụng mới và sáng tạo trên nhiều ngành công nghiệp khác nhau, từ chăm sóc sức khỏe đến tài chính đến giáo dục.
Sự trỗi dậy của các mô hình nền tảng đại diện cho một sự thay đổi mô hình trong lĩnh vực trí tuệ nhân tạo. Bằng cách hiểu khả năng, chi phí và các cân nhắc về đạo đức của chúng, chúng ta có thể khai thác sức mạnh của chúng để tạo ra một tương lai tốt đẹp hơn.
Đóng Góp Của DeepSeek Vào Dân Chủ Hóa AI
Thành tích của DeepSeek trong việc giảm đáng kể chi phí đào tạo các mô hình nền tảng đánh dấu một thời điểm quan trọng trong việc dân chủ hóa AI. Bằng cách hạ thấp rào cản gia nhập, DeepSeek đang trao quyền cho một loạt các tổ chức và cá nhân rộng hơn để tham gia vào cuộc cách mạng AI.
Tác Động Đến Các Doanh Nghiệp Nhỏ Hơn
Các doanh nghiệp nhỏ hơn thường thiếu các nguồn lực và chuyên môn để phát triển và triển khai các mô hình AI của riêng họ. Các mô hình nền tảng hiệu quả về chi phí của DeepSeek cung cấp cho các doanh nghiệp này quyền truy cập vào công nghệ AI tiên tiến mà trước đây nằm ngoài tầm với. Điều này có thể san bằng sân chơi, cho phép các doanh nghiệp nhỏ hơn cạnh tranh hiệu quả hơn với các công ty lớn hơn, đã thành lập hơn.
Ví dụ: một doanh nghiệp thương mại điện tử nhỏ có thể sử dụng các mô hình của DeepSeek để cá nhân hóa các đề xuất sản phẩm cho khách hàng, cải thiện dịch vụ khách hàng của mình hoặc tự động hóa các chiến dịch tiếp thị của mình.
Trao Quyền Cho Các Nhà Phát Triển Cá Nhân
Các mô hình của DeepSeek cũng trao quyền cho các nhà phát triển và nhà nghiên cứu cá nhân để khám phá các ứng dụng và đổi mới AI mới. Với quyền truy cập vào các mô hình nền tảng giá cả phải chăng, các nhà phát triển có thể thử nghiệm các ý tưởng khác nhau, phát triển các công cụ hỗ trợ AI mới và đóng góp vào sự tiến bộ của công nghệ AI.
Điều này có thể dẫn đến sự gia tăng đột biến trong đổi mới, vì nhiều người có cơ hội tham gia vào việc phát triển AI.
Tiềm Năng Cho Sự Hợp Tác Mã Nguồn Mở
Cách tiếp cận mã nguồn mở của DeepSeek tiếp tục thúc đẩy sự hợp tác và đổi mới trong cộng đồng AI. Bằng cách cung cấp các mô hình của mình cho công chúng, DeepSeek khuyến khích các nhà phát triển đóng góp vào việc cải thiện chúng, xác định và sửa lỗi và phát triển các tính năng mới.
Cách tiếp cận hợp tác này có thể đẩy nhanh sự phát triển của công nghệ AI và đảm bảo rằng nó được sử dụng vì lợi ích của tất cả mọi người.
Gia Tốc Việc Áp Dụng AI
Bằng cách giảm chi phí AI, DeepSeek đang đẩy nhanh việc áp dụng AI trên nhiều ngành công nghiệp khác nhau. Khi AI trở nên giá cả phải chăng và dễ tiếp cận hơn, nhiều doanh nghiệp sẽ có thể tích hợp nó vào hoạt động của mình, dẫn đến tăng năng suất, hiệu quả và đổi mới.
Điều này có thể có tác động sâu sắc đến nền kinh tế toàn cầu, thúc đẩy tăng trưởng và tạo ra các cơ hội mới.
Một Hệ Sinh Thái AI Bao Trùm Hơn
Những nỗ lực của DeepSeek để dân chủ hóa AI đang đóng góp vào một hệ sinh thái AI bao trùm hơn, nơi nhiều người có cơ hội tham gia vào việc phát triển và sử dụng AI. Điều này có thể giúp đảm bảo rằng AI được sử dụng theo cách mang lại lợi ích cho tất cả các thành viên trong xã hội, chứ không chỉ một số ít được chọn.
Bằng cách trao quyền cho các doanh nghiệp nhỏ hơn, các nhà phát triển cá nhân và nhà nghiên cứu, DeepSeek đang thúc đẩy một bối cảnh AI đa dạng và đổi mới hơn.