GPT-4.5: Một Sự Tinh Chỉnh, Không Phải Cuộc Cách Mạng
OpenAI gần đây đã cung cấp GPT-4.5 cho người dùng ChatGPT Pro, các tài khoản Plus, Team, doanh nghiệp và giáo dục sẽ sớm được tiếp cận. Được biết đến nội bộ với tên gọi ‘Orion’, mô hình này tự hào có “khả năng nắm bắt ý định của con người tốt hơn, diễn giải các tín hiệu tinh tế và kỳ vọng ngầm với sắc thái và trí tuệ cảm xúc cao hơn”, theo OpenAI. Nó tận dụng các kỹ thuật giám sát mới cùng với việc tinh chỉnh truyền thống và học tăng cường từ phản hồi của con người, phản ánh quá trình phát triển của GPT-4o. GPT-4.5 cung cấp khả năng tìm kiếm theo thời gian thực, hỗ trợ tải lên tệp và hình ảnh, đồng thời tích hợp với canvas để viết và viết mã. Tuy nhiên, nó hiện thiếu các tính năng đa phương thức như chế độ thoại, video hoặc chia sẻ màn hình có trong ChatGPT.
OpenAI nhấn mạnh rằng học tập không giám sát giúp nâng cao độ chính xác và trực giác của mô hình. Cách tiếp cận này là động lực thúc đẩy những tiến bộ trong các mô hình như GPT-3.5, GPT-4 và giờ là GPT-4.5. Riêng biệt, việc mở rộng suy luận đào tạo các mô hình xử lý thông tin một cách có hệ thống, tạo ra một chuỗi suy nghĩ trước khi phản hồi. Cách tiếp cận có phương pháp này cải thiện khả năng giải quyết các thách thức STEM và logic phức tạp, như được chứng minh bởi các mô hình như OpenAI o1 và OpenAI o3-mini. GPT-4.5 được trình bày như một ví dụ điển hình về việc mở rộng quy mô học tập không giám sát, tận dụng sức mạnh tính toán tăng lên, bộ dữ liệu lớn hơn và đổi mới kiến trúc. Được đào tạo trên các siêu máy tính Microsoft Azure AI, nó được cho là có kiến thức rộng hơn và hiểu biết sâu sắc hơn về thế giới, giảm ảo giác và tăng độ tin cậy.
Bất chấp những tiến bộ này, GPT-4.5 vẫn chưa tạo ra sự nhiệt tình đáng kể. Nó được coi là một cải tiến gia tăng hơn là một bước đột phá. Trong khi OpenAI quảng cáo về trí tuệ cảm xúc, sắc thái và sự sáng tạo được nâng cao, nhiều người dùng vẫn chưa nhận thấy sự khác biệt đáng kể so với GPT-4o. Việc thiếu các tiến bộ đa phương thức, một tính năng chính của GPT-4o, càng góp phần vào nhận thức này.
Hơn nữa, GPT-4.5 đã chứng minh xu hướng tạo ra các kết quả vô nghĩa. Công cụ đo điểm chuẩn thực tế nội bộ của OpenAI, SimpleQA, tiết lộ rằng GPT-4.5 bị ảo giác (trình bày các bịa đặt như sự thật với sự tự tin) 37,1% thời gian. Đây là một mối quan tâm đáng kể, ngay cả khi so sánh với GPT-4o, một mô hình “suy luận” tiên tiến khác, bị ảo giác 61,8% thời gian trên cùng một điểm chuẩn. Mô hình o3-mini nhỏ hơn, rẻ hơn có tỷ lệ ảo giác thậm chí còn cao hơn là 80,3%.
Bối cảnh AI hiện tại, với các đối thủ cạnh tranh như Anthropic với Claude 3.7 và những tiến bộ của Google với Gemini, đã nâng cao kỳ vọng về những nâng cấp đáng kể. Người dùng đang tìm kiếm những đột phá, không chỉ là những cải tiến, và GPT-4.5, ở dạng hiện tại, dường như không đạt được dấu ấn này.
Sự Trỗi Dậy Của Các Mô Hình Suy Luận và Niềm Tin Của Nhà Đầu Tư
Elon Musk gần đây đã gợi ý trên X rằng Trí tuệ Nhân tạo Tổng quát (AGI) đang ở trên đường chân trời. Tuyên bố này được đưa ra trong bối cảnh cuộc đua sôi nổi giữa các gã khổng lồ công nghệ như OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic và xAI của chính Musk để phát triển các mô hình suy luận – các hệ thống AI được thiết kế để mô phỏng tư duy giống con người.
Các nhà đầu tư rõ ràng đang thể hiện sự nhiệt tình cho việc theo đuổi này. Ngay sau khi ra mắt Claude 3.7 Sonnet với khả năng suy luận lai, Anthropic đã đảm bảo được một vòng tài trợ Series E trị giá 3,5 tỷ đô la. Điều này đã tăng gấp ba lần giá trị của nó lên 61,5 tỷ đô la, củng cố vị thế của nó như một đối thủ cạnh tranh lớn với OpenAI. Khoản đầu tư, do Lightspeed Venture Partners dẫn đầu và bao gồm Salesforce Ventures, Cisco, Fidelity, Jane Street và những người khác, sẽ được sử dụng để mở rộng sức mạnh tính toán cho phát triển AI, tăng cường nghiên cứu an toàn và đẩy nhanh tăng trưởng toàn cầu.
Đẩy Lùi Giới Hạn Của Suy Luận: Điểm Chuẩn BBEH
Các Mô hình Ngôn ngữ Lớn (LLM) ngày càng được tích hợp vào các ứng dụng hàng ngày, đòi hỏi khả năng suy luận mạnh mẽ trên các lĩnh vực khác nhau. Tuy nhiên, các điểm chuẩn hiện có thường ưu tiên toán học và mã hóa, bỏ qua các loại suy luận quan trọng khác. Trong khi bộ dữ liệu BIG-Bench đã được sử dụng rộng rãi để đánh giá LLM về các nhiệm vụ suy luận phức tạp, các mô hình đã đạt được tiến bộ đáng kể đến mức chúng hiện đạt điểm gần như hoàn hảo trên cả BIG-Bench và biến thể thách thức hơn của nó, BIG-Bench Hard (BBH). Sự bão hòa này làm cho các điểm chuẩn này kém hiệu quả hơn để đánh giá các tiến bộ tiếp theo.
Để giải quyết hạn chế này, các nhà nghiên cứu đã giới thiệu BIG-Bench Extra Hard (BBEH). Điểm chuẩn mới này thay thế mỗi tác vụ trong BBH bằng một phiên bản khó hơn đáng kể, trong khi vẫn đánh giá các kỹ năng suy luận tương tự. Các thử nghiệm trên BBEH cho thấy ngay cả các mô hình đa năng tốt nhất cũng chỉ đạt được điểm 9,8%, trong khi mô hình hàng đầu được thiết kế đặc biệt cho suy luận đạt 44,8%. Những kết quả này làm nổi bật những thách thức đang diễn ra mà LLM phải đối mặt với suy luận phức tạp, cho thấy còn nhiều dư địa để cải thiện. Bài báo nghiên cứu đầy đủ cung cấp thêm chi tiết về điểm chuẩn mới này.
Vệ Tinh Được Hỗ Trợ Bởi AI: Kỷ Nguyên Mới Trong Thám Hiểm và Vận Hành Không Gian
TakeMe2Space, một công ty khởi nghiệp về công nghệ vũ trụ có trụ sở tại Hyderabad, gần đây đã đảm bảo được 5,5 crore Rs trong vòng tài trợ trước hạt giống do Seafund dẫn đầu, với sự tham gia của Blume Ventures, Artha Venture Fund, AC Ventures và các nhà đầu tư thiên thần khác. Khoản tài trợ này, mặc dù khiêm tốn, nhưng báo hiệu một bước tiến quan trọng hướng tới việc thành lập phòng thí nghiệm AI đầu tiên của Ấn Độ trong không gian. TakeMe2Space có kế hoạch sử dụng số tiền này để phát triển MOI-1 (My Orbital Infrastructure–Technology Demonstrator), một nền tảng cho phép người dùng tải lên các mô hình AI quan sát trái đất hoặc các thí nghiệm không gian khác trực tiếp lên vệ tinh quỹ đạo thông qua bảng điều khiển web có tên Orbitlab. Người dùng sẽ chỉ trả tiền cho thời gian sử dụng vệ tinh, với mức giá 2 đô la mỗi phút.
Nền tảng MOI-TD của công ty được cho là đã chứng minh khả năng tải lên các mô hình AI lớn từ trạm mặt đất, thực thi mã bên ngoài trên vệ tinh và tải xuống an toàn các kết quả được mã hóa và mã hóa. Điều này thể hiện một bước tiến tới các hoạt động vệ tinh tự động và hiệu quả hơn.
TakeMe2Space không đơn độc trong nỗ lực này. Các tổ chức như ESA (với OPS-SAT) và Globalstar cũng đang tiên phong trong các ứng dụng thực tế của công nghệ vệ tinh hỗ trợ AI, từ giao tiếp IoT an toàn đến thực thi mô hình AI trên quỹ đạo. Khi công nghệ tiếp tục phát triển, các vệ tinh do AI điều khiển sẽ ngày càng trở nên tự động, dẫn đến các hoạt động không gian hiệu quả hơn và mở ra những khả năng mới cho nghiên cứu, bảo mật và kết nối toàn cầu.
Theo truyền thống, các vệ tinh phụ thuộc rất nhiều vào các trạm mặt đất để xử lý dữ liệu, ra quyết định và thực hiện lệnh. Dữ liệu phải được tải xuống, phân tích trên Trái đất và sau đó những hiểu biết đã xử lý được tải lên lại vệ tinh – một quá trình vừa tốn thời gian vừa tốn nhiều băng thông. Tuy nhiên, những tiến bộ trong AI và điện toán biên (xử lý dữ liệu trên chính thiết bị thay vì trên đám mây) hiện đang cho phép các vệ tinh xử lý dữ liệu trên tàu, đưa ra quyết định tự động và truyền an toàn chỉ những thông tin chi tiết quan trọng nhất. Điều này dẫn đến các hoạt động nhanh hơn, thông minh hơn và hiệu quả hơn.
Hoạt động của các vệ tinh hiện đại được hỗ trợ bởi AI thường bao gồm ba bước chính:
- Tải lên các thuật toán AI: Các thuật toán AI được truyền từ các trạm mặt đất đến các vệ tinh, cung cấp cho chúng khả năngxử lý dữ liệu tiên tiến.
- Phân tích dữ liệu trên tàu: Các mô hình AI phân tích hình ảnh, dữ liệu cảm biến và các đầu vào khác trực tiếp trên quỹ đạo, giảm thiểu nhu cầu can thiệp liên tục từ mặt đất.
- Tải xuống an toàn các thông tin chi tiết: Thay vì truyền dữ liệu thô, các vệ tinh gửi các thông tin chi tiết được mã hóa, tiết kiệm băng thông và tăng cường bảo mật.
Cách tiếp cận dựa trên AI này mang lại một số lợi thế. Nó giảm đáng kể độ trễ bằng cách cho phép các vệ tinh xử lý dữ liệu trong không gian, cho phép phản ứng nhanh hơn với các điều kiện thời gian thực mà không cần chờ hướng dẫn từ các trạm mặt đất. Việc sử dụng băng thông được tối ưu hóa, vì chỉ những thông tin chi tiết có liên quan nhất mới được truyền đi thay vì khối lượng lớn dữ liệu thô. Bảo mật cũng được cải thiện thông qua giao tiếp được mã hóa, giảm thiểu nguy cơ bị tấn công mạng và vi phạm dữ liệu. Những lợi ích này đặc biệt có giá trị trong các ứng dụng như ứng phó thảm họa, hoạt động quân sự và thám hiểm không gian.
Các ứng dụng thực tế của vệ tinh hỗ trợ AI rất đa dạng và có tác động:
- Quản lý thảm họa: Các vệ tinh được trang bị AI có thể phát hiện cháy rừng, lũ lụt và bão theo thời gian thực, cho phép các đội ứng phó khẩn cấp hành động nhanh chóng.
- Nông nghiệp chính xác: Các mô hình AI phân tích sức khỏe cây trồng và điều kiện đất đai để nâng cao các phương pháp canh tác chính xác.
- Giám sát môi trường: Các cơ quan môi trường sử dụng dữ liệu vệ tinh để theo dõi mức độ ô nhiễm không khí và nước.
- Điều hướng tự động và hoạt động không gian: AI cải thiện khả năng tránh va chạm bằng cách dự đoán và phản ứng với các mối đe dọa tiềm ẩn, đảm bảo an toàn cho các vệ tinh. Nó cũng tạo điều kiện cho việc điều phối các chòm sao vệ tinh, tăng cường phạm vi phủ sóng và hiệu quả. Hơn nữa, AI đóng một vai trò quan trọng trong việc theo dõi và dự đoán chuyển động của các mảnh vỡ quỹ đạo, giảm nguy cơ thiệt hại cho cơ sở hạ tầng không gian.
- Quốc phòng và An ninh: Các hệ thống giám sát hỗ trợ AI phát hiện các hoạt động trái phép và di chuyển quân sự với độ chính xác cao hơn.
- Viễn thông và IoT: Các vệ tinh do AI điều khiển góp phần định tuyến lưu lượng thông minh hơn, cải thiện kết nối internet vệ tinh và đảm bảo liên lạc toàn cầu liền mạch.
- Thám hiểm không gian: AI nâng cao hiệu quả của kính viễn vọng không gian trong việc phát hiện các tiểu hành tinh và ngoại hành tinh, thúc đẩy đáng kể các nỗ lực khám phá không gian.
Mặc dù có nhiều lợi thế, vẫn còn những thách thức trong việc phát triển và triển khai các vệ tinh hỗ trợ AI:
- Sức mạnh tính toán hạn chế: Các vệ tinh phải hoạt động trên các chip công suất thấp, chống bức xạ, điều này hạn chế khả năng của AI.
- Môi trường không gian khắc nghiệt: Phơi nhiễm bức xạ có nguy cơ gây ra sự cố phần cứng.
- Các mối đe dọa bảo mật: Việc tải lên và thực thi mã bên ngoài trong không gian đòi hỏi phải quản lý cẩn thận để ngăn chặn các cuộc tấn công mạng.
- Chi phí và thời gian phát triển: Việc xây dựng, thử nghiệm và xác thực phần cứng vệ tinh tương thích với AI là một quá trình tốn kém và mất thời gian.
- Yêu cầu về khả năng thích ứng: Các mô hình AI được triển khai trên quỹ đạo phải có khả năng thích ứng cao, hoạt động với các bản cập nhật tối thiểu và tự động điều chỉnh theo các tình huống mới.
AI Unlocked: Loại Bỏ Các Cụm Từ Lặp Lại Trong ChatGPT
AI có thể là một công cụ có giá trị trong việc tạo nội dung, hỗ trợ viết, động não, cải thiện độ rõ ràng, tinh chỉnh cấu trúc và nâng cao khả năng đọc tổng thể. Tuy nhiên, một vấn đề phổ biến với văn bản do AI tạo ra là xu hướng sử dụng ngôn ngữ công thức do lựa chọn từ lặp đi lặp lại. Thay vì cung cấp các thông điệp mới mẻ, có tác động, AI thường dựa vào các mẫu quen thuộc, làm giảm hiệu quả và tính độc đáo.
Các từ và cụm từ bị lạm dụng, chẳng hạn như “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” và “A testament to…,” có thể làm giảm đáng kể chất lượng nội dung do AI tạo ra. Đối với các nhà tiếp thị sản phẩm, sự lặp lại này có thể làm cho thông điệp kém hấp dẫn hơn, giảm sự tương tác của khán giả, làm suy yếu sự khác biệt hóa thương hiệu và ngăn cản những hiểu biết sâu sắc và thông điệp chiến lược nổi bật trong một thị trường đông đúc.
Bằng cách tận dụng tính năng bộ nhớ của ChatGPT, có thể giảm thiểu vấn đề này và loại bỏ các từ và cụm từ bị lạm dụng. Dưới đây là cách sử dụng hiệu quả tính năng này:
Truy cập: ChatGPT có thể được truy cập thông qua trang web hoặc ứng dụng di động của nó.
Lợi ích:
- Nâng cao tính độc đáo: Đảm bảo nội dung do AI tạo ra ít giống robot hơn và giống con người hơn.
- Cải thiện thông điệp thương hiệu: Tránh các cụm từ chung chung làm suy yếu sự khác biệt hóa thương hiệu.
- Tăng cường sự tương tác: Khuyến khích giao tiếp hiệu quả hơn bằng cách giảm sự dư thừa.
Ví dụ: Tạo nội dung tiếp thị sản phẩm
Hãy xem xét một nhà tiếp thị sản phẩm được giao nhiệm vụ soạn thảo nội dung cho một sản phẩm mới ra mắt. Một yêu cầu ban đầu đối với ChatGPT có thể dẫn đến một phản hồi chứa đầy các cụm từ lặp đi lặp lại và chung chung như “delving into an intricate landscape of innovation…,” làm cho thông điệp có cảm giác không có cảm hứng.
Để tạo nội dung hấp dẫn và độc đáo hơn, nhà tiếp thị có thể làm theo các bước sau:
- Thiết lập lời nhắc: Nhà tiếp thị hướng dẫn rõ ràng ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” Điều này hướng dẫn ChatGPT chủ động lọc ra các thuật ngữ này trong các phản hồi của nó.
- Sử dụng bộ nhớ liên tục: Cụm từ “Commit this to memory” đảm bảo rằng ChatGPT giữ lại các hướng dẫn cụ thể này trong nhiều tương tác. Điều này cho phép tránh liên tục các từ và cụm từ được chỉ định. ChatGPT sẽ kiểm tra bộ nhớ của nó trước khi tạo văn bản và tuân theo các hướng dẫn để tránh các thuật ngữ được chỉ định.
- Xem xét thủ công: Sau khi tạo phản hồi, nhà tiếp thị xem xét nội dung để tìm bất kỳ sự dư thừa nào còn lại và tinh chỉnh ngôn ngữ để rõ ràng và có tác động.
Hiệu quả:
- Tùy chỉnh lời nhắc: Các hướng dẫn cụ thể giúp định hình đầu ra của AI.
- Duy trì bộ nhớ: ChatGPT có thể lưu trữ và tuân theo các quy tắc tránh từ trong các cuộc trò chuyện.
- Tinh chỉnh thủ công: Chỉnh sửa cuối cùng của con người đảm bảo sự rõ ràng và tính xác thực.
Lưu ý: Các công cụ và phân tích được trình bày trong phần này dựa trên thử nghiệm nội bộ và chứng minh giá trị rõ ràng. Các khuyến nghị là độc lập và không bị ảnh hưởng bởi những người tạo ra công cụ.
Tin Tức và Phát Triển AI Bổ Sung
Điện thoại thông minh hỗ trợ AI đang gia tăng: Deutsche Telekom đã công bố kế hoạch tại Đại hội Thế giới Di động 2025 ở Barcelona để ra mắt một điện thoại thông minh hỗ trợ AI có trợ lý Perplexity. Trợ lý này được thiết kế để đơn giản hóa các công việc hàng ngày như đặt taxi, đặt bàn, dịch ngôn ngữ theo thời gian thực và trả lời các câu hỏi của người dùng. Công ty hình dung đây là một trợ lý ảo sẽ hỗ trợ hàng triệu khách hàng bằng cách viết email, bắt đầu cuộc gọi, tóm tắt văn bản và quản lý lịch. Điện thoại AI sẽ tích hợp Google Cloud AI, ElevenLabs và Picsart để nâng cao chức năng của nó và dự kiến sẽ ra mắt vào cuối năm nay. Glance, một đơn vị của InMobi và Google Cloud cũng đã công bố hợp tác để tận dụng các mô hình AI của Google để phát triển các ứng dụng AI hướng tới người tiêu dùng nhằm nâng cao trải nghiệm người dùng trên màn hình khóa điện thoại thông minh và màn hình TV xung quanh. Glance hiện cung cấp năng lượng cho hơn 450 triệu điện thoại thông minh dựa trên Android trên toàn thế giới.
Các lĩnh vực chính phủ chứng kiến sự sụt giảm các sự cố mạng nghiêm trọng: Các ngành công nghiệp chính phủ và phát triển đã trải qua sự sụt giảm đáng kể các sự cố nghiêm trọng liên quan đến sự tham gia trực tiếp của con người vào năm 2024, theo báo cáo mới nhất của nhà phân tích Kaspersky Managed Detection and Response (MDR). Tuy nhiên, các lĩnh vực thực phẩm, CNTT, viễn thông và công nghiệp cho thấy sự gia tăng các sự cố như vậy.
OpenAI có kế hoạch tích hợp Sora vào ChatGPT: OpenAI đang làm việc để tích hợp công cụ tạo video AI của mình, Sora, trực tiếp vào ChatGPT. Hiện tại, Sora chỉ khả dụng thông qua một ứng dụng web chuyên dụng, cho phép người dùng tạo các clip điện ảnh dài tới 20 giây. OpenAI cũng đang phát triển một công cụ tạo hình ảnh AI được hỗ trợ bởi Sora.