Giải mã ChatGPT: Mọi điều cần biết

ChatGPT có mặt ở khắp mọi nơi, nhưng nó có thể làm gì và nó hoạt động như thế nào? Chúng ta sẽ chia nhỏ những điều cơ bản và giải thích cách bắt đầu sử dụng AI.

Đã vài năm kể từ khi ChatGPT ra mắt lần đầu tiên vào năm 2022 và rất có thể bạn vẫn đang ở giai đoạn đầu của hành trình AI của mình. Chúng ta đang học hỏi thêm về AI mỗi ngày và việc hiểu cách công nghệ này hoạt động có thể giúp bạn tận dụng tối đa các cuộc trò chuyện của mình.

Mặc dù ChatGPT có vẻ dễ sử dụng ở bề ngoài, nhưng có rất nhiều tính toán phức tạp diễn ra đằng sau hậu trường được điều chỉnh cho từng người dùng. Các mô hình ngôn ngữ lớn (LLM) dựa vào các mạng nơ-ron AI khổng lồ có thể xử lý và tạo văn bản giống con người, phân tích hình ảnh và thậm chí tự nói chuyện. Đây là cách nó hoạt động.

Công nghệ đằng sau ChatGPT là gì?

Về cơ bản, ChatGPT là một trang web hoặc ứng dụng di động đàm thoại có thể nhận các yêu cầu từ con người. Mọi người đã tìm thấy nhiều ứng dụng sáng tạo cho nó, bao gồm viết bài báo và email, thiết kế trang web, viết mã phần mềm và hoàn thành các tác vụ thông qua proxy AI.

Mặc dù ChatGPT là chatbot AI phổ biến nhất hiện nay, nhưng các chatbot khác mà bạn có thể đã nghe nói đến bao gồm Google Gemini, Perplexity và Claude của Anthropic. Tất cả chúng đều được đào tạo trên một lượng lớn dữ liệu, điều này “dạy” chúng cách tương tác với con người theo cách thuyết phục cứ như thể chúng là con người. Nhưng chúng giống người ngoài hành tinh hơn (hoặc trẻ mới biết đi) liên tục cố gắng học cách trở thành người lớn. Họ cũng muốn được yêu thích; OpenAI gần đây đã phải thu hồi bản cập nhật ChatGPT vì nó trở nên quá tâng bốc.

Quá trình học tập này đạt được bằng cách đưa dữ liệu vào chatbot, chủ yếu từ internet (Wikipedia là một nguồn lớn), bao gồm sách có bản quyền, video YouTube và các tài liệu gốc khác, đôi khi gây ra các vụ kiện. Người ngoài hành tinh chatbot khao khát nhiều thông tin nhất có thể để họ có thể tiếp tục hoạt động tốt hơn.

Mô hình học bằng cách lấy một đoạn văn bản từ dữ liệu (ví dụ: câu mở đầu của một bài viết trên Wikipedia) và cố gắng dự đoán mã thông báo tiếp theo trong chuỗi. Sau đó, nó so sánh đầu ra với văn bản thực tế của nó trong kho ngữ liệu đào tạo và điều chỉnh các tham số của nó để sửa bất kỳ lỗi nào. Bằng cách lặp đi lặp lại điều này trên một lượng văn bản (hoặc hình ảnh hoặc giọng nói) rất lớn, nó có thể phát triển một mô hình ngôn ngữ có thể tạo ra các chuỗi văn bản mạch lạc khi được đưa ra một lời nhắc.

Quá trình này dựa trên một kiến trúc phần mềm có tên là mạng nơ-ron sâu (DNN), đặc biệt là mạng Transformer. Mạng Transformer rất giỏi trong việc chia văn bản thành “mã thông báo”, về cơ bản là các phần của từ (“từ” là một mã thông báo, “về cơ bản” là hai mã thông báo). Sau đó, nó dự đoán chuỗi nào có khả năng cộng hưởng với người dùng nhất dựa trên tương tác của người dùng. Mỗi phép tính khác nhau đối với mỗi người, đòi hỏi một lượng lớn điện và năng lượng.

ChatGPT cũng “ghi nhớ” các cuộc trò chuyện trước đây của bạn để tạo ra các phản hồi tùy chỉnh. Bạn càng trò chuyện với nó nhiều, nó càng có thể hoàn thiện các tương tác của mình với bạn. Nếu bạn nói điều gì đó như “điều đó không đúng”, mô hình sẽ ghi nhận và thử một cách khác vào lần tới. Điều này được gọi là “học tăng cường từ phản hồi của con người” (RLHF), và đây là lý do tại sao ChatGPT hữu ích hơn so với những người tiền nhiệm của nó.

Làm cách nào để dùng thử ChatGPT?

Bạn có thể đăng ký ChatGPT trên trang web hoặc ứng dụng OpenAI (iOS hoặc Android), và bạn có thể sử dụng phiên bản cơ bản ngay cả khi không tạo tài khoản. Phiên bản miễn phí đủ tốt cho các cuộc trò chuyện không thường xuyên, nhưng nó giới hạn số lần bạn có thể tương tác với mô hình GPT-4o hàng đầu mỗi ngày cũng như số lượng ảnh bạn có thể tải lên.

Để sử dụng nghiêm túc và liên tục, bạn có thể thử phiên bản trả phí ChatGPT Plus, có giá 20 đô la mỗi tháng. Nó có ít giới hạn hơn và các tính năng bổ sung, như mô hình tạo video Sora và GPT tùy chỉnh. Cái sau là các mô hình vi mô mà bạn có thể sử dụng cho các tác vụ cụ thể, như dịch ngôn ngữ, trong khi mô hình ChatGPT chính giống như một vận động viên toàn năng hơn.

OpenAI cũng cung cấp các cấp đăng ký khác, như mô hình Pro 200 đô la mỗi tháng không có giới hạn và có thể thực hiện các hoạt động như biên soạn báo cáo nghiên cứu nâng cao. Ngoài ra còn có các tài khoản nhóm và doanh nghiệp dành cho các tổ chức lớn hơn. Cuối cùng, các nhà phát triển cũng có thể truy cập ChatGPT thông qua API của OpenAI, nơi bạn trả tiền dựa trên số lượng mã thông báo bạn sử dụng.

Tôi có thể làm gì với ChatGPT?

Với các hướng dẫn và ngữ cảnh phù hợp, ChatGPT có thể rất hữu ích. Dưới đây là một số điều bạn có thể làm với ChatGPT.

Viết

ChatGPT có thể là một trợ lý viết hữu ích. Nếu bạn nhắc nó viết một bài báo hoàn chỉnh một lần, nó sẽ cho kết quả lẫn lộn. Nhưng nếu bạn làm việc với nó từng bước, ChatGPT có thể làm được những điều ấn tượng. Ví dụ: bạn có thể bắt đầu với một dàn ý và bổ sung từng phần với sự trợ giúp của chatbot OpenAI.

Biên tập

ChatGPT là một trợ lý biên tập tuyệt vời; sử dụng nó để biên tập bản sao, hiệu đính, viết lại, điều chỉnh phong cách, v.v.

Dịch

ChatGPT có thể dịch tốt sang một số ngôn ngữ. Nếu bạn đang làm việc trong một lĩnh vực chuyên biệt, bạn có thể cải thiện bản dịch của nó bằng cách cung cấp ngữ cảnh, ví dụ: các ví dụ về tài liệu ngôn ngữ nguồn và ngôn ngữ đích.

Tóm tắt

ChatGPT có thể tóm tắt các bài báo, bài phát biểu và bài luận. Nó trở nên chính xác hơn khi bạn cung cấp các nguyên tắc, ví dụ: những chủ đề cần làm nổi bật.

Động não

ChatGPT có thể giúp ích ở đây về mọi thứ, từ đề xuất các điểm thảo luận cho bản trình bày đến lên kế hoạch cho một chuyến đi.

Viết mã

ChatGPT là một trợ lý mã hóa tốt có thể chuyển đổi mô tả chức năng thành mã hoạt động trong một số ngôn ngữ lập trình và ngôn ngữ kịch bản.

Tạo và giải thích hình ảnh

Bạn có thể tải ảnh lên và hỏi các câu hỏi về ảnh; ví dụ: thêm ảnh một cái cây và hỏi “đây là cây gì?” ChatGPT cũng có thể giải thích ảnh chụp màn hình nếu bạn gặp sự cố, bạn có thể thấy một cái gì đó trên điện thoại của mình. Nó cũng có thể tạo hình ảnh với trình tạo nội bộ mới của nó, đã được đón nhận.

Thực hiện các cuộc trò chuyện bằng lời nói

Với chế độ giọng nói, bạn không cần phải tạo ra các lời nhắc văn bản hoàn hảo. Chỉ cần nói vào micrô và bắt đầu trò chuyện.

Tạo đoạn phim

Trình tạo video Sora tạo ra các đoạn tùy chỉnh, chỉ dài vài giây, không có âm thanh, có thể được sử dụng để tăng cường các dự án video lớn hơn hoặc được sử dụng làm các đoạn độc lập. Nó có sẵn cho người đăng ký ChatGPT Plus và Pro, đồng thời có thể được sử dụng miễn phí với các chức năng giới hạn thông qua ứng dụng Microsoft Bing.

Chúng tôi không khuyên bạn nên sử dụng ChatGPT làm công cụ nghiên cứu, vì nó có xu hướng tạo ra ảo giác hoặc bịa đặt thông tin. Một LLM như ChatGPT có thể kết hợp các văn bản theo cách mà từ vựng là đúng nhưng thực tế là sai. Điều này cũng áp dụng cho việc sử dụng ChatGPT để mã hóa: nó có thể tạo ra mã không hoạt động hoặc không an toàn. Một quy tắc chung tốt là sử dụng ChatGPT làm điểm khởi đầu, sau đó kiểm tra tính xác thực của đầu ra của nó bằng cách nhấp vào các liên kết nguồn do ChatGPT cung cấp hoặc tìm kiếm trên Google riêng biệt. (Perplexity là một chatbot khác tập trung vào trích dẫn.)

Có những lựa chọn thay thế nào cho ChatGPT?

Một số công ty và tổ chức khác đã phát triển các LLM theo dõi hướng dẫn có thể so sánh với ChatGPT.

  • Google Gemini: Mô hình AI của Google có thể làm hầu hết mọi thứ bạn có thể làm với ChatGPT và có thể kết nối với hệ sinh thái của Google, vì vậy bạn có thể xuất đầu ra của nó sang Gmail, Google Sheets, Tài liệu, v.v.
  • Bing: Microsoft đã đầu tư hàng tỷ đô la vào OpenAI và đã tích hợp ChatGPT vào công cụ tìm kiếm Bing của mình. Đây là một giao diện đàm thoại để tìm kiếm kiến thức và thực hiện các tác vụ khác mà bạn có thể thực hiện bằng ChatGPT. Nó trích dẫn các nguồn cho thông tin mà nó tạo ra, cho phép bạn xác minh nguồn gốc.
  • Claude: Anthropic là một phòng thí nghiệm AI có trụ sở tại San Francisco đã phát hành Claude, một đối thủ cạnh tranh với ChatGPT có tiếng tăm rất lớn về khả năng viết và mã hóa.
  • Perplexity: Là một lựa chọn thay thế cho Google, nhiều người sử dụng Perplexity để tìm kiếm trên web. Nó đang nhanh chóng nổi lên và sẽ là nền tảng tìm kiếm được lựa chọn trên điện thoại Razr mới của Motorola. Có thông tin cho rằng Samsung đang đàm phán để làm điều tương tự.
  • Mô hình nguồn mở: Cộng đồng nguồn mở đã phát hành các LLM mà bạn có thể chạy trên máy chủ của riêng mình. Các LLM này có thể giúp bạn kiểm soát dữ liệu của mình và tránh bị khóa nhà cung cấp. Các LLM nguồn mở nhỏ hơn nhiều so với ChatGPT và khó thiết lập hơn, nhưng chúng có thể tạo ra kết quả ấn tượng nếu bạn có kỹ năng kỹ thuật. Mô hình Llama của Meta là một trong những mô hình nổi tiếng nhất. Các tùy chọn khác bao gồm Open Assistant, Alpaca, Vicuna và Dolly 2.