Tóm tắt nhanh
- OpenAI cho biết ChatGPT giờ đây có thể nhận diện tốt hơn các dấu hiệu tự gây hại hoặc bạo lực trong các cuộc trò chuyện kéo dài.
- Bản cập nhật xuất hiện trong bối cảnh công ty đang đối mặt với nhiều vụ kiện và điều tra liên quan đến cáo buộc ChatGPT xử lý không phù hợp các cuộc trò chuyện nguy hiểm.
- OpenAI cho biết các biện pháp bảo vệ mới dựa trên những “bản tóm tắt an toàn” tạm thời thay vì bộ nhớ vĩnh viễn hoặc cá nhân hóa người dùng.
Vào thứ Năm, OpenAI đã công bố các tính năng an toàn mới nhằm giúp ChatGPT nhận biết các dấu hiệu rủi ro leo thang trong suốt quá trình trò chuyện, khi công ty ngày càng chịu nhiều áp lực pháp lý và chính trị về cách chatbot xử lý người dùng đang gặp khủng hoảng tâm lý.
Trong một bài đăng blog, OpenAI cho biết các cập nhật này cải thiện khả năng của ChatGPT trong việc nhận diện các dấu hiệu cảnh báo liên quan đến tự tử, tự gây hại và nguy cơ bạo lực bằng cách phân tích ngữ cảnh phát triển theo thời gian thay vì xem mỗi tin nhắn là độc lập.
“Người dùng tìm đến ChatGPT mỗi ngày để trò chuyện về những điều quan trọng với họ — từ các câu hỏi thường ngày đến những cuộc trò chuyện cá nhân hoặc phức tạp hơn,” công ty viết. “Trong hàng trăm triệu lượt tương tác, một số cuộc trò chuyện đến từ những người đang gặp khó khăn hoặc chịu tổn thương tâm lý.”
Theo OpenAI, ChatGPT hiện sử dụng các “bản tóm tắt an toàn” tạm thời, được mô tả là những ghi chú có phạm vi giới hạn nhằm lưu giữ ngữ cảnh liên quan đến an toàn từ các cuộc trò chuyện trước đó.
“Trong các cuộc trò chuyện nhạy cảm, ngữ cảnh đôi khi quan trọng ngang với chính nội dung của một tin nhắn,” công ty cho biết. “Một yêu cầu có vẻ bình thường hoặc mơ hồ khi đứng riêng lẻ có thể mang ý nghĩa hoàn toàn khác nếu được xem cùng với những dấu hiệu đau khổ hoặc ý định gây hại trước đó.”
OpenAI cho biết các bản tóm tắt này chỉ là ghi chú ngắn hạn được sử dụng trong những tình huống nghiêm trọng, không nhằm ghi nhớ người dùng vĩnh viễn hay cá nhân hóa cuộc trò chuyện. Chúng được dùng để phát hiện khi một cuộc trò chuyện đang trở nên nguy hiểm, tránh cung cấp thông tin gây hại, giảm leo thang tình huống hoặc hướng người dùng đến sự hỗ trợ phù hợp.
“Chúng tôi tập trung công việc này vào các tình huống khẩn cấp như tự tử, tự gây hại và gây hại cho người khác,” công ty viết. “Làm việc cùng các chuyên gia sức khỏe tâm thần, chúng tôi đã cập nhật chính sách và quá trình huấn luyện mô hình để cải thiện khả năng nhận biết các dấu hiệu cảnh báo xuất hiện xuyên suốt cuộc trò chuyện và sử dụng ngữ cảnh đó để đưa ra phản hồi cẩn trọng hơn.”
Thông báo này được đưa ra trong bối cảnh OpenAI đang đối mặt với nhiều vụ kiện và điều tra cáo buộc ChatGPT đã không phản hồi phù hợp trong các cuộc trò chuyện liên quan đến bạo lực, sự tổn thương cảm xúc và hành vi nguy hiểm.
Vào tháng 4, Tổng chưởng lý bang Florida James Uthmeier đã mở cuộc điều tra đối với OpenAI liên quan đến các lo ngại về an toàn trẻ em, tự gây hại và vụ xả súng hàng loạt năm 2025 tại Đại học Bang Florida. OpenAI cũng đang đối mặt với một vụ kiện liên bang cáo buộc ChatGPT đã hỗ trợ nghi phạm thực hiện vụ tấn công.
Hôm thứ Ba, OpenAI và CEO Sam Altman tiếp tục bị kiện tại tòa án bang California bởi gia đình của một sinh viên 19 tuổi tử vong do sốc thuốc ngoài ý muốn. Đơn kiện cáo buộc ChatGPT đã khuyến khích việc sử dụng ma túy nguy hiểm và đưa ra lời khuyên về việc pha trộn các chất kích thích.
OpenAI cho biết việc giúp ChatGPT nhận diện “các rủi ro chỉ trở nên rõ ràng theo thời gian” vẫn là một thách thức đang tiếp diễn, và các phương pháp an toàn tương tự có thể được mở rộng sang những lĩnh vực khác trong tương lai.
“Hiện tại, công việc này tập trung vào các tình huống tự gây hại và gây hại cho người khác. Trong tương lai, chúng tôi có thể xem xét liệu các phương pháp tương tự có thể hỗ trợ ở những lĩnh vực rủi ro cao khác như sinh học hoặc an toàn mạng hay không, với các biện pháp bảo vệ phù hợp,” công ty cho biết. “Đây vẫn là một ưu tiên lâu dài và chúng tôi sẽ tiếp tục tăng cường các biện pháp an toàn khi mô hình và hiểu biết của chúng tôi phát triển.”
Bản tin Daily Debrief Newsletter
Bắt đầu mỗi ngày với những tin tức nổi bật nhất hiện tại, cùng các bài viết độc quyền, podcast, video và nhiều nội dung khác.