Tóm tắt ngắn
- Anthropic cho biết họ dự kiến sẽ mở rộng quyền truy cập vào mô hình AI Claude Mythos cho khách hàng “trong vài tuần tới” sau khi hoàn tất các thử nghiệm bổ sung.
- Claude Mythos đã thu hút nhiều sự chú ý sau khi các nhà nghiên cứu phát hiện mô hình này có thể tự động xác định lỗ hổng bảo mật và thực hiện các cuộc tấn công mạng phức tạp.
- Hiện Anthropic vẫn đang giới hạn quyền truy cập Claude Mythos thông qua chương trình Project Glasswing.
Anthropic cho biết hôm thứ Năm rằng họ kỳ vọng sẽ mở rộng quyền truy cập vào các mô hình Claude Mythos “trong vài tuần tới”, cho thấy công ty có thể sớm vượt ra ngoài phạm vi triển khai hạn chế vốn đang được áp dụng đối với hệ thống AI tập trung vào an ninh mạng này.
“Chúng tôi đang đạt được những tiến triển rất nhanh trong việc phát triển các biện pháp bảo vệ cần thiết và kỳ vọng sẽ có thể đưa các mô hình thuộc cấp độ Mythos đến với tất cả khách hàng trong vài tuần tới,” Anthropic cho biết trong thông báo đi kèm với việc ra mắt mô hình Opus 4.8.
Đây là tín hiệu rõ ràng nhất từ trước đến nay cho thấy Anthropic đang chuẩn bị phát hành rộng rãi Mythos, sau nhiều tháng các nhà nghiên cứu, chính phủ và chuyên gia an ninh mạng liên tục cảnh báo về năng lực của mô hình này.
Anthropic không cho biết cụ thể những biện pháp bảo vệ nào vẫn cần hoàn thiện trước khi Mythos được triển khai rộng rãi hơn, cũng như liệu tất cả khách hàng có nhận được cùng một mức độ truy cập khi mô hình chính thức mở cửa hay không.
Công ty cũng chưa phản hồi ngay yêu cầu bình luận từ Decrypt.
Người dùng trên Myriad — nền tảng thị trường dự đoán do công ty mẹ của Decrypt là Dastan vận hành — ngày càng tin rằng mô hình này sẽ được phát hành trước cuối tháng 6. Tại thời điểm bài viết được đăng, xác suất cho kịch bản đó đã tăng lên 44%, so với chỉ 17,5% vào buổi sáng cùng ngày.
Claude Mythos lần đầu xuất hiện vào tháng 3 sau khi các tài liệu nháp trên blog của Anthropic bị rò rỉ lên mạng. Khi đó, Anthropic mô tả Mythos là “mô hình AI mạnh nhất mà chúng tôi từng phát triển” và định vị nó ở một cấp độ hoàn toàn cao hơn các mô hình Opus tiên tiến nhất của công ty.
“Dù Mythos hiện vượt xa bất kỳ mô hình AI nào khác về năng lực an ninh mạng, nó cũng báo hiệu làn sóng sắp tới của các mô hình có thể khai thác lỗ hổng với tốc độ vượt xa khả năng phòng thủ của con người,” Anthropic viết.
Kể từ đó, Anthropic đã giới hạn quyền truy cập Mythos thông qua Project Glasswing — chương trình cho phép một số công ty công nghệ, nhà nghiên cứu bảo mật và đối tác chính phủ được sử dụng mô hình trong các điều kiện được kiểm soát nghiêm ngặt.
Anthropic cho rằng Mythos có thể giúp các chuyên gia phòng thủ phát hiện và vá các lỗ hổng phần mềm trước khi chúng bị tin tặc khai thác. Tuy nhiên, các nhà nghiên cứu bảo mật và cơ quan chính phủ cũng cảnh báo rằng chính những khả năng này có thể vô tình đẩy nhanh tốc độ thực hiện các cuộc tấn công mạng.
Những lo ngại đó càng gia tăng sau khi Viện An ninh AI của Vương quốc Anh phát hiện Mythos có thể tự động hoàn thành một cuộc tấn công mô phỏng vào mạng doanh nghiệp gồm 32 bước trong quá trình thử nghiệm.
Vào tháng 4, Mozilla cho biết Mythos đã phát hiện 271 lỗ hổng bảo mật trong Firefox trong các cuộc đánh giá nội bộ.
Đầu tháng này, công ty an ninh mạng Calif tuyên bố một phiên bản thử nghiệm của Mythos đã hỗ trợ các nhà nghiên cứu xây dựng chuỗi khai thác lỗ hổng (exploit chain) nhắm vào dòng chip M5 của Apple.
Mô hình này cũng trở thành tâm điểm của cuộc tranh luận rộng lớn hơn trong ngành AI về cách thức phát hành các hệ thống AI tiên tiến, cũng như việc liệu các công ty AI có đang sử dụng nỗi lo về “ngày tận thế AI” như một công cụ để thúc đẩy sản phẩm của mình hay không.
Trong một cuộc phỏng vấn trên podcast “Core Memory” vào tháng trước, CEO OpenAI là Sam Altman đã cáo buộc Anthropic sử dụng “chiến lược tiếp thị dựa trên nỗi sợ hãi”, cho rằng những cảnh báo về rủi ro an ninh mạng có thể trở thành cái cớ để hạn chế quyền truy cập vào các hệ thống AI mạnh mẽ.
Bản tin Daily Debrief
Bắt đầu mỗi ngày với những tin tức nổi bật nhất hiện tại, cùng các bài viết độc quyền, podcast, video và nhiều nội dung hấp dẫn khác.