AI mạng GPT-5.5 của OpenAI đánh bại Mô hình thần thoại bị cấm của Anthropic — Và không ai có thể đóng cửa nó

Tóm lại

OpenAI phát hành GPT-5.5-Cyber, mô hình được thiết kế để giúp tìm và sửa các lỗ hổng phần mềm nhanh hơn các phiên bản trước.
Nó vượt trội hơn Mythos của Anthropic về các điểm chuẩn chính, trong khi Mythos phải đối mặt với lệnh cấm của chính phủ Hoa Kỳ vì lo ngại an ninh quốc gia.
Mô hình này đang được phát hành cho những người bảo vệ đáng tin cậy có khả năng kiểm soát, trái ngược với cách tiếp cận hạn chế hơn của Anthropic.

Mô hình an ninh mạng của OpenAI vừa đánh bại mô hình Anthropic Mythos AI mà chính phủ Hoa Kỳ đã ngừng hoạt động ngoại tuyến—và nó vẫn đang hoạt động.

Vào ngày 22 tháng 6, OpenAI đã công bố ra mắt đầy đủ của GPT-5.5-Cyber như một phần của chương trình phòng thủ không gian mạng Daybreak. Trên CyberGym—một tiêu chuẩn được phát triển tại UC Berkeley nhằm cung cấp cho các tác nhân AI 1.507 lỗ hổng phần mềm đã biết từ 188 dự án nguồn mở và cho điểm chúng về số lượng chúng có thể tái tạo trong môi trường được kiểm soát—mô hình cập nhật đạt 85,6%.

Anthropic’s Mythos 5 chiếm 83,8% trên cùng bảng xếp hạng. Claude Opus 4.7, mô hình được phổ biến rộng rãi hơn của Anthropic, đạt 73,1%.

Khoảng cách ít hơn hai điểm trên bất kỳ điểm chuẩn nào thường sẽ không đáng kể. Bối cảnh ở đây là không. Thần thoại 5 và Truyện ngụ ngôn 5 của Anthropic là đã ngoại tuyến vào ngày 12 tháng 6 sau khi chính quyền Donald Trump ban hành chỉ thị kiểm soát xuất khẩu khẩn cấp với lý do an ninh quốc gia.

Chính phủ đã chỉ ra cách bẻ khóa — một kỹ thuật để vượt qua các giới hạn an toàn tích hợp của mô hình AI, tương tự như việc tìm chìa khóa chính để mở một cánh cửa có độ bảo mật cao. Anthropic không có cách đáng tin cậy để xác minh quốc tịch của người dùng trên quy mô lớn, vì vậy nó đã vô hiệu hóa cả hai mô hình cho mọi người, ở mọi nơi.

Một số thiệt hại là do bản thân tự gây ra. Anthropic đã dành nhiều tháng để mô tả Mythos là một trong những mô hình AI có khả năng nhất và nguy hiểm nhất từng được chế tạo, đồng thời cảnh báo trong tài liệu ra mắt của chính mình rằng khả năng an ninh mạng của nó có thể gây ra tổn hại nghiêm trọng nếu không có những hạn chế phù hợp. Giám đốc điều hành của Anthropic Dario Amodei đã xuất bản một tiểu luận vào ngày 10 tháng 6, so sánh các mô hình AI tiên tiến với máy bay mà các cơ quan quản lý an toàn có thể hạ cánh nếu chúng không đạt yêu cầu kiểm tra.

Vài ngày sau, chính phủ cho hạ cánh máy bay của Anthropic.

Đó không phải là báo động duy nhất trong tuần đó. Nhân chủng học đã có đã bị cháy rồi về một bộ lọc ẩn trong Fable 5 đã âm thầm làm suy giảm kết quả đầu ra của mô hình đối với những người dùng mà nó nghi ngờ đang xây dựng AI cạnh tranh—mà không thông báo cho họ—và buộc phải xin lỗi cũng như đảo ngược chính sách.

Một cuốn sách khác

Trong khi Anthropic đàm phán với Bộ Thương mại và tiếp tục vụ kiện chống lại chính quyền Trump, OpenAI đang mở rộng phạm vi hoạt động của mình. Daybreak đã ký kết quan hệ đối tác an ninh mạng với các tổ chức Úc, Canada, Pháp, Đức, Nhật Bản, Hàn Quốc và EU bao gồm Cơ quan An ninh mạng của Liên minh Châu Âu.

28 công ty bảo mật—bao gồm CrowdStrike, Cisco và Cloudflare—đã tham gia Chương trình đối tác mạng để nhúng GPT-5.5 vào các sản phẩm của họ dành cho khách hàng đã được kiểm duyệt. Theo blog riêng của OpenAI, công cụ Codex Security đã quét hơn 30 triệu cam kết trên 30.000 cơ sở mã và ghi lại hơn 500.000 lỗ hổng đã được sửa kể từ khi ra mắt vào tháng 3.

Công ty cũng đang mở rộng chương trình đối tác để các công ty bảo mật có thể tích hợp những khả năng này vào các công cụ của riêng họ và đưa ra “Patch the Planet”, một sáng kiến giúp khắc phục các lỗ hổng trong các dự án nguồn mở được sử dụng rộng rãi.

Điều đó có nghĩa là GPT-5.5-Cyber không dành cho mục đích sử dụng thông thường. Nó chỉ khả dụng cho các chuyên gia bảo mật đã được xác minh và OpenAI đã chạy thử nghiệm trước khi triển khai với các cơ quan liên bang—bao gồm Trung tâm Tiêu chuẩn và Đổi mới AI và Văn phòng Giám đốc Mạng Quốc gia—trước khi ra mắt. Đó chính là cách tiếp cận hạn chế quyền truy cập mà Anthropic đã thử với Mythos, nhưng OpenAI trước tiên đã làm rõ cách tiếp cận của mình với chính phủ.

Kể từ ngày 23 tháng 6, Fable 5 và Mythos 5 vẫn ngoại tuyến — tạm dừng 11 ngày mà không có ngày khôi phục chính thức từ Anthropic hoặc Bộ Thương mại.

Bản tin tóm tắt hàng ngày

Bắt đầu mỗi ngày với những tin tức hàng đầu ngay bây giờ, cùng với các tính năng độc đáo, podcast, video và hơn thế nữa.