Sự kết hợp của OpenRouter hứa hẹn AI cấp độ Fable của Claude với giá rẻ—Ngay khi Fable 5 trở nên đen tối

Tóm lại

OpenRouter đã ra mắt Fusion vào ngày 12 tháng 6, một API phía máy chủ cung cấp lời nhắc cho một nhóm mô hình, sau đó sử dụng bộ đánh giá và bộ tổng hợp để hợp nhất câu trả lời tốt nhất.
Trên điểm chuẩn DRACO của Perplexity, bảng ngân sách gồm các AI khác nhau đã đạt được 1% so với Fable 5 với chi phí gần bằng một nửa.
Kỹ thuật này nổi lên như một chỉ thị kiểm soát xuất khẩu của Hoa Kỳ buộc Anthropic phải đình chỉ Fable 5 và Mythos 5.

OpenRouter đã đưa ra một API được xây dựng dựa trên một sự đặt cược đơn giản: rằng một nhóm các mô hình AI giá rẻ, được kết hợp đúng cách, có thể phù hợp với một mô hình đắt tiền duy nhất. Và “đắt tiền” nghĩa là Claude Fable 5.

Sản phẩm được gọi là Sự kết hợp. Nó gửi lời nhắc đến nhiều mô hình song song, sau đó sử dụng mô hình đánh giá và bộ tổng hợp để hợp nhất các kết quả thành một câu trả lời có căn cứ.

Thời điểm là ngẫu nhiên. Ngay sau khi phát hành Truyện ngụ ngôn 5 và Mythos 5 vào tuần trước, một chỉ thị kiểm soát xuất khẩu của Hoa Kỳ đã buộc Anthropic đình chỉ các mô hình đó đối với mọi công dân nước ngoài trên toàn thế giới, trích dẫn một phát hiện bẻ khóa gây tranh cãi. OpenRouter đưa tin này đến X vào ngày hôm sau, lao thẳng vào khoảng trống với lời hứa về “Trí thông minh cấp độ ngụ ngôn với giá chỉ bằng một nửa”.

Giới thiệu Fusion API, mô hình kết hợp thông minh nhất trên thị trường.
Fusion đạt được trí thông minh ở cấp độ Truyện ngụ ngôn với mức giá chỉ bằng một nửa.
Nó hoạt động như thế nào 👇 pic.twitter.com/OTUQAdTQjU
– OpenRouter (@OpenRouter) Ngày 13 tháng 6 năm 2026

Làm thế nào để có được Truyện ngụ ngôn giá rẻ

Khi bạn gửi lời nhắc đến Fusion, OpenRouter sẽ gửi lời nhắc đó đến một bảng mô hình song song. Mỗi người đều có công cụ tìm kiếm trên web và bash.

Sau đó, mô hình đánh giá rút ra những điểm đồng thuận, mâu thuẫn và điểm mù từ mọi phản hồi. Sau khi giai đoạn này kết thúc, một bộ tổng hợp—theo mặc định là Claude Opus 4.8—viết câu trả lời cuối cùng dựa trên phân tích đó.

Toàn bộ sự việc xảy ra phía máy chủ. Bạn có thể hoán đổi chuỗi mô hình của mình thành “openrouter/fusion” cho bảng mặc định, thêm công cụ tổng hợp để mô hình của riêng bạn gọi nó một cách có chọn lọc hoặc xây dựng bảng tùy chỉnh trong phòng trò chuyện Fusion mà không cần mã.

OpenRouter đã thử nghiệm điều này trên DRACOĐiểm chuẩn của Perplexity được xây dựng từ các yêu cầu nghiên cứu sâu của người dùng thực. Fable 5 kết hợp với GPT-5.5 của OpenAI và do Opus tổng hợp đứng đầu bảng ở mức 69%. Solo Fable đạt 65,3%, mặc dù 7 trong số 100 tác vụ của nó không bao giờ chạy vì bộ lọc nội dung của chính nó đã chặn chúng.

Sự kết hợp rẻ hơn là điều mà OpenRouter muốn ghi nhớ: Gemini 3 Flash giá rẻ kết hợp với các mẫu mã nguồn mở của Trung Quốc Kimi K2.6 và DeepSeek V4 Pro, do Opus hợp nhất và tổng hợp, đạt 64,7% — đánh bại hoàn toàn GPT-5.5 (60%) và solo Opus 4,8 (58,8%) và hạ cánh trong một điểm Fable với chi phí gần bằng một nửa.

Ngay cả khi ghép nối Opus 4.8 với một phiên bản riêng biệt cũng đạt được 65,5%, tăng 6,7 điểm so với Opus solo; OpenRouter cho biết khoảng 3/4 mức tăng đó đến từ chính bước tổng hợp, phần còn lại đến từ sự đa dạng của mô hình thực tế.

Một điểm khó khăn: việc cấp cho bảng điều khiển quyền truy cập web trực tiếp cho phép các mô hình hiển thị phiếu đánh giá phân loại của chính DRACO trong kết quả tìm kiếm, một nguy cơ lây nhiễm mà OpenRouter gọi là ngẫu nhiên chứ không phải có chủ ý. Bản sửa lỗi cần một dòng cấu hình để loại trừ các miền lưu trữ của điểm chuẩn khỏi các công cụ tìm kiếm và mọi con số được công bố đều phản ánh quá trình dọn dẹp đó.

Có đáng thử không?

OpenRouter nói trước rằng Fusion không phải là sự thay thế hoàn toàn cho Fable. DRACO bỏ qua công việc dài hạn, nơi Fable được cho là vẫn dẫn đầu và về mã hóa, Fusion hoạt động như một công cụ mà mô hình mã hóa gọi một cách có chọn lọc, chứ không phải một sự hoán đổi bán buôn — một lời cảnh báo lặp lại những gì Giải mã tìm thấy thử nghiệm DeepClaudemột trao đổi phụ trợ rẻ hơn giúp giữ nguyên vòng lặp tác nhân của Claude Code nhưng vẫn theo dõi Opus trong những nhiệm vụ lý luận khó nhất.

Mô hình thông thường vẫn xử lý các công việc hàng ngày. Sự kết hợp dành cho những câu hỏi trong đó một mô hình có thể bỏ lỡ điều gì đó quan trọng và việc có một vài quan điểm kiểm tra chéo lẫn nhau thực sự khiến kim chỉ nam chuyển động.

Đối với nghiên cứu sâu, lập kế hoạch phức tạp hoặc bất cứ điều gì có vấn đề mâu thuẫn, căn phòng dường như có ích.

Các biểu đồ làm cho điểm cơ bản đủ rõ ràng: Đối với loại tác phẩm này, mô hình solo đắt tiền không còn là cách duy nhất để có được sự tổng hợp mạnh mẽ. Một nhóm các mô hình vẫn dễ dàng có được, hợp nhất với nhau, có thể xếp ngay cạnh nó về kết quả trong khi đưa ra một hóa đơn nhỏ hơn nhiều.

Chuỗi khởi chạy được chia thành hai phần một tích cực trong việc theo dõi tình cảm. Nhà nghiên cứu AI Andrew Trask gọi nó là “một thỏa thuận lớn hơn nhiều so với tưởng tượng,” lập luận rằng các phòng thí nghiệm ở biên giới sẽ không bao giờ một mình sở hữu biên giới nữa. người hoài nghi đẩy lùi Tuy nhiên, trên khung, trích dẫn kết quả mã hóa kém, gọi công cụ kém và thiếu minh bạch vì Fable 5 không còn khả dụng để so sánh kết quả.

Fusion chạy hoàn toàn trên các mô hình được định tuyến thông qua cơ sở hạ tầng của OpenRouter, do đó, nó không khắc phục được vấn đề kiểm soát xuất tại nguồn. Giờ đây, bất kỳ ai bị khóa khỏi Fable 5 đều có các tùy chọn: bảng Fusion, trao đổi phụ trợ như DeepClaude hoặc các lựa chọn thay thế có trọng lượng mở như GLM-5.2 điều đó có thể không tốt hơn nhưng đủ tốt cho giá cả.

Bản tin tóm tắt hàng ngày

Bắt đầu mỗi ngày với những tin tức hàng đầu ngay bây giờ, cùng với các tính năng độc đáo, podcast, video và hơn thế nữa.