Z.AI của Trung Quốc phát hành GLM-5.2: Mẫu máy cạnh tranh với Claude Opus—Sử dụng chip Zero Nvidia

Tóm lại

GLM-5.2 chỉ kém Claude Opus 4.8 1% trên FrontierSWE—một tiêu chuẩn đo lường các dự án kỹ thuật tự động kéo dài nhiều giờ—trong khi đánh bại GPT-5.5 trong cùng một bài kiểm tra. Nó được vận chuyển theo giấy phép MIT và không có giới hạn khu vực.
Model này được xây dựng hoàn toàn trên chip Huawei Ascend mà không sử dụng phần cứng NVIDIA.
Unsloth AI đã phát hành lượng tử hóa GGUF 2 bit giúp thu nhỏ mô hình từ 1,51TB xuống 238GB. Bạn vẫn sẽ cần 256GB RAM hoặc VRAM—nhưng tại thời điểm đó, bạn có thể chạy nó.

Z.ai bỏ GLM-5.2 vào ngày 16 tháng 6, hứa hẹn mang lại hiệu suất cao nhất, đánh bại GLM 5.1 vốn đã tiên tiến của nó.

Phòng thí nghiệm có trụ sở tại Bắc Kinh, đã nằm trong Danh sách thực thể của Hoa Kỳ kể từ tháng 1 năm 2025dường như được hưởng lợi từ mối lo ngại ngày càng tăng về cách tiếp cận AI của Mỹ. Trong tuần qua, lệnh cấm Anthropic Fable và việc phát hành mẫu mới này đã giúp cổ phiếu của zAI tăng 90%, đưa nó lên mức cao mới mọi thời đại.

GLM 5.2 có những con số ủng hộ sự cường điệu.

Trên FrontierSWE—một tiêu chuẩn đánh giá liệu tác nhân AI có thể hoàn thành các dự án kỹ thuật mở được tính bằng giờ hay không, bao gồm tối ưu hóa hệ thống, xây dựng mã quy mô lớn và nghiên cứu ML ứng dụng, tính điểm theo tỷ lệ thống trị—GLM-5.2 đạt 74,4 so với 75,1 của Claude Opus 4.8. Nó vượt qua GPT-5.5 ở mức 72,6. Trên SWE-bench Pro, công cụ kiểm tra độ phân giải tự động của các vấn đề GitHub trong thế giới thực được ghi điểm dưới dạng tỷ lệ vượt qua, GLM-5.2 đạt 62,1 điểm so với 58,6 của GPT-5.5—và vượt xa 58,4 của GLM-5.1 tiền nhiệm của nó.

Bước nhảy vọt về chất lượng khiến nó trở thành mô hình nguồn mở tốt nhất cho đến nay trong Chỉ số trí tuệ phân tích nhân tạo, tổng hợp kết quả của 9 điểm khác nhau để đánh giá chất lượng chung của mô hình AI. OpenRouter’s điểm chuẩn xếp nó vào cùng loại với Claude Fable 5 hiện bị cấm.

Phần cứng được sử dụng để đạt được thành tích này là một phần thú vị khác của câu chuyện. GLM-5.2 đã được đào tạo trên chip Huawei Ascend—không có Nvidia trong quy trình sản xuất. Emad Mostaque, người sáng lập Stability AI, ước lượng tổng chi phí đào tạo vào khoảng 25 triệu USD, 80% trong số đó là chi phí đào tạo sau, điều này sẽ khiến nó trở nên cực kỳ rẻ khi so sánh với các công ty cùng ngành.

BẰNG Giải mã được báo cáo vào đầu năm nayZ.ai đã đào tạo các mô hình hình ảnh trên máy chủ Ascend Atlas của Huawei mà không cần đến một con chip Mỹ nào. GLM-5.2 đưa cơ sở hạ tầng đó đi xa hơn—mô hình hỗn hợp chuyên gia gồm 744 tỷ thông số với cửa sổ ngữ cảnh 1 triệu mã thông báo chính hãng, gấp 5 lần giới hạn 200K trên GLM-5.1 và giấy phép MIT có nghĩa là không có chỉ thị nào của chính phủ có thể chuyển đổi công tắc truy cập.

Mã thông báo là các phần của tet mà mô hình có thể đọc và tạo trong khi Tham số là số lượng cài đặt và giá trị nội bộ xác định cách mô hình xử lý thông tin và tạo phản hồi

Nó dành cho ai và chi phí bao nhiêu

Đối với các nhà phát triển, cửa sổ ngữ cảnh chính là sự thay đổi hoạt động. Điều hướng toàn bộ kho lưu trữ, bộ tái cấu trúc nhiều tệp và quy trình tác nhân dài mà trước đây yêu cầu phân đoạn sẽ trở thành quy trình làm việc của một lệnh gọi. Giá API chạy 1,40 USD trên một triệu mã thông báo đầu vào và 4,40 USD trên một triệu đầu ra—so với đầu vào 5 USD và đầu ra 25 USD của Claude Opus 4.8. Kế hoạch mã hóa bắt đầu với mức giá khoảng 18 đô la một tháng và hoạt động trực tiếp bên trong Claude Code, Cline, Kilo Code và hầu hết các môi trường đại lý phổ biến nhất.

Về mặt kỹ thuật cũng có thể triển khai cục bộ. AI giải trí đã đẩy lượng tử hóa GGUF 2 bit để nén mô hình từ 1,51TB xuống 238GB trong khi vẫn giữ được độ chính xác ~82%.

Tuy nhiên, đừng quá phấn khích. Điều đó vẫn có nghĩa là nó cần 256GB bộ nhớ hợp nhất hoặc kết hợp RAM/VRAM phù hợp—M4 Ultra Mac Studio tối đa hoặc máy trạm có GPU tầm trung và 256GB RAM hệ thống với khả năng giảm tải của nhiều chuyên gia. Vẫn còn rất nhiều tiền, nhưng ít nhất cũng có thứ gì đó mà bạn có thể mua và sử dụng trong nhà nếu bạn thực sự muốn.

Chúng tôi đã chạy thử nghiệm nhanh, yêu cầu GLM-5.2 xây dựng trò chơi tiêu chuẩn của chúng tôi kết hợp cơ chế đánh máy với game bắn súng. Giao diện người dùng không phải là đẹp nhất—các mẫu khác tạo ra giao diện bóng bẩy hơn, nhưng trải nghiệm thì đa dạng nhất: các kịch bản khác nhau giữa các đợt, loại kẻ thù thay đổi, trùm xuất hiện sau trong quá trình chạy.

Nó tạo ra nhiều trạng thái trò chơi đa dạng hơn bất kỳ thứ gì khác mà chúng tôi đã thử nghiệm cho cùng một nhiệm vụ trong thiết lập không bắn.

Nếu bạn muốn chơi nó, nó sẽ trực tiếp trong Hồ sơ Itch.io.

Sự khác biệt đó chỉ ra nơi GLM-5.2 có ý nghĩa kinh tế nhất. Đối với quy trình tạo nhiều lần chụp và quy trình tác nhân trong đó tính đa dạng đầu ra quan trọng hơn việc đánh bóng, phép toán ở mức giá nguồn mở thật khó để tranh luận. Đối với các nhiệm vụ được duy trì khó khăn nhất—SWE-Marathon, nơi nó đạt điểm 13,0 so với 26,0 của Opus 4.8—khoảng cách với biên giới đóng vẫn là có thật và rộng 13 điểm.

Trọng lượng nguồn mở đang tồn tại ôm mặt theo giấy phép MIT. Trọng lượng lượng tử hóa cũng có sẵn trên ôm mặt. Người đăng ký Gói mã hóa GLM hiện có thể chuyển đổi bằng chuỗi mẫu GLM-5.2 và nó cũng có sẵn để thử nghiệm miễn phí trên z.AI với một số hạn chế sử dụng.

Bản tin tóm tắt hàng ngày

Bắt đầu mỗi ngày với những tin tức hàng đầu ngay bây giờ, cùng với các tính năng độc đáo, podcast, video và hơn thế nữa.