Tóm lại
- OpenAI đang xem xét giảm giá token đáng kể trước những động thái tương tự từ Anthropic.
- Động thái này xuất hiện khi cả hai công ty đều chạy đua hướng tới các đợt IPO đấu tay đôi.
- Các nhà cung cấp suy luận nguồn mở đã phục vụ DeepSeek V4 với mức giá chỉ bằng một phần nhỏ so với mức giá của mô hình đóng, mang lại cho khách hàng doanh nghiệp một lối thoát khả thi trước khi bất kỳ cuộc chiến giá cả nào bắt đầu.
OpenAI đang xem xét giảm giá mà các nhà phát triển và doanh nghiệp phải trả theo Tạp chí Phố Wallđón chờ những đợt cắt giảm tương tự từ Anthropic. Các cuộc thảo luận được mô tả là vẫn đang diễn ra sôi nổi vì cả hai công ty đều đã nộp đơn xin IPO một cách bí mật trong tháng này và cả hai công ty đều không thu được lợi nhuận.
Sam Altman cho biết tại một sự kiện gần đây: “Tôi nghĩ chúng tôi sẽ có nhiều cách để giúp mọi người nhận được nhiều giá trị hơn với mức chi tiêu ít hơn”. Tạp chí Phố Wall. Câu trích dẫn đó xuất hiện trong bối cảnh OpenAI đăng một -122% biên lợi nhuận hoạt động được điều chỉnh trong quý 1 năm 2026—có nghĩa là công ty lỗ 1,22 đô la cho mỗi đô la thu về.
Áp lực là có thật. BẰNG Giải mã báo cáo trước đó, Chia sẻ của ChatGPT lưu lượng truy cập web AI tổng hợp toàn cầu đã giảm từ 77,6% vào tháng 5 năm 2025 xuống 53,7% vào tháng 4 năm 2026. Lần đầu tiên, nhiều công ty được Ramp AI Index theo dõi đang trả tiền cho Anthropic hơn là cho OpenAI. Tỷ lệ hoạt động hàng năm của Anthropic đã tăng từ 9 tỷ USD vào cuối năm 2025 lên 47 tỷ USD vào tháng 5 năm 2026—tăng 422% trong 5 tháng—gần như hoàn toàn do Claude Code thúc đẩy, với quý 2 năm 2026 là quý có lãi đầu tiên từ trước đến nay của công ty.
OpenAI kể từ đó đã tạo ra công cụ mã hóa của riêng mình, Codex, một ưu tiên của công ty. Nhưng nó đang chơi trò đuổi bắt.
Cả hai công ty đang chiến đấu trong một cuộc chiến không quá im lặng để thu hút càng nhiều khách hàng càng tốt giữa cơn sốt công nghệ lớn nhất thế giới kể từ kỷ nguyên dot-com. Các công ty thuộc mọi loại hiện đang chạy đua để sử dụng AI theo cách này hay cách khác. CTO của Uber đã đốt toàn bộ ngân sách AI năm 2026 vào tháng 4, một số nhân viên của JP Morgan chi tiêu nhiều hơn về việc sử dụng AI hơn là tiền lương của chính họ, theo giám đốc dữ liệu của ngân hàng phụ trách bộ phận thanh toán.
Đây là cách làm mà Thung lũng Silicon đã áp dụng để gọi là “tokenmaxxing” —đốt càng nhiều mã thông báo AI—các bit dữ liệu được xử lý bởi các mô hình AI càng tốt, thường không có lợi tức đầu tư rõ ràng. Giám đốc điều hành Palantir Alex Karp so sánh nó trở thành chứng nghiện phim khiêu dâm tại AIPCon tuần trước. Các nhà phân tích của JP Morgan đã công bố một ghi chú trong tháng này với tiêu đề “Hóa đơn AI nằm ngoài tầm kiểm soát.” Các công ty dễ bị ảnh hưởng nhất là những công ty hiện đang dự tính một cuộc chiến giá cả.
Tommy Shaughnessy của Delphi Ventures đã đặt ra cái bẫy cấu trúc theo cách được chia sẻ rộng rãi X đăng bài tuần này: Mức phí cố định 20 USD/tháng luôn được định giá thấp hơn chi phí thực tế khi sử dụng nhiều—một công cụ dẫn đầu về thua lỗ được thiết kế để thúc đẩy việc áp dụng chứ không phải chi trả cho điện toán. Khi một doanh nghiệp thực sự cần AI trên quy mô lớn, nó sẽ chuyển sang API, trả tiền cho mỗi mã thông báo nhưng tiêu tốn nhiều sức mạnh tính toán hơn.
Không phải ai cũng đồng ý với điều này. Một số người tin rằng sự độc quyền của AI ở Tây bán cầu cho phép các công ty tính giá ngày càng cao để xử lý lời nhắc của họ – các mô hình Trung Quốc tính phí rất ít là bằng chứng cho điều này. Nếu đúng như vậy, có thể có khả năng xảy ra những thay đổi mạnh mẽ về giá trong khi vẫn có nền tảng tài chính vững chắc.
Điểm hấp dẫn: Họ không được trợ cấp, tỷ suất lợi nhuận của họ rất điên rồ. Họ hoàn toàn đang cưỡng hiếp khách hàng api. Bất kỳ ai đã sử dụng deepseek hoặc lưu trữ bất kỳ thứ gì và tính toán chi phí phần cứng/điện năng đều biết điều này https://t.co/XQ477Qw3Vv
– Roy (@usr_bin_roygbiv) Ngày 11 tháng 6 năm 2026
Việc triển khai doanh nghiệp thực sự đang chuyển sang định giá API theo đồng hồ đo và các công ty đang đốt tín dụng nhanh hơn nhiều so với mức phí cố định từng được đề xuất. Trong khi đó, các nhà cung cấp suy luận nguồn mở (các công ty cung cấp sức mạnh tính toán để các mô hình AI có thể xử lý thông tin) đang mở rộng quy mô nhanh chóng, với các công cụ tác nhân là chất xúc tác cho sự phát triển của họ. Các nền tảng này phục vụ các mô hình AI hàng đầu của Trung Quốc như DeepSeek, GLM, MiMo, Kimi hoặc Minimax, cạnh tranh với Claude Opus về điểm chuẩn mã hóa, ở mức khoảng một phần mười ba giá của phương án đóng.
“Các mô hình cấp biên giới nguồn mở của các phòng thí nghiệm Trung Quốc,” Shaughnessy đã viết. “Mô hình này là chi phí lớn nhất mà một nhà cung cấp dịch vụ suy luận có và họ nhận được nó miễn phí.” Chừng nào điều đó còn được duy trì, giá sàn thông minh sẽ tiếp tục giảm về 0 — và bất kỳ sự phục hồi lợi nhuận nào tại OpenAI hoặc Anthropic đều trở thành một bài toán không có lời giải rõ ràng.
Shaughnessy lưu ý rằng toàn bộ luận điểm chỉ bị phá vỡ nếu Trung Quốc sử dụng nguồn đóng, điều này sẽ mang lại lợi ích cho các phòng thí nghiệm của Hoa Kỳ.
Cho đến nay, hầu hết các phòng thí nghiệm AI của Trung Quốc đều có vẻ cam kết thực hiện cách tiếp cận ngược lại.
Bản tin tóm tắt hàng ngày
Bắt đầu mỗi ngày với những tin tức hàng đầu ngay bây giờ, cùng với các tính năng độc đáo, podcast, video và hơn thế nữa.

