Cựu nhân sự Google DeepMind huy động 1,1 tỷ USD để xây dựng AI không được huấn luyện bằng dữ liệu con người

Tóm tắt nhanh

Cựu nhà khoa học Google DeepMind David Silver huy động 1,1 tỷ USD cho startup mới Ineffable Intelligence với định giá 5,1 tỷ USD.
Silver cho rằng reinforcement learning (RL), không phải các large language models (LLMs), là con đường tối ưu dẫn đến superintelligence.
Startup hướng tới xây dựng các AI “superlearners” có khả năng học thông qua mô phỏng và self-play.

David Silver — nhà khoa học đứng sau chiến thắng lịch sử của AlphaGo trước kỳ thủ Lee Sedol năm 2016 — đã huy động 1,1 tỷ USD để ra mắt startup mới, đặt cược rằng kỷ nguyên AI tiếp theo sẽ không đến từ công nghệ đang thống trị hiện nay.

Công ty của ông, Ineffable Intelligence, ra mắt vào tháng 1 với định giá 5,1 tỷ USD và tập trung vào reinforcement learning — phương pháp cho phép hệ thống AI cải thiện thông qua thử và sai (trial-and-error). Silver cho rằng cách tiếp cận này, thay vì LLMs, mang lại con đường đáng tin cậy hơn để đạt tới superintelligence.

“Tôi xem sứ mệnh của chúng tôi là thiết lập ‘first contact’ với superintelligence,” Silver chia sẻ với Wired. “Superintelligence ở đây là một thứ gì đó thực sự phi thường — có thể tự khám phá ra các dạng khoa học, công nghệ, chính phủ hoặc kinh tế hoàn toàn mới.”

Khái niệm superintelligence — được phổ biến bởi Nick Bostrom trong cuốn sách Superintelligence — đề cập đến AI vượt trội con người trong hầu hết mọi lĩnh vực, trong khi AGI (Artificial General Intelligence) là hệ thống có khả năng đạt mức suy luận tương đương con người trên nhiều tác vụ.

Silver cho rằng các LLM có hạn chế mang tính nền tảng vì chúng học từ dữ liệu do con người tạo ra, thay vì tự xây dựng hiểu biết thông qua trải nghiệm.

“Dữ liệu con người giống như một loại ‘nhiên liệu hóa thạch’ — mang lại một shortcut tuyệt vời,” ông nói. “Còn các hệ thống tự học giống như năng lượng tái tạo — có thể học mãi, không giới hạn.”

Trong suốt sự nghiệp, Silver đã theo đuổi hướng đi này. AlphaGo — kết hợp dữ liệu con người với reinforcement learning và self-play — đã tạo ra những chiến lược khiến cả các kỳ thủ hàng đầu bất ngờ, chứng minh AI có thể vượt qua tiền lệ của con người trong các domain hẹp.

“Tôi nghĩ rất quan trọng khi có một phòng lab AI tinh hoa tập trung 100% vào hướng này, thay vì chỉ là một nhánh nhỏ trong các tổ chức đang tập trung vào LLMs,” ông nói.

Ineffable Intelligence dự định xây dựng các “superlearners” — những agent AI hoạt động trong môi trường mô phỏng, nơi chúng có thể theo đuổi mục tiêu, thất bại, thích nghi và cải thiện mà không bị giới hạn bởi dataset tĩnh từ con người. Silver không tiết lộ chi tiết về các mô phỏng này, nhưng cho biết cách tiếp cận sẽ cho phép các agent hợp tác và phát triển năng lực một cách tự chủ.

Ông cũng nhấn mạnh rằng LLM bị giới hạn bởi dữ liệu huấn luyện: nếu một mô hình được huấn luyện trong một thế giới mà mọi người tin Trái Đất phẳng, nó có thể tiếp tục giữ niềm tin đó — trừ khi có khả năng tự kiểm chứng thực tế. Ngược lại, hệ thống học qua trải nghiệm có thể tự khám phá ra sự thật.

Ineffable Intelligence chưa phản hồi yêu cầu bình luận từ Decrypt.

Bản tin Daily Debrief
Bắt đầu mỗi ngày với những tin tức nổi bật nhất, cùng các bài viết độc quyền, podcast, video và nhiều nội dung khác.