Lịch sử AI cờ vua: từ Turing, Belle, Deep Blue tới AlphaZero

Tóm lược lịch sử AI cờ vua từ Turing, Shannon, Belle, Deep Blue tới AlphaZero, nhấn mạnh các mốc và khái niệm kỹ thuật cốt lõi.

Nam Do

14 tháng 1, 2026 · 5 phút đọc

♟️ Lịch sử AI cờ vua: từ Turing, Belle, Deep Blue tới AlphaZero

Bài tóm lược theo ngôn ngữ chuyên ngành CNTT và cờ vua, dựa trên bài viết gốc “The history of chess AI” của Patrick Gebhardt (Paessler, cập nhật 23/01/2024). Mục tiêu: giúp học sinh/sinh viên hiểu các mốc phát triển chính và khái niệm kỹ thuật cốt lõi.

Nguồn gốc: https://blog.paessler.com/the-history-of-chess-ai

the history of chess ai

Giới thiệu

AI cờ vua là “bệ thử” kinh điển của trí tuệ nhân tạo. Từ những ý tưởng thời kỳ đầu (Turing, Shannon) đến các máy chuyên dụng (Belle), siêu máy tính (Deep Blue), rồi thế hệ tự học (AlphaZero), hành trình này phản ánh sự tiến hóa của thuật toán, phần cứng, và cách chúng ta biểu diễn tri thức cờ vua trong máy.

➡️ Xem bài gốc (Paessler)

garry-kasparov

mikhail-tal

Dòng thời gian nhanh

1940s–1950s: Alan Turing và Claude Shannon phác thảo nguyên lý chương trình cờ; John von Neumann mô hình hóa cờ vua là trò chơi hai người, tổng bằng 0 và đề xuất Minimax.
1951: Chương trình trên Ferranti Mark 1 (ĐH Manchester) giải các bài toán định sẵn – một mốc “solver” sớm của lịch sử cờ máy.
1965–1967: Mac Hack (Richard Greenblatt) là engine đầu tiên tham gia giải đấu của người và đánh bại một đối thủ con người (Hubert Dreyfus) ở nước 37.
1979–1983: Belle (Ken Thompson) dùng thư viện khai cuộc (opening book) và hash map (bảng băm/chuyển vị) – đạt tới 180k vị trí/giây, vô địch quốc gia (USCF công nhận).
1989–1997: Từ Deep Thought tới Deep Blue (IBM). 1997: Deep Blue thắng Kasparov 3.5–2.5; ván 6 (Caro–Kann B17) nổi tiếng với đòn hiến mã Nxe6!! chỉ 19 nước.
2017→: AlphaZero (DeepMind) học tự chơi (self-play) tabula rasa với MCTS + mạng chính sách–giá trị (policy–value network), không dùng thư viện khai cuộc hay tablebase khi huấn luyện.

Các khái niệm kỹ thuật (IT x Chess)

Minimax và cắt tỉa alpha–beta (alpha–beta pruning): tìm kiếm (search) trên cây nước đi (game tree) để tối ưu hóa nước tốt nhất trước đối thủ tối ưu.
Opening book (thư viện khai cuộc): cơ sở tri thức các biến khai cuộc hay gặp; rút ngắn tìm kiếm giai đoạn đầu.
Hash map/Transposition table (bảng băm/chuyển vị): tránh tính lặp bằng nhớ hóa các thế cờ đã xét.
Evaluation function (hàm đánh giá): kết hợp giá trị vật chất (material) và yếu tố vị trí (structure/king safety/activity…).
Parallel computing (tính toán song song): nhân băng thông tìm kiếm (ví dụ Deep Blue).
MCTS + Policy/Value NN: lấy mẫu có dẫn hướng, ước lượng xác suất nước đi (policy) và giá trị vị trí (value) – nền tảng cho AlphaZero.

Những cột mốc tiêu biểu

1) Turing, Shannon, von Neumann (1940s–1950s)

Đặt nền tảng: biểu diễn luật chơi, gán trọng số quân (ví dụ tốt=1, mã=3, tượng≈3.5, xe=5, hậu=10, vua rất lớn để tránh “tự hiến vua”).
Von Neumann hình thức hóa cờ vua → Minimax cho trò chơi hai người, tổng bằng 0, thông tin đầy đủ.

2) Ferranti Mark 1 (1951)

Chương trình trên Ferranti Mark 1 giải bài toán định sẵn trong ~15 phút – một “solver” đầu tiên, chứng tỏ tính khả thi của tìm kiếm + đánh giá.

3) Mac Hack (1965–1967)

Engine đầu tiên thi đấu với người và hạ gục đối thủ con người. Dù sức cờ còn hạn chế, Mac Hack chứng minh chu trình “search + evaluate + library” có thể chuyển hóa thành Elo thực chiến.

dreyfus vs mac hack, 1967

4) Belle (1979–1983)

Máy cứng hóa cho cờ vua (hard-wired) + opening book + hash map, đạt tới ~180k positions/giây, sâu ~9.5 ply. Belle thống trị sân chơi máy và được USCF phong danh hiệu (mốc công nhận chính thức).

5) Deep Thought → Deep Blue (1989–1997)

1989: Kasparov thắng Deep Thought.
1996: Kasparov thắng Deep Blue (4–2) nhưng engine đã lấy được 1 ván tiêu chuẩn trước VĐTG.
1997: Deep Blue thắng 3.5–2.5. Ván 6 (Caro–Kann, B17) chỉ 19 nước, đòn Nxe6!! phanh vỡ cấu trúc đen – biểu tượng bước ngoặt “máy > người” ở cờ tiêu chuẩn.

deep blue vs kasparov, 1997

6) AlphaZero (2017→)

Bỏ sách khai cuộc và tri thức miền thủ công; học từ luật chơi + tự đấu (self-play) với MCTS dẫn hướng bởi mạng nơ-ron sâu (policy–value). Chỉ sau vài giờ huấn luyện đã đạt siêu nhân và đánh bại Stockfish trong điều kiện thí nghiệm do nhóm nghiên cứu đặt ra.

ben feingold

Vì sao cờ vua quan trọng với AI/CNTT?

Thúc đẩy thuật toán tìm kiếm, tối ưu và biểu diễn tri thức; nhiều ý tưởng lan tỏa sang lập lịch, lập kế hoạch, kiểm thử, an ninh mạng.
Chiến lược kỹ thuật chuyển dịch theo thời đại: từ “brute-force + heuristics” (Belle/Deep Blue) sang “học biểu diễn + tìm kiếm lấy mẫu” (AlphaZero).