Điểm yếu lớn nhất của AlphaGo lại chính là tật xấu cố hữu chỉ có ở con người
Máy móc không phải bất khả chiến bại. AlphaGo đã mắc phải một sai lầm lẽ ra không đáng có ở nó: Quá tự tin.
Kỳ thủ Hàn Quốc Lee Sedol đã giành một chiến thắng đầu tiên trước hệ thống máy tính trí tuệ nhân tạo AlphaGo của Google, sau khi thua liên tiếp ba ván đấu trước đó. Mặc dù, sau khi thắng ba ván đầu tiên của trận đấu năm ván, AlphaGo đã giành chiến thắng chung cuộc, nhưng hai ván đấu còn lại vẫn diễn ra dù chỉ mang tính thủ tục. Dù sao, Lee Sedol đã lấy lại một chút sự tự hào cho bản thân và cho hàng triệu người đang theo dõi trực tuyến trận đấu này.
Các phóng viên và các nhà nhiếp ảnh đã vỗ tay reo hò khi AlphaGo tuyên bố thua cuộc sau ván đấu kéo dài 5 giờ. Và họ còn reo hò ầm ĩ hơn khi bước vào phòng họp báo sau trận đấu.
Sự thống trị của AlphaGo trong suốt 3 ván đấu trước cho thấy sức mạnh vượt trội của những công nghệ hiện đại bên trong nó – những công nghệ có thể dùng để sáng tạo lại mọi thứ từ nghiên cứu khoa học đến robot. Trong khi đó, chiến thắng lần này của Lee Sedol cho thấy, máy móc không có nghĩa là không thể mắc sai lầm.
Hơn nữa, chiến thắng của Lee Sedol ở ván thứ Tư cho thấy ngay cả một cỗ máy AI tài giỏi nhất cũng còn một chặng đường dài trước khi có thể thực sự lặp lại suy nghĩ của con người. Một cỗ máy có thể đánh bại kỳ thủ hàng đầu về cờ vây, nhưng không có nghĩa là nó sẽ vượt qua bài kiểm tra khoa học ở lớp 8, trò chuyện như con người hay biểu lộ các cảm xúc thường thấy.
Nhà vô địch cờ vây thế giới Lee Sedol.
Đâu là điểm yếu của AlphaGo?
Như nhà bình luận Chris Garlock nói trước khi ván đấu bắt đầu, một câu hỏi lớn: Liệu AlphaGo có điểm yếu nào không?
Đó là câu hỏi đặt ra trong phòng họp báo sau ván đấu thứ ba, khi Lee Sedol xin lỗi công chúng Hàn Quốc và công đồng chơi cờ vây. "Tôi không biết phải nói gì hôm nay, nhưng tôi nghĩ tôi phải nói lời xin lỗi của mình trước". Anh nói. "Tôi nên có một kết quả tốt hơn, một trận đấu tốt hơn so với các ván đấu trước". Kỳ thủ người Hàn Quốc thừa nhận đã phải chịu tác động của áp lực từ công chúng. Trận đấu đang là tâm điểm chú ý ở Hàn Quốc, nơi có khoảng 8 triệu người chơi cờ vây. Nhưng giờ khi áp lực chiến thắng đã không còn, anh tuyên bố sẽ tiếp tục tìm kiếm điểm yếu của cỗ máy.
"Cho dù AlphaGo là một chương trình rất mạnh, tôi không nói đó là một chương trình hoàn hảo". Anh nói. "Vâng, so với con người, nước đi của nó rất khác biệt và có những lúc vượt trội. Nhưng tôi nghĩ AlphaGo vẫn có điểm yếu nào đó".
Anh tỏ ra không vui với ván đấu thứ hai, khi anh cảm thấy mình đã mắc sai lầm nghiêm trọng và không tận dụng những lỗi của AlphaGo. "Có một số cơ hội mà tôi đã bỏ lỡ", anh nói.
Chơi lại ván thứ hai
Ván đấu thứ Tư khởi đầu rất giống với ván thứ Hai, khi Lee Sedol cố gắng để đền bù những sai lầm trong quá khứ. Như ván đấu thứ hai, anh lại chơi quân trắng, nghĩa là đi sau đối phương. Và anh đáp trả lại bước khai cuộc của AlphaGo tương tự ván thứ Hai. "Nó như cùng một ván đấu vậy". Nhà bình luận Michael Redmond nói sau sáu bước đi của ván đấu.
Nhà bình luận Chris Garlock đặt ra câu hỏi phải chăng Lee Sedol muốn chơi các nước đi bất thường nhất có thể để tìm ra điểm yếu của AlphaGo. Nhưng như Redmond chỉ ra, điều đó không thực sự có tác dụng trong ván đấu thứ Nhất. Từ cơ chế hoạt động của AlphaGo, dường như không chắc các nước đi bất thường, hay thậm chí kỳ lạ có thể mang lại hiệu quả với cỗ máy này.
Ván đấu thứ Tư khởi đầu rất giống với ván thứ Hai, khi Lee Sedol cố gắng để đền bù những sai lầm trong quá khứ.
Bằng cách sử dụng công nghệ mạng lưới thần kinh – mô phỏng mạng nơ ron thần kinh của não người – AlphaGo tự học chơi cờ vây bằng cách phân tích hàng ngàn hàng vạn nước đi của người chơi trước. Sau đó, kết hợp với công nghệ học tăng cường, nó tự chơi cờ với chính bản thân mình để đẩy trình độ của mình lên các đẳng cấp cao hơn. Về bản chất, các lần tự chơi này giúp tạo ra các nước đi mới mà máy tính có thể sử dụng để đào tạo lại chính bản thân. Vì vậy, đây không phải là nước đi của con người.
Nói cách khác, hệ thống AlphaGo không vận hành để chơi theo cách thông thường, nó chơi theo cách con người sẽ không bao giờ làm.
Bên ngoài trận đấu
Khi trận đấu diễn ra, Lee Sedol mất thời gian cho mỗi nước đi hơn rất nhiều so với đối thủ của mình. Điều tương tự cũng đã xảy ra trong ván thứ Hai và thứ Ba, vì vậy, khi đồng hồ của anh hết thời gian, kỳ thủ Hàn Quốc buộc phải tăng tốc độ đặt quân lên.
Trong khi đó, ngược lại, AlphaGo quản lý thời gian khá tốt, và nó hầu như không mắc sai lầm nào. Trước trận đấu, Demis Hassabis, người giám sát đội chế tạo AlphaGo cho biết, một mạng lưới thần kinh đã được bổ sung cho AlphaGo để kiểm soát thời gian.
Một vài nhà bình luận đã đưa ra "chiến lược" của mình: "Tôi chỉ cần rút dây cắm". Redmond nói về AlphaGo. "Nó phụ thuộc vào kết nối Internet, đúng không? Tất cả những gì chúng ta cần là một ai đó với cái kéo". Quả thực, AlphaGo phụ thuộc vào kết nối Internet, để liên kết với một mạng lưới rộng lớn các máy móc trong trung tâm dữ liệu của Google trên toàn cầu. Nhưng một chiếc kéo không đủ để cắt sợi dây đó. Trước trận đấu, Google đã chạy một đường cáp quang riêng trong khách sạn Four Seasons để đảm bảo chất lượng kết nối.
AlphaGo quản lý thời gian khá tốt, và nó hầu như không mắc sai lầm nào.
Khi lần đầu xây dựng AlphaGo, Hassabis và nhóm của mình đào tạo và chạy hệ thống trên một máy tính đơn. Nhưng đến tháng Mười, trước khi đấu với người ba lần vô địch cờ vây châu Âu, Fan Hui, nhóm nghiên cứu đã được nâng cấp hệ thống với sức mạnh xử lý cao hơn. Các mạng lưới thần kinh điển hình chạy trên một lượng lớn các máy tính kết nối với nhau, mỗi chiếc được trang bị các chip xử lý đồ họa GPU, phục vụ cho thuật toán máy học. Vào tháng Mười, Hassabis cho biết AlphaGo chạy trên một mạng lưới với 170 thẻ GPU và 1.200 bộ xử lý tiêu chuẩn.
Một trận chiến nguy hiểm
Khi đồng hồ điểm 2 tiếng, Redmond đã gọi trận đấu này là một ván đấu điển hình của Lee Sedol, khi thấy nó đang phát triển "thành một trận chiến rất nguy hiểm". Lee Sedol thích đi trên lưỡi dao và anh rất giỏi với việc đó. Nhưng như Redmond chỉ ra, đó là AlphaGo.
Lúc này Lee Sedol dường như có vị trí tốt hơn trong ván thứ Ba. Anh cũng tỏ ra bình tĩnh hơn. Nhưng sau khoảng 25 phút chơi tiếp, Redmond, cũng là một người giỏi về cờ vây, cảm thấy AlphaGo đã rơi vào tình thế gay go. Và thời gian của Lee Sedol chỉ còn 25 phút nữa trên đồng hồ, ít hơn gần một giờ so với AlphaGo. Sự khác biệt này rất quan trọng, vì khi đồng hồ của mình hết thời gian, người chơi phải thực hiện nước đi trong chưa đến 60 giây.
Tại thời điểm này, AlphaGo bắt đầu chơi theo cách mà Redmond và Garlock thấy không ấn tượng lắm hay các nước đi "chùng xuống". Dấu hiệu này cho thấy cỗ máy đang quá tự tin về thắng lợi của mình. Vì AlphaGo được lập trình để tối đa hóa khả năng chiến thắng, không phải điểm số của chiến thắng. "Điều này như AlphaGo đang nói: Tôi nghĩ tôi đang dẫn trước. Tôi sắp kết thúc trận đấu này". Garlock nói. "Và Lee Sedol cần làm gì đó đặc biệt, ngay cả khi nó không hiệu quả". Trong khi đó, Lee Sedol hơi cúi mặt về phía trước, tập trung suy nghĩ, mất vài phút cho bước đi tiếp theo của mình.
Nước đi số 78 của Lee Sedol và 79 của AlphaGo: bước ngoặt của ván đấu.
Và sau đó vài phút, một nước đi lớn xuất hiện. Đó là nước đi thứ 78, khi Lee Sedol đặt một quân của mình – một mũi nhọn – vào giữa bàn cờ. "Đó là nước đi làm ván đấu phức tạp nhất". Andrew Jackson, nhà bình luận trực tuyến cho Hiệp hội cờ vây Mỹ, cho biết. Và sự phức tạp này đã làm thay đổi lối chơi của cỗ máy. Demis Hassabis sau đó đăng lên Twitter cho rằng AlphaGo đã mắc một sai lầm nghiêm trọng ở nước đi thứ 79, ngay sau nước đi lớn của Lee Sedol. Và khoảng 10 nước đi sau đó, những tính toán của AlphaGo chỉ ra rằng cơ hội chiến thắng của nó đã mất.
Đầu hàng?
Sau đó, gần lúc đồng hồ điểm ba giờ chơi đã hết, đồng hồ của Lee Sedol đã hết thời gian. Nhưng lối chơi của AlphaGo tiếp tục làm bối rối các nhà bình luận. "Tôi có ấn tượng rằng AlphaGo đã mất tuyến đường của mình". Redmond nói. Một lần nữa, điều này cho thấy AlphaGo đang gặp khó khắn, nhưng nó nhắc Garlock đặt câu hỏi liệu cỗ máy có bao giờ đầu hàng.
Theo David Silver, một nhà nghiên cứu khác trong nhóm tạo ra AlphaGo, cỗ máy sẽ đầu hàng, không phải khi khả năng chiến thắng của nó bằng không, mà khi khả năng chiến thắng xuống dưới 20%. "Chúng tôi cảm thấy đây là sự tôn trọng nhiều hơn so với cách mà con người chơi trò này". Silver nói. "Thật thiếu tôn trọng khi tiếp tục chơi ở vị thế rõ ràng là đã rất gần với thất bại".
Tại thời điểm này, cỗ máy vẫn chưa quyết định cơ hội của nó đã giảm xuống dưới ngưỡng đó. Nhưng theo các nhà bình luận, vị thế của nó đã bắt đầu xấu đi. "Tôi có cảm giác rằng AlphaGo đang hết nước đi chiến thắng". Redmond nói, bổ sung thêm trong quá khứ, AlphaGo thường đi những nước đi nghèo nàn khi nó thấy mình đang dẫn trước.
Cuối cùng, cả Redmond và Garlock đều đồng ý rằng thế trận đang diễn ra khá tốt với Lee Sedol. Nhưng kỳ thủ Hàn Quốc tiếp tục gặp khó về thời gian. Anh đã hai lần mắc lỗi khi thực hiện nước đi nhiều hơn 60 giây. Sau đó anh đi thực hiện nước đi chỉ trong vài phần nghìn giây trước khi đồng hồ hết thời gian. Nếu mắc lỗi tiếp, anh sẽ chỉ còn 30 giây để thực hiện nước đi.
Khi ván đấu đã được 3 giờ 40 phút, Lee Sedol đứng dậy rời khỏi phòng để tạm nghỉ. Kịch tính của ván đấu được đẩy lên mức cao nhất kể từ ván thứ nhất. "Lee Sedol đang có cơ hội", Redmond nói.
Khoảnh khắc AlphaGo đầu hàng, tiếng reo hò vang lên từ phòng bình luận tiếng Hàn Quốc và đám đông phóng viên.
Kết thúc trận đấu
Nhưng kỳ thủ Hàn Quốc vẫn phải đối mặt với rắc rối về thời gian. Và AlphaGo vẫn chưa đầu hàng. Cỗ máy vẫn còn 15 phút nữa trên đồng hồ chơi. Sau đó, AlphaGo đi một nước mà Redmond gọi là "một nước đi vô nghĩa khác". Rất nhanh sau đó, cỗ máy đầu hàng.
Sau trận đấu, Redmond và những người khác chỉ ra bước ngoặt của ván đấu là nước đi số 78 của Lee Sedol. Ở giữa ván đấu, Lee Sedol vẫn đang ở phía sau. Nhưng anh đã củng cố nước đi đó thành trung tâm của bàn cờ và chuyển hướng trận đấu. "Lee Sedol đã đi một nước tuyệt vời. Nó đã làm tôi ngạc nhiên. Tôi chắc rằng nó sẽ làm hầu hết các đối thủ sẽ bất ngờ. Tôi nghĩ nó đã làm AlphaGo bất ngờ", Redmond nói.
Khoảnh khắc AlphaGo đầu hàng, tiếng reo hò vang lên từ phòng bình luận tiếng Hàn Quốc và đám đông phóng viên. Sau đó đến tiếng vỗ tay từ phòng bình luận bằng tiếng Anh. Trái ngược hẳn với không khí của một ngày trước tại đây. Vào thứ bẩy, Lee Sedol đã tìm ra một điểm yếu của AlphaGo. Và giờ cảm xúc đã thay đổi, con người cuối cùng đã có thể thắng.