AI Deepmind mới có thể đánh bại bạn trong bất kỳ trò chơi nào trong số 57 trò chơi Atari 5700

Trí tuệ nhân tạo (AI) là một công nghệ đã chiếm lĩnh mọi ngành công nghiệp từ thời gian gần đây. Từ các nhiệm vụ giám sát đến phân tích các đặc điểm của con người, Tổ chức Ân xá Quốc tế đã đưa ra những lời hứa lớn trong mọi lĩnh vực nơi nó được thực hiện. Giờ đây, AI mới được tiết lộ đã tiết lộ rằng nó có thể đánh bại con người trong tất cả các trò chơi Atari 2600 cổ điển.

Deepmind of Alphabet, công ty nghiên cứu Bảng chữ cái có trụ sở tại London, đã tạo ra Agent57 vượt qua tiêu chuẩn của con người trong tất cả 57 trò chơi Atari 2600. Trước đây, chúng tôi đã thấy công ty tạo ra một AI có thể tạo ra các mô hình 3D của hình ảnh 2D . Lần này, trong một bài báo nghiên cứu gần đây, công ty đã đề cập rằng họ đã tạo ra Agent57 và nó là Tác nhân học tập nâng cao sâu (RL) đầu tiên có khả năng đánh bại bất cứ ai trong Atari 2600 trò chơiTất cả 57 người trong số họ. Do đó tên của đại lý 57.

Trở lại năm 2012, Deepmind đã đề xuất môi trường học tập Arcade, đó là một bộ 57 Atari 2600 (được gọi là Atari57), như một bộ tham chiếu các nhiệm vụ để làm chủ trí tuệ nhân tạo. Theo công ty, bộ trò chơi đa dạng này thách thức trí tuệ nhân tạo theo nhiều cách khác nhau. Vì vậy, kể từ thời điểm này, những trò chơi Atari này đã trở thành một tiêu chuẩn trong cộng đồng Học tập tăng cường (RL).

Bây giờ, Deepmind, để tạo Agent57, kết nối tác nhân thăm dò cũ, "Không bao giờ bỏ cuộc" (NGU) với Bộ điều khiển danh tính. Điều này là để cân bằng thăm dò và khai thác trong chơi. Theo Deepmind, nếu tác nhân biết khi nào nên khám phá trò chơi và khi nào nên sử dụng nó, thì Nó có thể thực hiện trên cấp độ con người trong cả hai trò chơi dễ dàng và đầy thử thách.

Khi tích hợp bảng điều khiển định nghĩa với NGU Explore Agent, Agent57 được sinh ra có thể học một tập hợp các chính sách trong trò chơi và bộ điều khiển meta chọn lựa chọn chính sách. Điều này cho phép đặc vụ đánh bại bất cứ ai trong tất cả 57 trò chơi Atari 2600.

Tuy nhiên, công ty nghiên cứu có trụ sở tại London vẫn tin rằng Agent57 có thể được cải thiện. Vì AI học được nhiều hơn khi không thực hiện được công việc, nên nó có rất nhiều chỗ trong tương lai.