Tin tức và phân tích của tất cả các thiết bị di động

Họ tạo ra một robot học cách tự đi

Học đi bộ có thể là một nhiệm vụ khó khăn đối với trẻ em, với nhiều trường hợp trước khi thực hiện một chuyến du lịch liên tục và với số lượng nhỏ, đây là robot mà một nhóm các nhà nghiên cứu của Google đang phát triển, khi máy bán hàng tự học tự đi.

các nhà nghiên cứu của Google Họ đến Deep Learning bằng cách Củng cố để tạo ra một robot bốn chân, tự học cách tự đi. Như với trẻ em khi chúng biết đi, robot này có thể ngã và trồi lên nhiều lần khi nó học cách thông qua Trí tuệ nhân tạo và Tăng cường học máy.

Trong bài viết này, chúng tôi đề xuất một ví dụ hiệu quả về thuật toán RL sâu dựa trên RL entropy tối đa yêu cầu điều chỉnh tối thiểu cho mỗi tác vụ và chỉ một số lượng cố gắng khiêm tốn để tìm hiểu các nguyên tắc mạng thần kinh.

Đây chắc chắn là một tiến bộ quan trọng trong lĩnh vực Deep Learning này, vì các thuật toán được phát triển cho đến nay cho phép robot học đi bộ, nhưng chúng cần sự giúp đỡ của một con người để đứng dậy sau một cú ngã. Với nghiên cứu mới, điều này sẽ không còn cần thiết nữa, vì phía dưới sẽ có thể tự đứng vững, nguồn tin chỉ ra.

Học tăng cường sâu (RL sâu) Học tăng cường sâu để di chuyển một phương pháp chữa trị bằng bốn chân

Công nghệ trí tuệ nhân tạo này sử dụng các nguyên tắc học tập sâu và củng cố để tối ưu hóa các thuật toán hiện có, nghĩa là tạo ra các thuật toán dựa trên AI hiệu quả. Bằng cách này, họ đã tạo ra một sistema phong trào tự trị cho phép bốn chân học cách tự đi.

Để cải thiện thuật toán, bốn chân di chuyển về phía trước, lùi hoặc nghiêng sang một bên. và bắt đầu học để quay trở lại trở lại đi.

Robot đã nghiêng 33 lần, ngã 16 lần và tự đứng vững, theo các nhà phát triển, phần khó nhất của thuật toán xảy ra ngay bây giờ khi chúng phải thay thế sự tham gia của con người, thường giúp robot xuất hiện.

"Tôi nghĩ rằng công việc này là khá thú vị.", Chelsea Finn, trợ lý giáo sư tại Stanford, người cũng liên kết với Google nhưng không tham gia vào nghiên cứu.. Loại bỏ người khỏi quá trình thực sự khó khăn. Bằng cách cho phép robot học tự chủ hơn, robot gần hơn để có thể học trong thế giới thực mà chúng ta đang sống, thay vì trong phòng thí nghiệm. "

Sau khi điều chỉnh, các nhà nghiên cứu cho biết robot chỉ mất hai giờ để học đi trên mặt đất bằng phẳng, nó cũng đã thử trên một tấm nệm và bề mặt bị nứt. Bạn có thể xem kết quả trong video sau.

Phương pháp của chúng tôi có thể có được một công cụ ổn định ngay từ đầu trong thế giới thực trong khoảng hai giờ mà không cần dựa vào bất kỳ mô hình hoặc mô phỏng nào, và chính sách kết quả là mạnh mẽ để thay đổi môi trường.