Tin tức và phân tích của tất cả các thiết bị di động

Mô hình NDF của các nhà nghiên cứu MIT nhằm mục đích dạy cho robot những kỹ năng mới

Các nhà nghiên cứu của MIT tuyên bố họ đã phát triển một phương pháp mới để dạy cho robot những kỹ năng mới, có thể giúp chúng thực hiện các mục tiêu lao động thủ công hiệu quả hơn.

Robot kho hàng lấy cốc ra khỏi kệ và đặt chúng vào hộp để vận chuyển khi đơn hàng thương mại điện tử đổ về. Mọi thứ diễn ra suôn sẻ cho đến khi nhà kho xử lý một thay đổi, yêu cầu robot phải nắm những chiếc cốc cao hơn, hẹp hơn được cất lộn ngược.

Mô hình NDF giúp dạy robot những kỹ năng mới

Việc dạy robot những kỹ năng mới không chỉ tốn thời gian và công sức mà việc thực hiện nhiệm vụ cũng có thể nguy hiểm. Những chiếc cốc mới phải được con người dán nhãn bằng tay để dạy robot cách cầm chúng một cách chính xác, sau đó quy trình phải được lặp lại.

Tuy nhiên, một cái mới thuật toán do các nhà nghiên cứu MIT tạo ra có thể được hoàn thành trong ít nhất 10 đến 15 phút chỉ với một số ít sự minh họa của con người. Phương pháp học máy này cho phép robot nhặt và đặt các vật thể ở những tư thế độc đáo mà nó chưa từng thấy trước đây. Trong vòng mười đến mười lăm phút, robot sẽ sẵn sàng thực hiện nhiệm vụ gắp và đặt hoàn toàn mới.

Một mạng lưới thần kinh, được tạo ra đặc biệt để xây dựng lại các hình dạng ba chiều, được sử dụng trong phương pháp này để dạy cho robot những kỹ năng mới. Kỹ thuật này sử dụng mạng lưới thần kinh đã được phát triển cẩn thận để hiểu được các dạng 3D. Hệ thống sử dụng những gì mạng lưới thần kinh đã học được về hình học 3D để xử lý những thứ mới có thể so sánh được với những gì được thấy trong các ví dụ chỉ sau một vài lần trình diễn.

Các nhà nghiên cứu đã chứng minh rằng phát minh của họ có thể cầm nắm nhanh chóng và thành công những chiếc cốc, bát và chai chưa từng thấy ở các tư thế ngẫu nhiên chỉ bằng 10 lần biểu diễn để dạy cho robot những kỹ năng mới.

Các nhà nghiên cứu đã chứng minh rằng phát minh của họ có thể dạy cho robot những kỹ năng mới.

“Đóng góp chính của chúng tôi là khả năng chung trong việc cung cấp các kỹ năng mới hiệu quả hơn nhiều cho các robot cần hoạt động trong môi trường phi cấu trúc hơn, nơi có thể có nhiều biến đổi. Khái niệm khái quát hóa bằng cách xây dựng là một khả năng hấp dẫn vì vấn đề này thường khó hơn rất nhiều,” Anthony Simeonov, một sinh viên tốt nghiệp ngành kỹ thuật điện và khoa học máy tính (EECS), giải thích. Ông cũng là đồng tác giả chính của bài báo.

Simeonov đã viết bài báo với đồng tác giả Yilun Du, một sinh viên tốt nghiệp EECS; Andrea Tagliasacchi, nhà khoa học nghiên cứu nhân viên tại Google Brain; Joshua B. Tenenbaum, Giáo sư Phát triển Nghề nghiệp Paul E. Newton về Khoa học Nhận thức và Tính toán tại Khoa Khoa học Nhận thức và Não bộ, đồng thời là thành viên của Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL); Alberto Rodriguez, Phó Giáo sư Khóa 1957, Khoa Cơ khí; và các tác giả cấp cao Pulkit Agrawal, giáo sư tại CSAIL, và Vincent Sitzmann, trợ lý giáo sư sắp tới tại EECS. Việc trình bày những phát hiện này sẽ diễn ra tại Hội nghị quốc tế về Robot và Tự động hóa.

Học máy được tăng cường với mô hình mạng lưới thần kinh

Một chương trình học máy có thể được đào tạo để nhặt một vật thể cụ thể, nhưng nếu vật đó được đặt nghiêng, robot sẽ hiểu đây là một tình huống riêng biệt. Đó là một trong những lý do khiến hệ thống máy học gặp khó khăn trong việc khái quát hóa các hướng đối tượng mới.

Để giải quyết vấn đề này, các nhà nghiên cứu đã phát triển một loại mô hình mạng thần kinh mới, Trường mô tả thần kinh (NDF), học dạng 3D của một loại đối tượng. Mô hình phân tích biểu diễn hình học cho một mục nhất định bằng cách tính toán đám mây điểm 3D, là tập hợp các điểm dữ liệu hoặc tọa độ bộ ba trong ba chiều.

Các điểm dữ liệu có thể được thu thập từ camera độ sâu để đo khoảng cách giữa một vật thể và một điểm quan sát. Mạng đã được đào tạo trên một tập dữ liệu khổng lồ về các đối tượng 3D được mô phỏng trong mô phỏng, nhưng giờ đây nó có thể được áp dụng cho các vật phẩm trong thế giới thực. Cải tiến này giúp có thể dạy cho robot những kỹ năng mới.

Tính chất tương đương của NDF đã được nhóm sử dụng. Khi hiển thị ảnh chụp một chiếc cốc thẳng đứng và sau đó là ảnh của chiếc cốc đó ở mặt bên của nó, người mẫu hiểu rằng chiếc cốc thứ hai là vật giống hệt nhau, chỉ được xoay.

Các nhà nghiên cứu sử dụng mô hình NDF đã được đào tạo này để dạy cho robot những kỹ năng mới chỉ bằng một số trường hợp vật lý.

Simeonov giải thích: “Sự tương đương này là thứ cho phép chúng tôi xử lý hiệu quả hơn nhiều trong trường hợp vật thể bạn quan sát theo một hướng tùy ý nào đó”.

NDF học cách liên kết các thành phần liên quan của các đối tượng tương tự vì nó cải thiện khả năng tạo lại hình dạng. Nó phát hiện ra rằng tay cầm của các cốc có thể so sánh được, bất kể một số cốc cao hơn hay ngắn hơn những cốc khác hoặc có tay cầm nhỏ hơn hay dài hơn.

“Nếu bạn muốn thực hiện việc này bằng một phương pháp khác, bạn phải dán nhãn thủ công cho tất cả các bộ phận. Thay vào đó, phương pháp tiếp cận của chúng tôi tự động phát hiện những phần này từ quá trình tái tạo hình dạng”, Du nói.

Các nhà nghiên cứu sử dụng mô hình NDF đã được đào tạo này để dạy cho robot những kỹ năng mới chỉ bằng một số trường hợp vật lý. Ví dụ, họ đặt bàn tay của robot lên thành bát hoặc cốc và ghi lại vị trí của các đầu ngón tay.

Bởi vì NDF đã học được rất nhiều về hình học 3D và cách tái tạo các hình dạng, nên nó có thể suy ra cấu trúc của một hình dạng mới, cho phép hệ thống chuyển các bản trình diễn sang các vật thể mới ở các tư thế tùy ý,” Du nói.

Mô hình NDF thành công như thế nào?

Để kiểm tra giả thuyết của mình, các nhà nghiên cứu đã phát triển một bằng chứng khái niệm chứng minh rằng phương pháp của họ có hiệu quả đối với các ứng dụng trong thế giới thực. Họ đã thử nghiệm mô hình của mình trong các mô phỏng và trên một cánh tay robot sống sử dụng cốc, bát và chai làm đồ vật. Đối với các hoạt động chọn và đặt với các đồ vật mới theo hướng mới, đường cơ sở tốt nhất chỉ có thể đạt được tỷ lệ thành công là 45%. Nắm bắt được một món đồ mới và đặt nó vào vị trí đã định, chẳng hạn như treo cốc trên giá, được coi là một thành công.

Nhiều kỹ thuật trong số này yêu cầu dữ liệu hình học 3D, trong khi thông tin hình ảnh 2D được sử dụng trong hầu hết các đường cơ sở. Điều này làm cho các phương pháp này khó kết hợp phương sai tương đương hơn. Một lý do khiến phương pháp NDF thành công đến vậy là vì nó dựa trên một nguyên tắc khác, khía cạnh này giúp họ có thể dạy cho robot những kỹ năng mới.

Các nhà nghiên cứu đã phát triển một bằng chứng về khái niệm để chứng minh rằng họ có thể dạy cho robot những kỹ năng mới.

Mặc dù các nhà nghiên cứu hài lòng với kết quả của nó, nhưng phương pháp của họ chỉ hiệu quả đối với loại đối tượng mà nó đã được đào tạo. Một robot được dạy cách nhặt cốc sẽ không thể lấy hộp tai nghe vì chúng có các đặc điểm hình học quá khác so với dữ liệu đào tạo của mạng.

Simeonov giải thích: “Trong tương lai, việc mở rộng quy mô lên nhiều danh mục hoặc loại bỏ hoàn toàn khái niệm về danh mục sẽ là điều lý tưởng”.

Họ muốn áp dụng công nghệ này cho các vật thể không cứng và về lâu dài làm cho nó có khả năng nhặt và đặt vật phẩm khi vùng mục tiêu thay đổi. Bằng cách này, họ sẽ có thể dạy cho robot những kỹ năng mới.

Nghiên cứu này được tài trợ một phần bởi Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến, Cơ quan Khoa học và Công nghệ Quốc phòng Singapore và Quỹ Khoa học Quốc gia.

Mục lục