Tin tức và phân tích của tất cả các thiết bị di động

Máy ảnh đeo được này nhận dạng lệnh thoại ngay cả khi bạn không nói to

Trong khi các trợ lý giọng nói như Siri, Alexa hoặc Google Assistant có thể hữu ích cho nhiều chức năng dựa trên giọng nói khác nhau, đôi khi bạn cần thực hiện một số nhiệm vụ mà không làm phiền người khác trong thư viện hoặc khu vực yên tĩnh trong văn phòng. Vì vậy, để giúp người dùng âm thầm gửi lệnh thoại đến các thiết bị thông minh, hai nhà nghiên cứu của Đại học Cornell đã phát triển một máy ảnh đeo được có thể đeo để nhận dạng giọng nói im lặng. Chúng ta hãy nhìn vào các chi tiết.

Các nhà nghiên cứu phát triển máy ảnh đeo được nhận dạng giọng nói im lặng

Cheng Zhang, trợ lý giáo sư khoa học thông tin tại Đại học Khoa học máy tính và thông tin Ann S. Bowers của Đại học Cornell, và Ruidong Zhang, nghiên cứu sinh tiến sĩ tại cùng trường đại học đã phát triển camera nhận dạng giọng nói im lặng đặc biệt.

“Hãy tưởng tượng khi tay bạn đang bận hoặc đơn giản là bạn không muốn tiếp cận các thiết bị thông minh của mình để tương tác với chúng, bạn có thể muốn sử dụng tính năng điều khiển bằng giọng nói. Tuy nhiên, nếu bạn đang ở nơi ồn ào hoặc trong một cuộc họp, tính năng điều khiển bằng giọng nói sẽ không hiệu quả hoặc không phù hợp về mặt xã hội. Đây là nơi mà lời nói im lặng xuất hiện,” Cheng Zhang, một trong những nhà nghiên cứu của dự án giải thích.

Nó được mệnh danh là “SpeeChin” vì nó sử dụng camera IR (hồng ngoại) để ghi lại chuyển động của cằm và cổ của người dùng nhằm nhận dạng nhiều lệnh thoại, ngay cả khi họ thì thầm hoặc chỉ ra lệnh bằng miệng. Thiết bị được treo dưới dạng vòng cổ, ngay dưới cổ người dùng với camera hồng ngoại hướng lên trên, hướng về phía cằm.

Theo các nhà nghiên cứu, camera ghi lại chuyển động của cằm và cổ của người dùng để nhận ra những gì họ đang cố gắng nói. Do đó, bạn có thể thì thầm hoặc đơn giản là cử động môi như thể bạn đang nói một từ hoặc một cụm từ nhất định để thiết bị nhận ra chính xác mệnh lệnh mà bạn đang cố truyền đạt. Bạn có thể xem video bên dưới để biết cách hoạt động của SpeeChin.

Các nhà nghiên cứu nói rằng camera nhận dạng giọng nói im lặng có thể nhận dạng 54 cụm từ tiếng Anh và khẩu lệnh chung cũng như 44 từ và cụm từ trong tiếng Quan Thoại. Họ đã thử nghiệm SpeeChin với 20 người tham gia và thiết bị có thể mang lại kết quả 90.5% tỷ lệ chính xác khi nhận dạng lệnh tiếng Anh và 91.6% tỷ lệ chính xác khi nhận biết lệnh tiếng Trung. Tuy nhiên, tỷ lệ chính xác giảm khi người tham gia di chuyển trong khi ra lệnh im lặng cho máy ảnh.

Về sự sẵn có của một thiết bị như vậy, các nhà nghiên cứu rõ ràng cần phải nghiên cứu về độ tin cậy của SpeeChin trong tương lai. Do đó, có thể phải mất một thời gian nữa để một chiếc máy ảnh đeo trên người có khả năng nhận dạng giọng nói im lặng như SpeeChin có mặt trên thị trường. Vậy bạn nghĩ gì về SpeeChin? Bạn có nghĩ rằng nó sẽ là một thiết bị thành công trên thị trường? Cho chúng tôi biết suy nghĩ của bạn trong các ý kiến ​​dưới đây.