Tin tức và phân tích của tất cả các thiết bị di động

Sinh viên Ấn Độ xây dựng mô hình AI để dịch ngôn ngữ ký hiệu sang tiếng Anh trong thời gian thực

Trí tuệ nhân tạo (AI) đã được sử dụng để phát triển các loại mô hình dịch thuật khác nhau nhằm cải thiện giao tiếp giữa người dùng và phá vỡ rào cản ngôn ngữ giữa các khu vực. Các công ty như Google và Facebook sử dụng AI để phát triển các mô hình dịch thuật tiên tiến cho dịch vụ của mình. Giờ đây, một sinh viên kỹ thuật năm thứ ba đến từ Ấn Độ đã tạo ra một mô hình AI có thể phát hiện Ngôn ngữ ký hiệu của Mỹ (ASL) và dịch chúng sang tiếng Anh trong thời gian thực.

Sinh viên Ấn Độ phát triển máy dò ASL dựa trên AI

Priyanjali Gupta, một sinh viên tại Viện Công nghệ Vellore (VIT), đã chia sẻ một video trên hồ sơ LinkedIn của cô ấy, giới thiệu bản demo của Máy dò ASL dựa trên AI đang hoạt động. Mặc dù mô hình AI có thể phát hiện và dịch ngôn ngữ ký hiệu sang tiếng Anh theo thời gian thực nhưng hiện tại nó chỉ hỗ trợ một số từ và cụm từ. Bao gồm các Xin chào, Xin vui lòng, Cảm ơn, Tôi yêu bạn, Vâng, KHÔNG.

Gupta đã tạo ra mô hình bằng cách tận dụng API phát hiện đối tượng Tensorflow và sử dụng phương pháp học chuyển giao thông qua mô hình được đào tạo trước có tên là ssd_mobilenet. Điều đó có nghĩa là cô ấy có thể sử dụng lại các mã hiện có để phù hợp với mô hình Máy dò ASL của mình. Hơn nữa, điều đáng nói là mô hình AI không thực sự dịch ASL sang tiếng Anh. Thay vào đó, nó xác định một đối tượng, trong trường hợp này là các dấu hiệu, sau đó xác định mức độ giống nhau của nó dựa trên các đối tượng được lập trình sẵn trong cơ sở dữ liệu của nó.

Trong một cuộc phỏng vấn với Kỹ thuật thú vịGupta lưu ý rằng cô ấy Nguồn cảm hứng lớn nhất để tạo ra một mô hình AI như vậy chính là mẹ cô cằn nhằn cô ấy “làm gì đó” sau khi tham gia khóa học kỹ thuật của cô tại VIT. “Cô ấy chế nhạo tôi. Nhưng nó khiến tôi phải suy ngẫm xem mình có thể làm gì với kiến ​​thức và kỹ năng của mình. Một ngày đẹp trời, giữa cuộc trò chuyện với Alexa, ý tưởng về công nghệ toàn diện đã đến với tôi. Điều đó đã kích hoạt một loạt các kế hoạch,” cô ấy nói với ấn phẩm.

Gupta cũng ghi nhận video của YouTuber và nhà khoa học dữ liệu Nicholas Renotte từ năm 2020, trong đó trình bày chi tiết về quá trình phát triển Máy dò ASL dựa trên AI, trong tuyên bố của cô.

Mặc dù bài đăng của Gupta trên LinkedIn đã nhận được nhiều phản hồi tích cực và đánh giá cao từ cộng đồng, nhưng một kỹ sư tầm nhìn AI đã chỉ ra rằng phương pháp học chuyển giao được sử dụng trong mô hình của cô ấy là “được đào tạo bởi các chuyên gia khác” và nó là “điều dễ dàng nhất để làm trong AI.” Gupta thừa nhận tuyên bố và viết rằng tòa nhà “Một mô hình học sâu chỉ để phát hiện dấu hiệu là một vấn đề thực sự khó khăn nhưng không phải là không thể.”

“Hiện tại tôi chỉ là một sinh viên nghiệp dư nhưng tôi đang học và tôi tin rằng sớm hay muộn cộng đồng nguồn mở của chúng tôi, những người có nhiều kinh nghiệm và học hỏi hơn tôi, sẽ tìm ra giải pháp và có thể chúng tôi sẽ có những mô hình deep learning chỉ dành cho sign. ngôn ngữ,” cô ấy nói thêm.

Bạn có thể xem trang GitHub của Priyanjali để biết thêm về mô hình AI và truy cập các tài nguyên liên quan của dự án. Ngoài ra, hãy cho chúng tôi biết suy nghĩ của bạn về Trình phát hiện ASL của Gupta trong phần bình luận bên dưới.