Tin tức và phân tích của tất cả các thiết bị di động

Mozilla công bố cơ sở dữ liệu âm thanh lớn nhất

Common Voice, được Mozilla đầu tư để biến nó thành cơ sở dữ liệu giọng nói lớn nhất thế giới, hiện đã được cung cấp công khai cho mọi người sử dụng.

Common Voice, được Mozilla lưu giữ 1361 giờ bản ghi âm bằng 18 ngôn ngữ khác nhau với hơn 42 nghìn người ủng hộ và đặt mục tiêu trở thành cơ sở dữ liệu giọng nói lớn nhất thế giới, chứa dữ liệu giọng nói và văn bản chất lượng cao.

Hệ thống, nơi có hơn 42 nghìn người tải lên giọng nói của chính họ và của người khác, bắt đầu tăng chất lượng khi nó tiếp tục phát triển. kể từ tháng 6 năm 2018 8 Tăng trưởng nhiều hơn dự kiến ​​​​của Mozilla mỗi tháng, Common Voice chứng minh rằng không chỉ một số ngôn ngữ mà cả những ngôn ngữ mà tương đối ít người biết cũng có thể góp phần mang lại doanh thu trực tuyến cao.

Mozilla cho biết mục tiêu của họ là đóng góp vào hệ sinh thái công nghệ âm thanh đa dạng và sáng tạo hơn. Hệ thống này, sẽ giúp ích cho cả chính họ và những ‘người chơi’ nhỏ hơn, cũng tiết lộ rằng các tính năng Chuyển giọng nói thành văn bản và Chuyển văn bản thành giọng nói (Chuyển giọng nói thành giọng nói và Chuyển văn bản thành giọng nói) có thể được cải thiện nhờ học máy.

Nguồn: https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-voices-mozilla-releases-the-most-to-date-public-domain-transcribe-voice-dataset/