Tin tức và phân tích của tất cả các thiết bị di động

Meta ra mắt AI dịch giọng nói thành giọng nói mới

  • AI dịch từ giọng nói sang giọng nói có thể dịch ngay lập tức các cuộc hội thoại giữa hai ngôn ngữ được phát triển bởi Facebookcông ty mẹ của Meta.
  • Trong một video gần đây, Meta đã trình diễn cách chương trình dịch giữa Phúc Kiến và các ngôn ngữ khác bằng trí tuệ nhân tạo (AI).
  • Điều bất thường ở dự án Meta là nhóm phát triển không thể cung cấp cho hệ thống AI một lượng lớn tài liệu bằng ngôn ngữ đó vì tiếng Phúc Kiến chủ yếu được nói chứ không phải bằng viết.
  • Công ty tuyên bố rằng các nhà phát triển AI của họ muốn tạo ra các hệ thống dịch giọng nói sang giọng nói có thể hoạt động với hầu hết các ngôn ngữ. ngôn ngữ được sử dụng trên toàn thế giới.
  • Theo Zuckerberg, trong cuộc đời của chúng ta, trí tuệ nhân tạo sẽ cho phép chúng ta giao tiếp với bất kỳ ai bằng bất kỳ ngôn ngữ nào.

Công ty mẹ của FacebookMeta đã tạo ra một công cụ kỹ thuật số có thể dịch ngay lập tức các cuộc hội thoại giữa hai ngôn ngữ. Trong một video gần đây, Meta đã trình diễn khả năng dịch từ giọng nói sang tiếng Phúc Kiến của AI giữa tiếng Anh và tiếng Phúc Kiến.

AI dịch giọng nói thành giọng nói này có thể làm gì?

Mark Zuckerberg, Giám đốc điều hành của Meta, giải thích trong video lý do tại sao dự án cần các kỹ thuật phát triển sáng tạo, độc đáo. Điều này là do tiếng Phúc Kiến chủ yếu được nói. Không có một hình thức viết chung cho nó.

Các nhà phát triển tại Meta đã phải sử dụng một phương pháp không chính thống để đào tạo AI dịch giọng nói thành giọng nói mới này

Các mô hình AI thường được những người tạo ra hệ thống dịch thuật đào tạo về số lượng lớn tài liệu bằng văn bản bằng ngôn ngữ mục tiêu. Để giúp hệ thống tạo ra câu trả lời chính xác nhất, các nhà phát triển cung cấp cho hệ thống nhiều mẫu và kết hợp ngôn ngữ khác nhau. Các hệ thống sử dụng AI để hỗ trợ dịch thuật nhìn chung đã có những tiến bộ đáng kể trong những năm gần đây. Nhận hỗ trợ dịch thuật trực tuyến hoặc bằng điện thoại thông minh giờ đây đơn giản hơn bao giờ hết và sẽ cải thiện giao tiếp toàn cầu.

Tuy nhiên, một vấn đề với các hệ thống như vậy là bản thân quá trình dịch thuật gây ra sự chậm trễ. Ví dụ: các từ đầu tiên được chuyển thành văn bản và sau đó được hệ thống AI dịch khi hệ thống ghi lại giọng nói. Những từ đã dịch sau đó được nói lại để có thể hiểu được. Khía cạnh đặc biệt của dự án Meta là nhóm phát triển không thể cung cấp cho hệ thống AI dịch giọng nói sang giọng nói một khối lượng đáng kể tài liệu ngôn ngữ Phúc Kiến.

Phúc Kiến là một phương ngữ của tiếng Trung Quốc. Hàng triệu người ở tỉnh Phúc Kiến phía đông nam Trung Quốc nói thứ đó. Ngoài ra, nó còn được sử dụng rộng rãi ở Đài Loan và một số khu vực ở Malaysia, Singapore và Philippines. Thông thường, các gia đình truyền lại ngôn ngữ của họ qua nhiều thế hệ.

Các nhà phát triển của công ty đặt mục tiêu tạo ra AI dịch từ giọng nói sang giọng nói có thể dịch ngôn ngữ nói ngay lập tức

Theo Meta, Phúc Kiến là một trong hầu hết 3500 ngôn ngữ sống hầu hết được nói nhưng không có hệ thống chữ viết chung. Theo tập đoàn, các kỹ sư AI của họ hy vọng sẽ tạo ra các công nghệ dịch từ giọng nói sang giọng nói sẽ hoạt động với hầu hết các ngôn ngữ trên thế giới. Hai sáng kiến ​​AI mới đã được Meta giới thiệu vào đầu năm nay. Không có ngôn ngữ nào bị bỏ lại phía sau là một trong số họ. Trong một video, Zuckerberg cho biết dự án nhằm mục đích phát triển các công cụ dịch thuật cho “hàng trăm” ngôn ngữ khác nhau.


Đạo luật trí tuệ nhân tạo của EU: Liệu quy định có chống lại sự đổi mới?


Các Trình dịch giọng nói phổ quát là cái khác. Doanh nghiệp cho biết mục tiêu của dự án là tạo ra một hệ thống có thể cung cấp “bản dịch từ giọng nói sang giọng nói trên tất cả các ngôn ngữ”. Hệ thống Meta liên quan đến Phúc Kiến gần đây nhất được tạo ra như một phần của dự án Universal Speech Translator của công ty. Theo Zuckerberg, trí tuệ nhân tạo sẽ cho phép chúng ta nói chuyện với bất kỳ ai bằng bất kỳ ngôn ngữ nào “trong suốt cuộc đời của chúng ta”. AI dịch giọng nói sang giọng nói mới này dường như là một bước tiến lớn hướng tới nỗ lực này.

Mark Zuckerberg nghĩ rằng chúng ta sẽ có thể nói chuyện với bất kỳ ai bằng bất kỳ ngôn ngữ nào “trong suốt cuộc đời của chúng ta”

Theo Meta, hệ thống dịch thuật mới giữa Phúc Kiến và tiếng Anh đã được phát triển, sử dụng nhiều kỹ thuật khác nhau. Các nhà nghiên cứu đã sử dụng các mẫu văn bản viết từ tiếng Quan Thoại, một loại tiếng Trung khác có liên quan đến Phúc Kiến, để đào tạo mô hình AI dịch giọng nói sang giọng nói. Ngoài ra, những người tạo ra Meta đã sử dụng một công cụ mã hóa được tạo ra để đối chiếu tiếng Phúc Kiến với văn bản tiếng Anh có thể so sánh được. Để đảm bảo kết quả chính xác, nhóm đã cộng tác rộng rãi với những người nói tiếng Phúc Kiến.


Trí tuệ nhân tạo mới có thể chẩn đoán bệnh nhân bằng giọng nói của họ


Trong tương lai, Meta có kế hoạch phát triển hệ thống dịch từ giọng nói sang giọng nói cho một số lượng lớn các ngôn ngữ khác bằng cách sử dụng các kỹ thuật tương tự được sử dụng cho Phúc Kiến. Theo doanh nghiệp, mô hình dịch thuật tiếng Phúc Kiến “vẫn đang trong quá trình hoàn thiện”. Người ta đã đề cập rằng thuật toán hiện chỉ có thể dịch toàn bộ một câu tại một thời điểm.