Tin tức và phân tích của tất cả các thiết bị di động

NLLB-200: Meta AI cải thiện 44% chất lượng dịch thuật

Mô hình Meta AI mới có tên NLLB-200 có thể dịch 200 ngôn ngữ và cải thiện chất lượng trung bình 44%, đồng thời đã chứng tỏ tiềm năng to lớn.

Các ngôn ngữ được sử dụng rộng rãi nhất đã được các ứng dụng dịch thuật bao phủ trong một thời gian. Ngay cả khi họ không cung cấp bản dịch chính xác, nó thường đủ gần để người bản xứ có thể hiểu được.

NLLB-200 dịch 200 ngôn ngữ khác nhau với kết quả chính xác

Tuy nhiên, vẫn còn hàng trăm triệu người tiếp tục trải nghiệm dịch vụ dịch thuật tệ hại ở những khu vực có nhiều ngôn ngữ, chẳng hạn như Châu Phi và Châu Á.

“Để giúp mọi người kết nối tốt hơn ngày hôm nay và trở thành một phần của siêu vũ trụ ngày mai, các nhà nghiên cứu AI của chúng tôi đã tạo ra Không còn ngôn ngữ nào (NLLB), nỗ lực phát triển khả năng dịch máy chất lượng cao cho hầu hết các ngôn ngữ trên thế giới,” Meta tuyên bố trong thông cáo báo chí. “Hôm nay, chúng tôi công bố một bước đột phá quan trọng trong NLLB: Chúng tôi đã xây dựng một mô hình AI duy nhất có tên NLLB-200, dịch 200 ngôn ngữ khác nhau với kết quả chính xác hơn nhiều so với những gì công nghệ trước đây có thể đạt được.”

Metaverse cố gắng không có ranh giới. Các dịch vụ dịch thuật sẽ cần cung cấp bản dịch chính xác nhanh chóng để thực hiện được điều đó. Ngoài ra, bạn có biết Mô hình ngôn ngữ Pathways của Google có thể giải thích một trò đùa không?

NLLB-200 được cho là đã đạt được điểm dịch “chất lượng” cao hơn 44%.

Công ty giải thích: “Khi metaverse bắt đầu hình thành, khả năng xây dựng các công nghệ hoạt động tốt với nhiều ngôn ngữ hơn sẽ giúp dân chủ hóa quyền truy cập vào trải nghiệm phong phú trong thế giới ảo”.

So với nghiên cứu AI trước đó, NLLB-200 được cho là đã đạt được điểm dịch “chất lượng” cao hơn 44%. Các bản dịch do NLLB-200 tạo ra chính xác hơn bản dịch của con người đối với một số ngôn ngữ có nguồn gốc châu Phi và Ấn Độ.

Meta AI đạt được những kết quả này như thế nào?

Hầu hết các mô hình dịch máy (MT) hiện nay chỉ hoạt động với các ngôn ngữ có nguồn lực từ trung bình đến cao, bỏ lại phần lớn các ngôn ngữ có nguồn lực thấp. Các nhà nghiên cứu Meta AI đang tạo ra ba bước phát triển AI quan trọng để khắc phục vấn đề này.

NLLB-200 chính xác hơn bản dịch của con người đối với một số ngôn ngữ có nguồn gốc châu Phi và Ấn Độ.

Để đánh giá và nâng cao NLLB-200, Meta đã tạo ra một tập dữ liệu có tên FLORES-200. Các nhà nghiên cứu có thể đánh giá hiệu suất của FLORES-200 “theo 40.000 hướng ngôn ngữ khác nhau” nhờ vào bộ dữ liệu.

Các nhà phát triển được hoan nghênh đóng góp cho cả NLLB-200 và FLORES-200 để mở rộng công việc của Meta và nâng cao các công cụ dịch thuật của riêng họ.

Đối với các học giả và tổ chức phi lợi nhuận muốn sử dụng NLLB-200 cho các mục đích đáng giá liên quan đến tính bền vững, an ninh lương thực, bạo lực trên cơ sở giới, giáo dục hoặc các lĩnh vực khác hỗ trợ Mục tiêu Phát triển Bền vững của Liên Hợp Quốc, Meta có một nhóm tài trợ với tổng trị giá lên tới 200.000 USD.

Nhưng không phải ai cũng đồng tình với dự án gần đây nhất của Meta.

“Cần lưu ý rằng, bất chấp sự cường điệu, những mô hình này không phải là phương pháp chữa trị tất cả những gì chúng có thể xuất hiện lần đầu. Những mô hình mà Meta sử dụng đều là những con quái vật to lớn, khó sử dụng. Vì vậy, khi bạn đi sâu vào các chi tiết vụn vặt của các trường hợp sử dụng được cá nhân hóa, chúng có thể dễ dàng nhận thấy mình không có chiều sâu – khái quát hóa quá mức và không có khả năng thực hiện các nhiệm vụ cụ thể được yêu cầu,” CTO của Iris.aiVictor Botev.

Bạn có thể dùng thử bản demo của NLLB-200.

“Một điểm khác cần lưu ý là tính hợp lệ của các phép đo này vẫn chưa được các đồng nghiệp của chúng chứng minh và xác minh một cách khoa học. Các bộ dữ liệu cho các ngôn ngữ khác nhau quá nhỏ, thể hiện qua thách thức trong việc tạo chúng ngay từ đầu và số liệu họ đang sử dụng, BLEU, không có khả năng áp dụng đặc biệt,” ông nói thêm.

Bạn có thể dùng thử bản demo của NLLB-200 bằng cách truy cập liên kết này. “Chúng tôi đã tạo một bản demo sử dụng những cải tiến AI mới nhất từ ​​dự án Không còn ngôn ngữ nào để dịch sách từ các ngôn ngữ gốc như tiếng Indonesia, tiếng Somali và tiếng Miến Điện sang nhiều ngôn ngữ hơn cho độc giả – với hàng trăm cuốn sách sẽ có trong những tháng tới. Với công cụ AI này, giờ đây các gia đình có thể cùng nhau đọc truyện từ khắp nơi trên thế giới bằng ngôn ngữ phù hợp với họ,” Meta tuyên bố. Gần đây, chúng tôi đã đề cập rằng máy tính P là tương lai để phát triển hệ thống AI và ML hiệu quả. Những hệ thống này cũng rất quan trọng khi tạo ra các mô hình AI hiệu quả.