Tin tức và phân tích của tất cả các thiết bị di động

Google cần sửa lỗi nhận dạng giọng nói song ngữ tồi tệ nổi tiếng của mình trên Assistant và Gboard

Google thu thập số lượng lớn dữ liệu giọng nói trên tất cả các sản phẩm của mình và trong khi nó không quá minh bạch về thực tiễn, chúng tôi là người dùng kiếm lợi từ phần lớn. Nhận dạng giọng nói đã liên tục trở nên tốt hơn trong những năm qua, điều này đã cho phép công nghệ khoa học viễn tưởng ấn tượng như loa thông minh vào nhà của chúng ta. Tuy nhiên, có một bộ phận mà Google cần đẩy mạnh trò chơi của mình: những người nói đa ngôn ngữ đang gặp khó khăn khi sử dụng nhiều ngôn ngữ trên bất kỳ sản phẩm nào của Google.

Trong khi có rất nhiều người sống cả đời chỉ nói một ngôn ngữ, nhiều quốc gia trên thế giới thường xuyên tung hứng giữa hai hoặc thậm chí nhiều hơn mọi lúc. Ngày nay, rất nhiều sản phẩm vẫn được phát triển bởi những người chỉ có một lưỡi chính, vì vậy hỗ trợ song ngữ thường không tốt như có thể (điều này cũng đúng ngoài xử lý lời nói và âm thanh).

Đó là vấn đề đối với những người thường xuyên chuyển đổi giữa nhiều ngôn ngữ. Người sáng lập Cảnh sát Android, Artem thường xuyên phải vật lộn với tính năng đọc chính tả của Gboard trong khi biên tập viên Rita của chúng tôi chỉ cần loại bỏ ngôn ngữ thứ cấp của cô, tiếng Pháp, khỏi Trợ lý. Cũng có báo cáo về Reddit phàn nàn về các vấn đề phát sinh từ một Trợ lý song ngữ. Một số Redditor thậm chí còn nhận thấy rằng loa Google Home của họ cần nhiều thời gian xử lý hơn khi họ phải xử lý hai ngôn ngữ.

Bảng

Dưới đây là một số ví dụ từ những tai ương song ngữ của Gboard cho tôi, một người nói tiếng Đức bản địa. Những vấn đề này chắc chắn sẽ được khuếch đại cho những người sử dụng nhiều hơn hai ngôn ngữ.

Như bạn có thể nghe và thấy, cũng có một số trường hợp Google tự ý chuyển đổi ngôn ngữ ở giữa câu trong khi xử lý. Điều đó đôi khi có ý nghĩa (tôi thay đổi ngôn ngữ giữa câu tùy thuộc vào người tôi nói chuyện), nhưng nó thường xảy ra khi nó không được phép xảy ra. Đó là trường hợp trong những ví dụ này, trong đó Google hoàn toàn bỏ lỡ rằng tôi đang nói tiếng Anh và tạo ra một số từ vô nghĩa tiếng Đức, được dịch để thuận tiện cho bạn:

  • "Bây giờ tôi sẽ chứng minh Google (ly) hiểu tôi tệ đến mức nào" -> "Arena Damen thẳng Herbert Google Landesgrenzen" -> "Arena lady thẳng Herbert Google biên giới"
  • "Nếu chỉ có một cách tôi có thể tự động hóa việc này" -> "BVG ticketautomat" -> "Máy bán hàng tự động BVG" (BVG là cơ quan giao thông công cộng ở Berlin, vì vậy sự kết hợp này đáng ngạc nhiên.)
  • "Chờ đã, tôi vẫn phải hoàn thành bài viết" -> "AUTOMEISTER Haftbefehl nicht radeke" -> "Lệnh bắt giữ CARMASTER không radeke" (từ cuối cùng thậm chí không phải là một từ trong tiếng Đức và tôi không biết tại sao CARMASTER lại xuất hiện trong tất cả các mũ.)

Note rằng phải mất một vài lần cố gắng để có được mức độ hiểu lầm này từ Gboard và trong đoạn trích bạn nghe thấy ở đây, giọng của tôi thể hiện qua hầu hết, điều này có thể khuếch đại vấn đề. Tuy nhiên, Gboard có thể nhận thấy rằng những gì nó sản xuất bằng tiếng Đức là hoàn toàn vô nghĩa và thay vào đó chuyển sang tiếng Anh.

Google Assistant

Trợ lý cũng gây rối khi bạn đặt nó thành hai ngôn ngữ. Hãy bắt đầu với một tác phẩm kinh điển mà tôi nghe được mỗi ngày khi tôi cố gắng đặt hẹn giờ bằng tiếng Anh, được ghi lại bởi các thiết bị Google Home của tôi:

https://www.androidpolice.com/wp-content/uploads/2020/01/timer-for-5-thông tin.mp3

Tôi đã bảo Google "Đặt hẹn giờ cho 5 phút. "Vì một số lý do, Google sau đó quyết định hiểu phần đầu tiên bằng tiếng Đức:" Stelle Timer "thay vì" đặt hẹn giờ. "Trợ lý đã nhận phần còn lại của câu bằng tiếng Anh, vì vậy họ đã quyết định rằng" trong năm phút " phải là tên của bộ hẹn giờ (như trong, "Đặt bộ hẹn giờ gọi là 'khoai tây chiên'") và hỏi tôi phải mất bao lâu. Đó là khi tôi cần trả lời bằng tiếng Đức và bảo nó đặt hẹn giờ trong năm phút, một lần nữa Câu trả lời, được dịch đầy đủ: "Chắc chắn, bộ đếm thời gian trong năm phút được gọi là 'trong năm phút.' Bắt đầu từ bây giờ. " _ () _ /

nói

https://www.androidpolice.com/wp-content/uploads/2020/01/turn-off-the-light-recply.mp3

Bản dịch của câu vô nghĩa tiếng Đức ở trên: "Hẹn giờ cho rồi." Điều tôi thực sự đã nói: "Tắt đèn đi."

Thỉnh thoảng, Google thích hiểu một cái gì đó hoàn toàn khác. Khi tôi nói "tắt đèn", tôi nghĩ rằng tôi muốn đặt "hẹn giờ cho" bằng tiếng Đức, một câu không có nghĩa gì cả.

Những vấn đề này không chỉ phát sinh đối với những người có dấu dày. Artem hoàn toàn không có điểm nhấn và đôi khi Google vẫn nghĩ rằng tôi đang nói tiếng Anh khi tôi nói bằng tiếng Đức (không có dấu). Điều tương tự cũng đúng với Rita với sự kết hợp Trợ lý Anh / Pháp của cô. Nó liên tục xảy ra với chúng ta đến mức thuận tiện hơn khi tắt hoàn toàn một trong những ngôn ngữ.

Phương pháp khả thi

Trên Gboard, sẽ rất hữu ích nếu có một cách nhanh chóng và dễ dàng để thúc đẩy Google sao chép lại những gì bạn vừa nói – có thể là một menu nhấn dài cho phép bạn chọn ngôn ngữ nào mà bàn phím nên thử lại?

Đối với loa thông minh, điều đó hơi khó khăn hơn nhưng chắc chắn có thể thực hiện được. Tại sao tôi không thể theo dõi một lệnh sai lầm, dịch sai bằng cách nói, "Này Google, đó là tiếng Đức, hãy thử lại?" Cách tiếp cận này vẫn còn thiếu đối với các hộ gia đình đa ngôn ngữ sử dụng ba ngôn ngữ và tiếng lóng khác nhau trong một câu, nhưng đó không phải là điều mà tôi mong đợi một cách hợp lý tại thời điểm đưa ra những tai ương song ngữ mà chúng ta đang sống.

Google cũng có thể sử dụng kết hợp dữ liệu vị trí và lịch sử duyệt web để đánh giá ngôn ngữ mẹ đẻ của tôi. Sau đó, nó có thể mong đợi tiếng Anh của tôi phát âm tiếng Đức nhiều hơn một chút và phát triển khả năng chịu đựng những lỗi sai hoặc phát âm bất thường. Tất nhiên, điều này có thể làm việc cho bất kỳ sự kết hợp ngôn ngữ khác. Nhưng đây là một giải pháp cấp độ tiếp theo và tôi tin rằng nó còn xa hơn và khó thực hiện hơn các phương pháp khác.

Ngôn ngữ rất khó và chúng ta phải tự nhắc nhở mình rằng chúng ta thường không hiểu nhau trong cuộc sống hàng ngày. Tôi cảm thấy như chúng ta có thể đang mong đợi quá nhiều sự hoàn hảo từ máy móc của mình. Tuy nhiên, những gì các thuật toán thiếu là một cách nhanh chóng loại trừ các tích cực sai và hiểu ý định.

Nếu tôi bảo một người đặt hẹn giờ trong khi tôi đang nấu ăn và người đó phải quyết định xem tôi nói "10 phút" hay "10 giờ", rất có thể họ sẽ chọn trong vài phút với bối cảnh. Điều này cũng đúng trên các ngôn ngữ. Nếu tôi chỉ hiểu được sự vô nghĩa vì tôi đã điều chỉnh tiếng Anh tại một thời điểm nhất định (tin tôi đi, điều này xảy ra), tôi dừng lại và cố gắng xem qua những gì tôi đã nghe chỉ để nhận ra đó thực sự là tiếng Đức.

Đối với máy móc, điều này có lẽ không phải là một kỳ công dễ dàng, nhưng Google đã tìm cách tách một giọng nói trong đám đông trong bản demo công nghệ hai năm tuổi, vì vậy có vẻ kỳ lạ là hỗ trợ đa ngôn ngữ vẫn còn quá nhỏ.

Tuy nhiên, chúng tôi phải cung cấp tín dụng cho Google khi tín dụng đáo hạn: Amazon đã chỉ giới thiệu hỗ trợ song ngữ cho Alexa vào tháng 10 năm 2019 trong khi Siri không hỗ trợ nhiều ngôn ngữ cùng một lúc. Điều này mang lại cho tôi hy vọng rằng Google chỉ còn quá sớm với trò chơi (hãy nhớ Google Hiện hành?) Để có nhiều cơ hội để cải tiến trong tương lai. Google cũng là công ty tiên phong trong các bản dịch nhanh chóng có thể truy cập của người dùng thông qua Trợ lý và bản dịch máy ảnh tức thì, vì vậy công ty nhận ra tầm quan trọng của lĩnh vực này.

Trong khi đó, tôi đã tắt tiếng Đức cho Trợ lý của mình và ngoài những khó khăn với địa chỉ và bài hát địa phương, trải nghiệm bây giờ tốt hơn rất nhiều.

Mục lục