Tin tức và phân tích của tất cả các thiết bị di động

Hệ thống nhận dạng giọng nói có sự thiên vị chủng tộc

io9.gizmodo

Trong những năm gần đây, các công ty công nghệ đã tập trung vào phát triển trợ lý thông minh hoạt động thông qua nhận dạng giọng nói, Alexa de AmazonSiri từ Apple, trong số những người khác, họ thường được sử dụng ngày nay, nhưng các nghiên cứu gần đây cho thấy các hệ thống này không hoàn toàn hiệu quả vì chúng thể hiện sự thiên vị, chủ yếu để phân biệt giọng nói. từ người da trắng từ người da đen.

Nghiên cứu là đúng "Sự khác biệt về chủng tộc trong nhận dạng giọng nói tự động", được thực hiện bởi Đại học Stanford, cho thấy các hệ thống nhận dạng giọng nói này có khả năng chủng tộc đáng kể, với sự khác biệt giữa giọng nói của người da trắng và người Mỹ gốc Phi.

Kết quả của chúng tôi chỉ ra những trở ngại mà người Mỹ gốc Phi gặp phải khi sử dụng các công cụ toàn diện hơn bao giờ hết được hỗ trợ bởi công nghệ nhận dạng giọng nói.

hệ thống Amazon, Apple, Google, IBM và Microsoft

Dường như tất cả công nghệ, hệ thống máy học và thuật toán phức tạp được sử dụng bởi những người khổng lồ công nghệ vẫn chưa đủ để điều chỉnh sự hủy diệt chủng tộc được tìm thấy trong các hệ thống nhận dạng giọng nói, khi các nhà nghiên cứu đã thử nghiệm chúng không có kết quả. đáng khích lệ.

Các nghiên cứu được thực hiện trên một nhóm người da đen và người da trắng, kết quả cho thấy sự khác biệt đáng chú ý từ 19% lỗi trong việc nhận ra giọng nói của người da trắng, đến sai số 35% trong việc công nhận người Mỹ gốc Phi:

Ở đây chúng tôi kiểm tra năng lực của năm hệ thống ASR thế hệ tiếp theo – được phát triển bởi Amazon, Apple, Google, IBM và Microsoft – để phiên âm các cuộc phỏng vấn có cấu trúc được thực hiện với 42 loa trắng và 73 loa đen.

Chúng tôi thấy rằng tất cả năm hệ thống ASR cho thấy sự khác biệt đáng kể về chủng tộc, với lỗi từ trung bình (WER) là 0, 35 cho loa màu đen so với 0, 19 cho loa màu trắng.

Nguồn: pnas.org

Khả năng nhân giống đáng lo ngại của các công nghệ khác nhau

Mặc dù những người khổng lồ công nghệ đã phát triển các kỹ thuật tốt để cố gắng tạo điều kiện hàng ngày, chẳng hạn như hệ thống nhận dạng khuôn mặt, trợ lý ảo và các hệ thống nhận dạng giọng nói này, điều đáng lo ngại là người Mỹ gốc Phi hiện đang bị ảnh hưởng bởi độ chính xác thấp của các công cụ này không chỉ nhận ra các đặc điểm vật lý, mà còn cũng là tiếng nói của họ.

"Chúng tôi đã tìm ra những khác biệt này đối với các mô hình âm thanh cơ bản được sử dụng bởi các hệ thống ASR vì sự khác biệt về chủng tộc là bằng nhau trong một tập hợp các cụm từ giống hệt nhau được nói bởi các cá nhân đen và trắng trong kho văn bản của chúng tôi."

Trong nghiên cứu, các nhà nghiên cứu bày tỏ lo ngại rằng "các hệ thống nhận dạng giọng nói phải chịu sự thiên vị chủng tộc", đã xuất hiện trong các ứng dụng học máy khác.

Họ cũng yêu cầu mở rộng nguồn dữ liệu cho các hệ thống nhận dạng giọng nói, "Là một tập hợp dữ liệu giáo dục đa dạng hơn bao gồm tiếng Anh của người Mỹ bản xứ" để đảm bảo một "Công nghệ hòa nhập".

Nghiên cứu cho thấy một trở ngại khác mà công dân Mỹ gốc Phi gặp phải khi sử dụng hoặc tuân theo công nghệ này khi họ không được xử lý hoặc đào tạo để nhận ra dữ liệu từ người da đen.

Các nhà nghiên cứu yêu cầu sự cần thiết "Kiểm toán Machine Learning System" để đảm bảo rằng chúng bao gồm một hệ thống máy tính toàn diện bao gồm.