Tin tức và phân tích của tất cả các thiết bị di động

Các dịch vụ sao chép trực tuyến có an toàn và riêng tư không?

Phiên mã từng là một quá trình thủ công, tẻ nhạt. Các bác sĩ, nhà báo và một nhóm các chuyên gia khác nhau đã ghi lại các ghi chú và cuộc trò chuyện của họ trên máy ghi âm thô, sau đó ngồi trước máy tính để ghi lại chúng.

Tua nhanh đến năm 2020 và có nhiều dịch vụ bạn có thể sử dụng để biến bản ghi âm thanh thành văn bản trên màn hình máy tính của mình. Tuy nhiên, vẫn còn một câu hỏi: chúng có an toàn không? Cuối cùng, bạn có thể chuyển các bản ghi âm cuộc trò chuyện bí mật và tin nhắn thoại riêng tư.

Chúng ta hãy xem các dịch vụ này và cách bảo vệ thông tin của bạn.

Dịch vụ sao chép âm thanh hoạt động như thế nào

Dịch vụ phiên âm âm thanh có xu hướng rơi vào ba phe. Đầu tiên là hoàn toàn dựa trên máy tính và sử dụng các mô hình máy học và AI hiện có để xử lý các cuộc hội thoại. Thứ hai là đắt nhất vì mọi người làm việc chăm chỉ. Thứ ba là sự kết hợp giữa xử lý máy tính và con người.

Bạn có thể biết loại đầu tiên tốt nhất. Các dịch vụ phiên âm giọng nói – chẳng hạn như các dịch vụ do Google cung cấp, Apple và Otter.ai—Biến sóng tương tự mà giọng nói của bạn tạo ra thành biểu diễn kỹ thuật số. Sau đó, nó chia chúng thành các phân đoạn nhỏ (đôi khi một phần nghìn) và khớp chúng với các “âm vị” hoặc thành phần của ngôn ngữ đã biết.

Sau đó, các thuật toán này sẽ cố gắng kiểm tra chúng trong ngữ cảnh của các âm vị khác và đưa chúng vào các mô hình trí tuệ nhân tạo và thống kê, những mô hình này cuối cùng sẽ tạo ra văn bản. Vì các dịch vụ sao chép này hoàn toàn do máy tính kiểm soát nên chúng thường rẻ nhất để chạy. Tuy nhiên, độ chính xác không phải lúc nào cũng chính xác, đặc biệt khi trích xuất văn bản từ môi trường ồn ào hoặc nhiều người.

Phiên âm có sự trợ giúp của con người bao gồm các nền tảng chuyên dụng như Công cụ quay vòng kết nối khách hàng với một nhóm người phiên âm được phê duyệt trước. Bạn cũng có thể thuê ai đó từ một thị trường độc lập, chẳng hạn như Upwork hoặc Fiverr, để phiên âm cho bạn.

Cuối cùng, có một sự kết hợp của cả hai. Để tăng tốc quá trình sao chép, một số trang web để AI thực hiện công việc ban đầu, sau đó ai đó sẽ thu dọn đầu ra và sửa bất kỳ lỗi nào.

Dịch vụ sao chép bị trục trặc

Trong những năm gần đây, nhiều dịch vụ sao chép đã bị vi phạm và bê bối.

Có lẽ lâu đời nhất (và có lẽ là gây sốc nhất) là SpinVox, cung cấp dịch vụ thư thoại thành SMS vào những năm 1900. Vào thời điểm đó, đây được coi là một bước đột phá về công nghệ. Công ty nhanh chóng thu hút báo chí tích cực, khách hàng và nguồn tài trợ khổng lồ.

Vấn đề? Khách hàng không biết rằng thư thoại của họ đang được xử lý bởi những người làm việc trong văn phòng ở những nơi như Pakistan, Mauritius và Nam Phi. Một trong những người cung cấp thông tin của công ty nói rằng chỉ 2 một tỷ lệ tin nhắn thoại được xử lý bằng máy và phần còn lại do khoảng 10.000 công nhân bị bóc lột xử lý.

Khi các nhân viên tại văn phòng SpinVox ở Pakistan không nhận được tiền, họ bắt đầu gửi tin nhắn trực tiếp tới khách hàng để phản đối. Cuối cùng thì sự thật cũng lộ ra và SpinVox đã mất đi nhiều giá trị. Cuối cùng, phần còn lại của Nuans, một trong những nhà cung cấp dịch vụ nhận dạng giọng nói lớn nhất thế giới, đã được bán.

Gần đây, nhà báo an ninh mạng Brian Krebs đã phát hiện ra một vi phạm nghiêm trọng tại MEDantex, nhà cung cấp dịch vụ ghi âm giọng nói cho các bác sĩ có trụ sở tại Kansas. Không có gì ngạc nhiên khi dữ liệu bị rò rỉ (một số có từ năm 2007) có chứa dữ liệu y tế nhạy cảm. Có thể tải xuống nội dung từ cổng thông tin không bảo mật dưới dạng tệp Microsoft Word.

Ngay cả các dịch vụ sao chép kỹ thuật số cũng không an toàn. Rốt cuộc, khi bạn đang sử dụng một dịch vụ hoàn toàn do máy tính điều khiển, công ty có thể sử dụng các nhà thầu con người để thực hiện kiểm tra chất lượng.

Vào năm 2019, trang tin tức VRT NWS của Bỉ đã phát hiện ra rằng các nhà thầu của Google đang nghe lén các cuộc trò chuyện giữa các cá nhân và trợ lý thông minh Google Home của họ. Một nhà thầu thậm chí đã cấp cho VRT NWS quyền truy cập vào các cuộc trò chuyện, nhiều cuộc trò chuyện trong số đó rất nhạy cảm (và trong một số trường hợp là thân mật tình dục).

Amazon, Apple và Microsoft cũng sử dụng các nhà thầu theo cách này. Nói cách khác, ai đó có thể nghe bản ghi âm giọng nói của trợ lý ảo của bạn.

Các dịch vụ sao chép trực tuyến có an toàn không?

Một người phụ nữ đang đeo tai nghe và gõ trên máy tính xách tay.

Vấn đề quan trọng nhất là liệu các dịch vụ sao chép trực tuyến có an toàn hay không. Thật không may, câu trả lời hơi phức tạp.

Tại thời điểm này, không gian phiên âm phần lớn đã trưởng thành. Những diễn viên xấu thái quá nhất đã bị loại bỏ.

Tuy nhiên, bằng cách ủy thác dữ liệu của bạn (trong trường hợp này là các cuộc trò chuyện riêng tư) cho bên thứ ba, bạn sẽ dựa vào đó để bảo vệ dữ liệu đó. Điều này áp dụng cho cả dịch vụ trực tuyến và người sao chép.

Cuối cùng, bạn cần tự hỏi mình hai điều: Bạn có tin tưởng dịch vụ không và mức độ nhạy cảm của các cuộc trò chuyện của bạn?

Khi bạn đang tìm kiếm một dịch vụ sao chép, bạn nên thực hiện một số nghiên cứu. Công ty có danh tiếng tốt không? Nó được thành lập? Đã có một vi phạm dữ liệu trong quá khứ? Có chính sách bảo mật nào xác định rõ cách dữ liệu của bạn sẽ được xử lý và bảo mật không?

Như chúng tôi đã đề cập trước đó, các dịch vụ do AI cung cấp thường dựa vào nhân viên và nhà thầu bên thứ ba để thực hiện kiểm tra chất lượng. Mặc dù những lần kiểm tra này chiếm một phần nhỏ trong tất cả các bản ghi, nhưng luôn có khả năng ai đó sẽ nghe cuộc trò chuyện của bạn.

Tuy nhiên, trong nhiều trường hợp, đây không phải là một công cụ giải quyết. Tuy nhiên, nếu cuộc trò chuyện của bạn mang tính riêng tư sâu sắc hoặc nhạy cảm về mặt thương mại, bạn có thể cân nhắc mở một trình xử lý văn bản và phiên âm theo cách cũ.