Tin tức và phân tích của tất cả các thiết bị di động

6 Những cách bạn có thể sử dụng học sâu để cải thiện tính dễ sử dụng của thiết bị di động

Bài viết này ban đầu được xuất bản trên M Liquido.com vào ngày 23 tháng 1 năm 2020 và được viết bởi Radosław Holewa.

Với nhu cầu toàn cầu ngày càng tăng đối với các trải nghiệm di động được cải thiện và cá nhân hóa hơn, AI rộng rãi và thích ứng học tập sâu trong ngành phát triển ứng dụng di động là không thể tránh khỏi. Hãy quên đi những vấn đề về độ trễ bực bội phát sinh từ cảm biến di động và điện toán đám mây. Thời gian đáp ứng gần như bằng không, với tốc độ xử lý dữ liệu thời gian thực cho kết quả tốt nhất.

Chipset điện thoại thông minh Bionic tiên tiến của Apple với các bộ xử lý thần kinh tích hợp giúp các mạng thần kinh hoạt động trực tiếp trên thiết bị với tốc độ đáng kinh ngạc. Với Core ML của Apple, nền tảng ML Kit của Google và các thư viện học sâu như TensorFlow Lite và Keras, các nhà phát triển di động có thể xây dựng các ứng dụng với thời gian phản hồi ít hơn, ít lỗi hơn và xử lý dữ liệu nhanh hơn.

Ưu điểm chính của học máy trên thiết bị là nó cung cấp cho người dùng trải nghiệm người dùng mượt mà và chính xác. Vì không có vấn đề gì khi gửi dữ liệu đến các máy chủ bên ngoài để xử lý, bạn sẽ được cải thiện khả năng bảo vệ dữ liệu, an toàn và quyền riêng tư của người dùng. Ngoài ra, với Mạng thần kinh trên thiết bị di động, bạn không cần kết nối internet để truy cập mọi tính năng của ứng dụng. Tất nhiên, bạn vẫn sẽ cần internet cho hầu hết các tính năng tiêu chuẩn.

Việc sử dụng các khả năng tính toán cho các thiết bị di động để thực hiện các thuật toán học sâu đã cải thiện khả năng sử dụng của các thiết bị di động. Đây là cách thực hiện:

1. Nhận dạng giọng nói trên thiết bị

Nhận dạng giọng nói bao gồm chuyển đổi hoặc chuyển đổi chuỗi đầu vào thành chuỗi đầu ra bằng cách sử dụng các mạng thần kinh lặp đi lặp lại (RNN), mạng thần kinh tích chập (CNN), mạng lưới thần kinh sâu (DNN) và các cấu trúc khác. Các nhà phát triển đã gặp vấn đề về độ trễ – tạo ra sự chậm trễ giữa yêu cầu của bạn và phản hồi tự động – nhưng giờ đây chúng tôi có thể khắc phục chúng bằng công nghệ RNN-T được nhúng trong thiết bị di động.

RNN-Ts là các mô hình trình tự. Thay vì làm theo phương pháp thông thường để xử lý một chuỗi đầu vào hoàn chỉnh trước khi tạo đầu ra, nó duy trì tính liên tục nhất quán trong quá trình xử lý đầu vào và luồng đầu ra. Điều này tạo điều kiện cho nhận dạng giọng nói và xử lý trong thời gian thực. Bạn thấy điều này với Google Assistant, Có thể xử lý các lệnh thoại liên tiếp mà không bị vấp và không nhắc bạn gọi "Hey, Google" sau mỗi yêu cầu.

Nó tạo một cuộc trò chuyện hai chiều tự nhiên hơn và trợ lý sẽ làm theo hướng dẫn của bạn đến T. Bạn có muốn đặt chủ đề email, tìm ảnh trong một trong các thư mục của mình và hướng dẫn bạn đến địa điểm của chị bạn không? Xong rồi.

Bằng cách tiếp tục với điện thoại Pixel 4 Mới từ Google, tính năng "Live Caption" có thể cung cấp các bản dịch ghi chú thoại, podcast và video theo thời gian thực – và vì xử lý trên thiết bị – cũng ở chế độ Máy bay. Vì vậy, ví dụ, nếu một video xuất hiện trên Twitter Tóm lại, bạn có thể xem chú thích là gì, mà không cần phải tắt âm thanh. Live Caption không hoạt động với các cuộc gọi âm nhạc hoặc điện thoại và video.

2. Tăng hiệu quả trong khi nhận ra cử chỉ

Sử dụng các mô hình đường ống học máy trên thiết bị, bạn có thể huấn luyện thiết bị di động của mình để phát hiện, theo dõi và nhận biết cử chỉ tay và cơ thể. Camera của thiết bị của bạn ghi lại và lưu trữ cử chỉ và chuyển động của bạn dưới dạng dữ liệu hình ảnh 3D. Tiếp theo, các thuật toán học sâu cho các mạng thần kinh sử dụng thư viện cử chỉ này để xác định và giải mã các cử chỉ tĩnh và động cụ thể. Sau đó, họ khớp chúng theo thời gian thực với ý định của bạn và thực hiện các đơn đặt hàng bạn muốn.

Google pix 4 smartphones Nó đi kèm với chip Soli tạo điều kiện cho sự tương tác phức tạp và phi ngôn ngữ với điện thoại của bạn. Cảm biến radar mini trên đỉnh điện thoại này hỗ trợ công nghệ Motion Sense có thể phát hiện sự hiện diện của bạn và cử chỉ tay và cơ thể để cho phép các tương tác điện thoại của bạn. Với một cái vẫy tay, ngay cả khi không chạm vào điện thoại, bạn có thể bảo anh ấy tắt máy, tắt chuông báo thức hoặc chuyển sang bài hát tiếp theo trong danh sách phát của bạn.

3. Khả năng nhập vai của thực tế tăng cường

Sử dụng ARCore và Google Apple từ các nền tảng ARKit, các nhà phát triển có thể tạo các ứng dụng thực tế tăng cường có thể kết hợp các đối tượng và môi trường kỹ thuật số với các cài đặt thực tế. Khả năng nhập vai của thực tế tăng cường có tác động rất lớn đến bán lẻ, giải trí, du lịch và các ngành công nghiệp khác. Các thương hiệu như Lacoste và Sephora hiện cho phép khách hàng của họ dùng thử hoặc xem trước các sản phẩm bằng các ứng dụng thực tế gia tăng và ngày càng nhiều người mua hàng thích kiểm tra sản phẩm trên điện thoại của họ trước khi quyết định mua chúng.

Trò chơi thực tế tăng cường tương tác như Pokemon Ingress và Ghostbuster World báo chí rộng rãi và theo dõi chuyên dụng. Nếu bạn muốn tìm đường quanh thành phố, Google Maps Live View sẽ cung cấp cho bạn điều hướng theo thời gian thực.

Camera Leica Quad trên Huawei P30 Pro.

4. Hình ảnh chất lượng cao

Chất lượng hình ảnh cao là một tiêu chí quan trọng đối với người mua khi lựa chọn smartphones, Mà họ có thể nhận được với nhiều mô hình mới nhất. Chúng được trang bị các thành phần phần cứng – đơn vị xử lý trung tâm (CPU), bộ xử lý tín hiệu hình ảnh, thuật toán hình ảnh học sâu và đơn vị xử lý thần kinh – đã tăng vọt smartphones Trong một thế giới hoàn toàn khác với máy ảnh truyền thống khi chụp ảnh. Với những smartphones Họ có thể hiển thị nhận thức nhiều hơn ở mức xếp hạng pixel của những gì họ thấy để chụp ảnh có độ phân giải cao.

Điện thoại Google pixel Apple IPhone sử dụng nhiều máy ảnh và thuật toán học máy tinh vi để xác định người và vật thể, tạo bản đồ độ sâu, liên tục nối các phơi sáng dài và tính toán cân bằng màu chính xác.

Bằng cách đào tạo mạng lưới thần kinh trên bộ dữ liệu hình ảnh, các thuật toán học cách đáp ứng các yêu cầu hình ảnh riêng lẻ và tinh chỉnh hình ảnh trong thời gian thực. Hệ thống chỉnh sửa tự động được phát triển bởi các nhà nghiên cứu từ MIT và Google cho phép các nhiếp ảnh gia áp dụng các phong cách khác nhau cho hình ảnh trước khi chụp ảnh.

Sau khi lưới chập xử lý hình ảnh ở độ phân giải thấp, phương pháp ánh xạ đã biết để liên kết chuyển đổi màu sẽ điều chỉnh màu pixel của hình ảnh. Lưới lưu trữ các định dạng biến đổi này trong lưới ba chiều, sau đó cho phép xuất hình ảnh có độ phân giải cao. Tất cả điều này xảy ra trong vòng một phần nghìn giây.

Điện thoại thông minh bây giờ cũng vượt trội so với máy ảnh DSLR trong điều kiện ánh sáng yếu và ban đêm. Bằng cách tích hợp mạng và cảm biến thần kinh sâu, máy ảnh điện thoại thông minh có thể chụp được hình ảnh rõ nét hơn với nhiều màu sắc hơn mắt người có thể nhìn thấy.

Huawei, hãng đã thực hiện các bức ảnh khả thi với ánh sáng yếu với P20 Pro, sử dụng bộ lọc RYYB, cảm biến lớn và xử lý hình ảnh AI trong sê-ri Mate 30 để cung cấp hình ảnh chất lượng cao, ánh sáng yếu cũng như quay video ánh sáng yếu. Google Pixel đến 4 Với chế độ Tầm nhìn ban đêm có thể chụp ảnh trong phạm vi Lux 0.3-3 Và chụp ảnh kỷ yếu có thể chụp được bầu trời đầy sao đen. Bên cạnh chế độ ban đêm tự động kích hoạt trong bóng tối, hệ thống Deep Fusion mới của Apple sẽ thích ứng với các mức độ chiếu sáng và đưa nhiếp ảnh iPhone lên một mức ấn tượng hơn.

Ngay cả khi bạn không hiểu về nhiếp ảnh, bạn sẽ có thể chụp những bức ảnh tuyệt vời với những smartphones.

5. Tăng cường bảo mật và quyền riêng tư

Việc tuân thủ GDPR và Đạo luật bảo mật người tiêu dùng California (CCPA) được thực hiện dễ dàng hơn với học máy. Đảm bảo an toàn dữ liệu, vì bạn không cần phải tải lên sinh trắc học, mã hóa hoặc dữ liệu chú thích trực tiếp lên máy chủ hoặc đám mây để xử lý.

Mã hóa tự động trên thiết bị là một tính năng điện thoại thông minh hữu ích khác bảo vệ nội dung của bạn bằng mã PIN, mật khẩu hoặc mẫu và chỉ cho phép truy cập vào dữ liệu của bạn khi bạn mở khóa điện thoại. Vì vậy, nếu thiết bị của bạn bị mất hoặc bị đánh cắp, cơ hội cho bất kỳ ai lấy dữ liệu của bạn là không đáng kể.

Một ví dụ về trải nghiệm điện thoại thông minh an toàn hơn là Face ID cho iPhone. Mạng thần kinh trên thiết bị tại Apple Xử lý an toàn chip điện thoại thông minh và lưu trữ dữ liệu khuôn mặt người dùng. Nhận dạng xảy ra trên thiết bị của bạn, vì vậy quyền riêng tư và bảo mật của bạn vẫn không bị cản trở.

Mở khóa bằng khuôn mặt được sử dụng trong Google Pixel 4 Được hỗ trợ bởi chip Soli, Đặt Độ sâu IR 3D để tạo các mẫu khuôn mặt để nhận dạng khuôn mặt của bạn và lưu trữ trên chip bảo mật Titan M6 trên thiết bị. Mở khóa bằng khuôn mặt hoạt động tốt với 1Password để cung cấp bảo mật sinh trắc học cho người dùng bằng cách loại bỏ các cơ hội gian lận danh tính. Để thiết lập ứng dụng 1Password trên Pixel 4 Chỉ cần nhập chi tiết của bạn vào Tự động điền và sử dụng Mở khóa bằng khuôn mặt để đăng nhập thay vì chức năng Mở khóa bằng vân tay.

6. Độ chính xác cao hơn trong nhận dạng hình ảnh

Bằng cách ghép nối máy học với thiết bị với công nghệ phân loại hình ảnh, bạn có thể chọn thông tin chi tiết và nhận nó trong thời gian thực về hầu hết mọi thứ bạn gặp phải. Bạn có muốn đọc một văn bản bằng tiếng nước ngoài? Quét nó bằng điện thoại của bạn để dịch ngay lập tức và chính xác. Bạn đã chọn bộ sưu tập trí tưởng tượng của bạn hoặc mảnh đồ nội thất? Quét nó để biết thông tin về giá cả và nơi để mua nó. Có một món ăn mới hấp dẫn trong thực đơn nhà hàng? Bạn có thể sử dụng điện thoại của bạn để biết thành phần và thông tin dinh dưỡng của nó.

Bằng cách hỗ trợ nhận dạng hình ảnh theo thời gian thực, các ứng dụng như Google Lens, Calorie Mama và Leafsnap tăng khả năng sử dụng, học hỏi từ các thiết bị di động và nâng cao trải nghiệm người dùng.

Tiềm năng của máy học trên thiết bị là rất lớn. Với các thuật toán thông minh ngày càng hiệu quả, mạng lưới thần kinh sâu hơn và chip AI mạnh hơn, các ứng dụng di động học sâu sẽ là tiêu chuẩn trong ngân hàng, bán lẻ, chăm sóc sức khỏe, phân tích dữ liệu, công nghệ thông tin, truyền thông, không gian và nhiều ngành công nghiệp khác. Theo nghiên cứu thị trường được phê duyệt, thị trường học sâu toàn cầu có thể sẽ chạm mốc 26,64 tỷ USD vào năm 2026, với thị trường công nghệ chip học sâu đạt tới 2.9 Tỷ đô. Khi khả năng học tập sâu tiếp tục được cải thiện, các tính năng tiện dụng trên thiết bị di động sẽ phát triển song song và thúc đẩy nhiều sự đổi mới hơn.

Bạn nghĩ gì về việc sử dụng học tập sâu để cải thiện các thiết bị di động? Hãy cho chúng tôi biết trong các ý kiến ​​dưới đây hoặc trên Twitter, Facebook hoặc Mewe.