Tin tức và phân tích của tất cả các thiết bị di động

6 Những cách bạn có thể sử dụng học tập sâu để cải thiện việc sử dụng thiết bị di động

Bài viết này ban đầu được xuất bản trên M Liquido.com vào ngày 23 tháng 1 năm 2020 và được viết bởi Radosław Holewa.

Với nhu cầu toàn cầu ngày càng tăng đối với các trải nghiệm di động được cải thiện và cá nhân hóa hơn, AI rộng rãi và thích ứng học tập sâu trong ngành phát triển ứng dụng di động là không thể tránh khỏi. Hãy quên đi các vấn đề độ trễ bực bội phát sinh thông qua cảm biến di động và điện toán đám mây. Thời gian đáp ứng gần như bằng không với tốc độ quản lý thời gian thực cho kết quả tốt nhất.

Chipset điện thoại thông minh Bionic tiên tiến của Apple với các thiết bị xử lý thần kinh tích hợp giúp các mạng thần kinh hoạt động trực tiếp trên thiết bị với tốc độ đáng kinh ngạc. Với Core ML của Apple, nền tảng ML Kit của Google và các thư viện học sâu như TensorFlow Lite và Keras, các nhà phát triển di động có thể xây dựng các ứng dụng với thời gian phản hồi ít hơn, ít lỗi hơn và xử lý dữ liệu nhanh hơn.

Ưu điểm chính của học máy trên thiết bị là nó cung cấp cho người dùng trải nghiệm người dùng mượt mà và chính xác. Vì không có vấn đề gì khi gửi dữ liệu đến các máy chủ bên ngoài để xử lý, bạn sẽ được bảo vệ dữ liệu, bảo mật và quyền riêng tư của người dùng được cải thiện. Mạng thần kinh trên thiết bị di động cũng không yêu cầu kết nối Internet để truy cập tất cả các tính năng của ứng dụng của bạn. Tất nhiên, bạn vẫn sẽ cần internet cho hầu hết các tính năng tiêu chuẩn.

Việc sử dụng các khả năng tính toán cho các thiết bị di động để thực hiện các thuật toán học sâu đã cải thiện khả năng sử dụng của các thiết bị di động. Đây là cách thực hiện:

1. Nhận dạng giọng nói trên thiết bị

Nhận dạng giọng nói bao gồm chuyển đổi hoặc chuyển đổi trình tự thành chuỗi với các mạng thần kinh lặp đi lặp lại (RNNs), mạng thần kinh bên trong (CNN), mạng lưới thần kinh sâu (DNN) và các cấu trúc khác. Các nhà phát triển đã gặp sự cố về độ trễ – tạo ra sự chậm trễ giữa yêu cầu của bạn và phản hồi tự động – nhưng giờ đây chúng tôi có thể khắc phục chúng với sự trợ giúp của công nghệ RNN-T được nhúng trong thiết bị di động.

RNN-Ts là các mô hình trình tự. Thay vì làm theo phương pháp thông thường để xử lý một chuỗi đầu vào hoàn chỉnh trước khi tạo đầu ra, nó duy trì tính liên tục thống nhất trong quá trình xử lý luồng đầu vào và đầu ra. Điều này tạo điều kiện cho việc nhận dạng và xử lý giọng nói theo thời gian thực. Bạn thấy điều này với Google Assistant, Ai có thể xử lý các lệnh thoại liên tiếp mà không bị vấp và không yêu cầu bạn gọi "Xin chào, Google" sau mỗi yêu cầu.

Nó tạo ra một cuộc trò chuyện hai chiều tự nhiên hơn và trợ lý làm theo hướng dẫn của bạn cho T. Bạn có muốn thiết lập một chủ đề email, tìm một hình ảnh trong một trong các thư mục của bạn và hướng dẫn bạn đến địa điểm của chị bạn không? Thực hiện.

Bằng cách di chuyển với điện thoại Pixel 4 Mới từ Google và tính năng "Live Caption" có thể cung cấp bản dịch ghi chú thoại, podcast và video trong thời gian thực – và vì quá trình xử lý trên thiết bị – cũng ở chế độ máy bay. Vì vậy, ví dụ, nếu một video được hiển thị trên Twitter Tóm lại, bạn có thể xem tất cả các chú thích mà không cần phải tắt âm thanh. Live Caption chưa hoạt động với âm nhạc hoặc cuộc gọi điện thoại.

2. Tăng hiệu quả trong khi nhận ra cử chỉ

Sử dụng các mô hình quản lý học máy trên thiết bị, bạn có thể huấn luyện thiết bị di động của mình để phát hiện, theo dõi và nhận biết cử chỉ tay và cơ thể. Camera của thiết bị ghi lại và lưu trữ cử chỉ và chuyển động của bạn dưới dạng dữ liệu hình ảnh 3D. Sau đó, các thuật toán học sâu cho các mạng thần kinh sử dụng thư viện cử chỉ này để xác định và giải mã các cử chỉ tĩnh và động cụ thể. Sau đó, họ khớp chúng theo thời gian thực với ý định của bạn và thực hiện các đơn đặt hàng bạn muốn.

Google Pix 4 smartphones Nó đi kèm với chip Soli tạo điều kiện cho sự tương tác phức tạp và phi ngôn ngữ với điện thoại của bạn. Cảm biến radar mini trên đỉnh điện thoại này điều khiển công nghệ Motion Sense có thể phát hiện sự hiện diện của bạn và cử chỉ tay và cơ thể để cho phép tương tác điện thoại. Với một lần rửa tay, ngay cả khi không chạm vào điện thoại, bạn có thể bảo anh ấy tắt máy, tắt chuông báo thức hoặc chuyển đến bài hát tiếp theo trong danh sách phát của bạn.

3. Các khả năng sâu sắc hơn của thực tế tăng cường

Với sự giúp đỡ của ARCore và Google Apple Từ nền tảng ARKit, nhà phát triển có thể tạo các ứng dụng thực tế tăng cường có thể kết hợp các đối tượng và môi trường kỹ thuật số với các cài đặt thực tế. Khả năng sâu rộng của thực tế tăng cường có tác động rất lớn đến bán lẻ, giải trí, du lịch và các ngành công nghiệp khác. Các thương hiệu như Lacoste và Sephora hiện cho phép khách hàng của họ dùng thử hoặc xem trước các sản phẩm với các ứng dụng thực tế gia tăng và ngày càng nhiều người mua thích kiểm tra sản phẩm trên điện thoại của họ trước khi quyết định mua chúng.

Trò chơi thực tế tăng cường tương tác như Pokemon, Ingress và Ghostbuster World đã nhận được nhiều báo chí và theo dõi tận tình. Nếu bạn muốn tìm đường quanh thành phố, Google Maps Live View sẽ cung cấp cho bạn điều hướng theo thời gian thực.

Camera Leica Quad trên Huawei P30 Pro.

4. Hình ảnh chất lượng cao

Chất lượng hình ảnh cao là một tiêu chí quan trọng đối với người mua khi lựa chọn smartphones, Mà họ có thể nhận được với nhiều mô hình mới nhất. Chúng được trang bị các thành phần phần cứng – đơn vị xử lý trung tâm (CPU), bộ xử lý tín hiệu hình ảnh, thuật toán hình ảnh học sâu và đơn vị xử lý thần kinh – đã tăng vọt smartphones Trong một thế giới hoàn toàn khác biệt với máy ảnh truyền thống khi chụp ảnh. Với những smartphones Họ có thể hiển thị nhận thức nhiều hơn ở mức xếp hạng pixel của những gì họ thấy để chụp ảnh độ phân giải cao.

Điện thoại Google Pixel Apple IPhone sử dụng nhiều máy ảnh và thuật toán học máy tinh vi để xác định người và vật thể, tạo bản đồ độ sâu, liên tục nối các phơi sáng dài và tính toán cân bằng màu chính xác.

Bằng cách đào tạo các mạng thần kinh trong một tập hợp dữ liệu hình ảnh, các thuật toán học cách đáp ứng các yêu cầu hình ảnh riêng lẻ và tinh chỉnh hình ảnh trong thời gian thực. Hệ thống chỉnh sửa tự động được phát triển bởi các nhà nghiên cứu từ MIT và Google cho phép các nhiếp ảnh gia áp dụng các phong cách khác nhau cho hình ảnh trước khi chụp ảnh.

Sau khi lưới bên trong xử lý hình ảnh có độ phân giải thấp, phương pháp ánh xạ đã biết sẽ điều chỉnh để liên kết chuyển đổi màu với màu pixel. Lưới lưu trữ các định dạng biến đổi này trong lưới ba chiều, sau đó cho phép đầu ra từ hình ảnh có độ phân giải cao. Tất cả điều này xảy ra trong vòng một phần nghìn giây.

Điện thoại thông minh bây giờ cũng vượt trội so với máy ảnh DSLR trong điều kiện ánh sáng yếu và ban đêm. Bằng cách tích hợp mạng và cảm biến thần kinh sâu, máy ảnh điện thoại thông minh có thể chụp được hình ảnh rõ nét hơn với nhiều màu sắc hơn mắt người có thể nhìn thấy.

Huawei, đã tạo ra hình ảnh khả thi với P20 Pro, sử dụng bộ lọc RYYB, cảm biến lớn và hình ảnh AI trong sê-ri Mate 30 để cung cấp hình ảnh video chất lượng cao, ánh sáng yếu và ánh sáng yếu. Google Pixel đang đến 4 Với chế độ Tầm nhìn ban đêm có thể chụp ảnh trong phạm vi Lux 0.3-3 Và chụp ảnh thiên văn có thể chụp được bầu trời đầy sao đen. Ngoài chế độ ban đêm được kích hoạt tự động trong bóng tối, hệ thống Deep Fusion mới của Apple sẽ thích ứng với mức độ chiếu sáng và đưa nhiếp ảnh iPhone lên một mức ấn tượng hơn.

Ngay cả khi bạn không hiểu nhiếp ảnh, bạn có thể chụp những bức ảnh tuyệt vời với họ smartphones.

5. Tăng cường bảo mật và quyền riêng tư

Việc tuân thủ GDPR và Đạo luật bảo mật người tiêu dùng California (CCPA) được tạo điều kiện thuận lợi bằng học máy. Đảm bảo an toàn dữ liệu, vì bạn không cần phải tải lên sinh trắc học, mã hóa hoặc chú thích trực tiếp lên máy chủ hoặc đám mây để xử lý.

Mã hóa tự động trên thiết bị của bạn là một tính năng điện thoại thông minh hữu ích khác bảo vệ nội dung của bạn bằng mã PIN, mật khẩu hoặc mẫu và chỉ truy cập dữ liệu của bạn khi bạn mở khóa điện thoại. Vì vậy, nếu thiết bị của bạn bị mất hoặc bị đánh cắp, khả năng ai đó nhận được thông tin của bạn là không đáng kể.

Một ví dụ về trải nghiệm điện thoại thông minh an toàn hơn là Face ID cho iPhone. Mạng thần kinh trên thiết bị tại Apple Quản lý chip điện thoại thông minh một cách an toàn và lưu trữ dữ liệu khuôn mặt của người dùng. Nhận dạng được thực hiện trên thiết bị của bạn, vì vậy quyền riêng tư và bảo mật của bạn vẫn không giới hạn.

Mở khóa bằng khuôn mặt được sử dụng trong Google Pixel 4 Được hỗ trợ bởi chip Soli, đặt độ sâu 3D IR để tạo các mẫu khuôn mặt để nhận dạng khuôn mặt của bạn và lưu trữ trên chip bảo mật Titan M6 trên thiết bị. Mở khóa bằng khuôn mặt hoạt động tốt với 1Password để cung cấp bảo mật sinh trắc học cho người dùng bằng cách loại bỏ khả năng gian lận danh tính. Cách đặt ứng dụng 1Password thành Pixel 4 Chỉ cần nhập chi tiết của bạn vào Tự động điền và sử dụng Mở khóa bằng khuôn mặt để đăng nhập thay vì tính năng Mở khóa bằng vân tay.

6. Độ chính xác cao hơn trong nhận dạng hình ảnh

Bằng cách ghép nối máy học với thiết bị với công nghệ phân loại hình ảnh, bạn có thể chọn thông tin chi tiết và nhận thông tin theo thời gian thực về hầu hết mọi thứ bạn gặp phải. Bạn có muốn đọc một văn bản bằng tiếng nước ngoài? Quét nó bằng điện thoại của bạn để dịch ngay lập tức và chính xác. Bạn đã chọn bộ sưu tập tưởng tượng hoặc đồ nội thất của bạn? Quét nó để biết thông tin về giá và nơi để mua nó. Có một món ăn mới hấp dẫn trong thực đơn nhà hàng? Bạn có thể sử dụng điện thoại của bạn để biết thành phần và thông tin dinh dưỡng của nó.

Bằng cách hỗ trợ nhận dạng hình ảnh theo thời gian thực, các ứng dụng như Google Lens, Calorie Mama và Leafsnap tăng khả năng sử dụng, học hỏi từ các thiết bị di động và nâng cao trải nghiệm người dùng.

Tiềm năng học máy trên thiết bị là rất lớn. Với các thuật toán thông minh hiệu quả hơn bao giờ hết, mạng lưới thần kinh sâu hơn và chip AI mạnh hơn, việc học sâu các ứng dụng di động sẽ là tiêu chuẩn trong ngân hàng, bán lẻ, chăm sóc sức khỏe, phân tích dữ liệu, công nghệ thông tin, truyền thông, không gian và nhiều ngành công nghiệp khác. Theo nghiên cứu thị trường được phê duyệt, thị trường học sâu toàn cầu có thể sẽ chạm mốc 26,64 tỷ USD vào năm 2026, với thị trường công nghệ chip học sâu đạt tới 2.9 Hàng tỷ đô la. Khi năng lực học tập sâu tiếp tục được cải thiện, các tính năng tiện dụng trên thiết bị di động sẽ được phát triển song song và thúc đẩy nhiều sự đổi mới hơn.

Bạn nghĩ gì về việc sử dụng học tập sâu để cải thiện thiết bị di động? Hãy cho chúng tôi biết trong các ý kiến ​​dưới đây hoặc trên Twitter, Facebook hoặc Mewe.

Mục lục