Tin tức và phân tích của tất cả các thiết bị di động

Nhiệm vụ của thị giác máy tính là dạy máy móc nhìn giống con người

Thị giác máy tính là một môn học của trí tuệ nhân tạo cho phép máy móc nhìn thấy môi trường của chúng giống như con người. Nhìn và nhìn là những hành động khác nhau. Hành động nhìn cũng bao gồm việc nhận thức và hiểu hình ảnh. Mục đích không chỉ là nhận ánh sáng phản chiếu từ vật thể. Đây là công việc của mắt. Thùy chẩm của não, chịu trách nhiệm xử lý hình ảnh, xử lý và hiểu các vật thể nhìn thấy. Máy móc sử dụng camera làm mắt. Các mô hình thị giác máy tính xử lý hàng nghìn pixel trong hình ảnh để thực hiện nhiệm vụ của thùy chẩm. Nói tóm lại, nguyên tắc thị giác máy tính cho phép máy móc hiểu được những gì chúng nhìn thấy.

Thị giác máy tính là gì?

Thị giác máy tính (CV) là một môn học trí tuệ nhân tạo phát triển các kỹ thuật cho phép máy móc nhìn và hiểu thế giới xung quanh.

Thị giác máy tính rất quan trọng đối với sự đổi mới trong nhiều lĩnh vực công nghệ, bao gồm ô tô tự hành, nhận dạng khuôn mặt và thực tế tăng cường. Thị giác máy tính đã trở thành một trong những ngành AI quan trọng nhất hiện nay do sự gia tăng nhanh chóng của dữ liệu hình ảnh kỹ thuật số. Sự gia tăng dữ liệu trực quan cũng giúp việc huấn luyện các thuật toán thị giác máy tính trở nên dễ dàng hơn.

Nhận thức thị giác là kết quả của hàng triệu năm tiến hóa và là một trong những khả năng đáng tin cậy nhất của con người. Nhận thức trực quan là khả năng của một 5-trẻ 1 tuổi hiểu rằng đó là bàn ăn sau khi mô tả từng đồ vật trên bàn. Làm điều này cho máy móc là một thách thức to lớn và thị giác máy tính cố gắng cung cấp cho chúng khả năng này.

Thị giác máy tính cũng đóng một vai trò quan trọng trong việc đạt được mục tiêu của trí tuệ nhân tạo nói chung. Trí tuệ nhân tạo tổng hợp nhằm mục đích cung cấp cho máy móc tất cả khả năng của con người và hơn thế nữa. Tuy nhiên, điều này sẽ không thể thực hiện được nếu không bao gồm một tính năng quan trọng khác của trí thông minh của chúng ta, đó là khả năng hiểu các vật thể xung quanh chúng ta, nhanh chóng xác định chúng và đưa ra phản hồi chính xác.

Thị giác máy tính hoạt động như thế nào?

Thị giác máy tính sử dụng kỹ thuật xử lý hình ảnh từ nhỏ đến lớn. Nó bắt đầu bằng việc phát hiện và phân tích các tính năng đơn giản như pixel và màu sắc, sau đó là các tính năng phức tạp hơn như đường kẻ và vật thể.

Hiểu được cảm xúc và bối cảnh của hình ảnh là điều đơn giản đối với con người nhưng lại rất khó khăn đối với máy móc. Hãy tưởng tượng bạn đang nhìn vào một bức ảnh có nhiều người đang chạy. Mặc dù ảnh hiển thị hình ảnh tĩnh nhưng bạn có thể biết khi nào mọi người đang chạy. Đối với máy móc, hình ảnh chỉ là một tập hợp các pixel. Không giống con người, máy móc không thể hiểu được ngữ cảnh của hình ảnh và chỉ có thể cảm nhận được các pixel. Tầm nhìn máy tính cố gắng thu hẹp khoảng cách ngữ nghĩa trong phương trình này.

Khi tia sáng chiếu vào võng mạc của mắt chúng ta, các tế bào gọi là tế bào cảm quang sẽ chuyển đổi ánh sáng thành tín hiệu điện. Những tín hiệu điện này sau đó được gửi đến não thông qua dây thần kinh thị giác. Bộ não chuyển đổi những tín hiệu này thành hình ảnh. Quá trình này tiếp tục xử lý các tín hiệu điện đến não cho đến khi hình ảnh đủ rõ ràng. Vẫn chưa hiểu rõ chính xác cách não xử lý các tín hiệu này và biến chúng thành hình ảnh. Hơn nữa, làm thế nào bộ não thực hiện nhiều chức năng khác vẫn là một dấu hỏi lớn.

Không giống con người, máy móc không thể hiểu được ngữ cảnh của hình ảnh và chỉ có thể cảm nhận được các pixel. Tầm nhìn máy tính cố gắng thu hẹp khoảng cách ngữ nghĩa trong phương trình này.

Thị giác máy tính hoạt động với mạng lưới thần kinh và các thuật toán học máy khác mô phỏng bộ não con người. Các nhà nghiên cứu đã xuất sắc trong việc bắt chước các thuật toán cho bộ não con người và thậm chí đôi khi, họ có thể ngạc nhiên trước hành vi bất ngờ của các thuật toán mà họ tự tạo ra.

Những gì chúng ta biết là thị giác máy tính hoàn toàn là về nhận dạng mẫu. Các thuật toán sử dụng kỹ thuật học máy như học không giám sát được đào tạo để nhận dạng các mẫu trong dữ liệu trực quan. Nhiều hình ảnh cần được cung cấp thuật toán cho quá trình đào tạo.

Giả sử bạn muốn có một thuật toán để xác định chó trong ảnh. Nếu bạn sử dụng kỹ thuật học không giám sát thì không cần gắn thẻ ảnh nào cho AI trước. Thay vào đó, máy sẽ tìm hiểu những đặc điểm nhất định của loài chó sau khi phân tích hàng nghìn hoặc hàng triệu hình ảnh. Máy có thể phát hiện các đặc điểm xác định của động vật hoặc đồ vật. Mặc dù họ vẫn không biết tên của sự vật đó nhưng họ có thể xác định liệu một hình ảnh không được gắn nhãn có chứa nó hay không. Khi đó bạn có thể biết rằng thứ mà máy đã học được là một con chó, và con chó là một con vật. Học có giám sát tăng tốc quá trình đào tạo các thuật toán. Trong kỹ thuật này, hình ảnh được gắn thẻ và máy móc cũng tìm hiểu những gì chúng nhận ra.

Kỹ thuật thị giác máy tính

Mặc dù ứng dụng phần mềm nhận dạng hình ảnh có thể sử dụng một trong các kỹ thuật sau, nhưng các ứng dụng tiên tiến như ô tô tự lái có thể sử dụng đồng thời nhiều kỹ thuật sau:

  • Việc nhận dạng đối tượng kỹ thuật phát hiện một đối tượng cụ thể trong một hình ảnh. Phiên bản nâng cao có thể xác định nhiều đối tượng trong một hình ảnh.
  • Phân loại hình ảnh là kỹ thuật nhóm hình ảnh thành các danh mục. Nó còn được gọi là quá trình gán nhãn cho hình ảnh.
  • Phân đoạn hình ảnh là một kỹ thuật được sử dụng để kiểm tra một hình ảnh riêng biệt bằng cách chia nó thành nhiều phần.
  • Phát hiện mẫu xác định các mẫu và tính liên tục trong dữ liệu trực quan.
  • Phát hiện cạnh phát hiện các góc của vật thể để xác định các thành phần của hình ảnh tốt hơn.
  • So khớp tính năng là một kỹ thuật phát hiện mẫu phù hợp với những điểm tương đồng trong hình ảnh nhằm mục đích phân loại.

Các trường hợp sử dụng thị giác máy tính

Thị giác máy tính được sử dụng trong nhiều ngành công nghiệp ngày nay. Sử dụng công nghệ này, Instagram có thể tự động gắn thẻ mọi người trong ảnh, Apple nhóm ảnh và Adobe cải thiện chất lượng của hình ảnh được phóng to. Mặc dù đây là những ví dụ kỹ thuật số nhưng có rất nhiều ví dụ ứng dụng về thị giác máy tính trong thế giới vật lý. Chúng ta hãy xem xét kỹ hơn một số ứng dụng thị giác máy tính trong thế giới thực mà bạn có thể đã gặp:

Nhận dạng khuôn mặt

Một số trường hợp sử dụng tốt nhất của thị giác máy tính được thấy trong nhận dạng khuôn mặt. Nhận dạng khuôn mặt, đã trở nên phổ biến với iPhone X mô hình được phát hành bởi Apple vào năm 2017, đã trở thành tính năng tiêu chuẩn trên hầu hết smartphones Hôm nay.

Công nghệ nhận dạng khuôn mặt được sử dụng để nhận dạng con người, như trong Facebookngoài việc xác thực trên smartphones. Mặt khác, các cơ quan thực thi pháp luật trên toàn thế giới sử dụng công nghệ nhận dạng khuôn mặt để phát hiện những kẻ vi phạm pháp luật trong các chương trình phát video.

Xe tự lái không thể hoạt động nếu không có thị giác máy tính. Tuy nhiên, các phương tiện tự lái vẫn còn ở giai đoạn sơ khai và cần có nhiều R&D hơn để đưa chúng đi trên đường một cách an toàn.

Xe tự hành

Xe tự lái sử dụng thị giác máy tính để phân tích hình ảnh theo thời gian thực. Công nghệ này giúp xe tự lái hiểu được môi trường của chúng. Các công nghệ lái xe tự động vẫn còn ở giai đoạn sơ khai và cần có nhiều R&D hơn để đưa chúng đi trên đường một cách an toàn.

Xe tự lái không thể hoạt động nếu không có thị giác máy tính. CV cho phép xe tự hành xử lý dữ liệu trực quan trong thời gian thực. Thị giác máy tính tạo bản đồ 3D để nhận dạng và phân loại phương tiện và vật thể trong xe tự hành.

Các trường hợp sử dụng thị giác máy tính quan trọng khác trong lĩnh vực này là phát hiện phương tiện và làn đường cũng như phát hiện khoảng trống. Đúng như tên gọi, công cụ kỹ thuật này phát hiện các khu vực thoáng đãng xung quanh xe. Tính năng phát hiện phạm vi tự do rất hữu ích khi ô tô không người lái tiếp cận một phương tiện di chuyển chậm và cần chuyển làn.

Hình ảnh y tế

Thị giác máy tính được sử dụng trong lĩnh vực y tế để chẩn đoán và theo dõi tiến triển bệnh nhanh hơn, chính xác hơn. Các bác sĩ phát hiện các triệu chứng ban đầu của các bệnh vô hình như ung thư bằng cách sử dụng mô hình phát hiện mẫu.

Phân tích hình ảnh y tế bằng thị giác máy tính giúp rút ngắn thời gian cho các chuyên gia y tế phân tích hình ảnh. Nội soi, chụp X-quang, siêu âm và chụp cộng hưởng từ (MRI) là một số ngành hình ảnh y tế sử dụng thị giác máy tính.

Bằng cách ghép nối mạng lưới thần kinh tích chập với hình ảnh y tế, các chuyên gia y tế có thể quan sát các cơ quan nội tạng, phát hiện những bất thường và hiểu nguyên nhân cũng như hậu quả của một số bệnh. Nó còn giúp bác sĩ theo dõi diễn biến của bệnh và tiến độ điều trị.

Kiểm soát nội dung

Mạng truyền thông xã hội cần xem xét hàng triệu bài đăng mới mỗi ngày. Việc có nhóm kiểm duyệt nội dung xem xét mọi hình ảnh hoặc video được đăng không còn thực tế nữa, vì vậy hệ thống thị giác máy tính được sử dụng để tự động hóa quy trình. Thị giác máy tính giúp các nền tảng truyền thông xã hội phân tích nội dung được tải lên và gắn cờ những nội dung có chứa hình ảnh phản cảm. Các công ty cũng sử dụng thuật toán deep learning để phân tích văn bản nhằm xác định và chặn các bài đăng có chứa văn bản xúc phạm.

Giám sát

Nguồn cấp dữ liệu video là một dạng bằng chứng vững chắc. Chúng giúp phát hiện những kẻ vi phạm pháp luật và giúp các chuyên gia bảo mật hành động trước khi những mối lo ngại nhỏ trở thành thảm họa. Con người gần như không thể theo dõi đoạn phim giám sát từ nhiều nguồn, nhưng đó là một nhiệm vụ dễ dàng đối với thị giác máy tính. Hệ thống giám sát hỗ trợ thị giác máy tính có thể quét hình ảnh trực tiếp và phát hiện hành vi đáng ngờ.

Nhận dạng khuôn mặt có thể được sử dụng để xác định tội phạm bị truy nã và do đó ngăn ngừa tội phạm. Kỹ thuật nhận dạng đối tượng mà chúng tôi đề cập ở trên có thể phát hiện người mang theo vật nguy hiểm ở khu vực đông người. Kỹ thuật này cũng được sử dụng để xác định số lượng chỗ đậu xe có sẵn trong thành phố thông minh.