Tin tức và phân tích của tất cả các thiết bị di động

Hiểu máy học là gì và nó hoạt động như thế nào

học máy và trí tuệ nhân tạo

Bạn đã bao giờ tự hỏi làm thế nào dịch vụ phát trực tuyến của bạn biết được bộ phim nào bạn muốn xem tiếp theo chưa? Hoặc bộ lọc email của bạn tách biệt các thư quan trọng khỏi biển quảng cáo lộn xộn như thế nào? Câu trả lời nằm ở một khái niệm công nghệ mạnh mẽ đang âm thầm định hình lại thế giới của chúng ta, Học máy. Trong thế giới này, các thuật toán học hỏi từ dữ liệu, dự đoán kết quả, đưa ra quyết định và thậm chí bắt chước hành vi của con người.

Đường dẫn nhanh:

Từ những quảng cáo được cá nhân hóa mà bạn nhìn thấy trực tuyến đến những chiếc ô tô tự lái trong tương lai gần, học máy là động lực vô hình đang thúc đẩy chúng ta hướng tới một kỷ nguyên mới đầy thú vị của trí tuệ nhân tạo. Chính khoa học mang tính đột phá đang làm thay đổi các ngành công nghiệp. Nếu bạn muốn tìm hiểu chính xác machine learning là gì và hơn thế nữa về lĩnh vực trí tuệ nhân tạo (AI) tập trung vào phát triển các thuật toán và mô hình thống kê. Hướng dẫn nhanh này sẽ giải thích cách máy tính thực hiện các tác vụ mà không được lập trình rõ ràng để thực hiện việc đó. Về cơ bản, hệ thống máy học được thiết kế để học hỏi và cải thiện kinh nghiệm.

Học máy là gì?

Có ba loại học máy chính:

Học tập có giám sát

Trong học có giám sát, mô hình được cung cấp dữ liệu huấn luyện được dán nhãn. Một thuật toán được sử dụng để tìm hiểu mối quan hệ giữa các tính năng đầu vào (hoặc thuộc tính) và đầu ra (hoặc nhãn). Sau khi mô hình được đào tạo, nó có thể dự đoán đầu ra cho dữ liệu mới, chưa được nhìn thấy. Ví dụ về học có giám sát bao gồm các vấn đề hồi quy và phân loại, chẳng hạn như dự đoán giá nhà hoặc xác định xem email có phải là thư rác hay không.

Học không giám sát

Trong học tập không giám sát, mô hình không được cung cấp dữ liệu được gắn nhãn và nó phải tự tìm các mẫu và mối quan hệ trong dữ liệu. Ví dụ về học tập không giám sát bao gồm phân cụm (trong đó mục tiêu là nhóm các trường hợp tương tự lại với nhau) và phát hiện bất thường (trong đó mục tiêu là phát hiện các trường hợp bất thường).

Học tăng cường

Trong học tăng cường, một tác nhân học cách ứng xử trong môi trường bằng cách thực hiện các hành động và nhận phần thưởng hoặc hình phạt. Mục tiêu là tìm hiểu một chính sách, đó là một chiến lược xác định hành động nào mà tác nhân nên chọn ở mỗi trạng thái.

Học máy có nhiều ứng dụng, từ các hệ thống đề xuất (như các hệ thống được sử dụng bởi Netflix hoặc Amazon) đến nhận dạng giọng nói, nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên và xe tự lái.

Học máy hoạt động như thế nào?

Học máy hoạt động bằng cách sử dụng thuật toán để phân tích dữ liệu, học hỏi từ dữ liệu đó và sau đó đưa ra quyết định hoặc dự đoán. Dưới đây là giải thích đơn giản về các bước liên quan:

  • Bộ sưu tập ngày: Bước đầu tiên trong quy trình học máy là thu thập dữ liệu sẽ huấn luyện mô hình. Dữ liệu này có thể đến từ nhiều nguồn khác nhau và có thể bao gồm văn bản, hình ảnh, số, v.v. Tùy thuộc vào vấn đề hiện tại, các loại dữ liệu khác nhau có thể được yêu cầu.
  • Chuẩn bị ngày: Dữ liệu được thu thập sau đó sẽ được chuẩn bị để xử lý. Điều này có thể bao gồm việc làm sạch dữ liệu để loại bỏ nhiễu và lỗi, xử lý dữ liệu bị thiếu và chuyển đổi dữ liệu sang định dạng mà thuật toán học máy có thể xử lý. Bước này thường được gọi là tiền xử lý dữ liệu.
  • fKhai thác trang phục: Đặc điểm là những đặc tính hoặc đặc điểm riêng lẻ có thể đo lường được của hiện tượng đang được quan sát. Đây là các biến đầu vào cho mô hình của chúng tôi. Trích xuất tính năng liên quan đến việc chuyển đổi dữ liệu thô thành một tập hợp các tính năng thể hiện vấn đề tốt hơn cho mô hình dự đoán. Ví dụ: đối với một email, các tính năng có thể là các từ trong văn bản, độ dài của email, thời gian gửi, v.v.
  • Đào tạo người mẫu: Một mô hình học máy được đào tạo bằng cách cung cấp dữ liệu cho nó. Trong học có giám sát, mô hình được cung cấp đầu vào cùng với đầu ra chính xác và mô hình học bằng cách so sánh đầu ra thực tế của nó với đầu ra chính xác để tìm ra lỗi. Sau đó, nó thay đổi cách tiếp cận (tức là cập nhật các tham số) để cải thiện. Trong học tập không giám sát, mô hình không được cung cấp kết quả đầu ra chính xác và cần tự mình tìm ra các mẫu và mối quan hệ trong dữ liệu.
  • Sự đánh giá: Sau khi mô hình đã được huấn luyện, điều quan trọng là phải đánh giá hiệu suất của nó. Điều này thường được thực hiện bằng cách sử dụng một bộ dữ liệu khác (dữ liệu thử nghiệm) mà mô hình chưa từng thấy trước đây. Các số liệu đánh giá phổ biến bao gồm độ chính xác, độ chính xác, khả năng thu hồi và điểm F1 cho các vấn đề phân loại và sai số tuyệt đối trung bình, sai số bình phương trung bình và bình phương R cho các vấn đề hồi quy.
  • Điều chỉnh và tối ưu hóa: Khi mô hình đã được đánh giá, có thể cần phải điều chỉnh và tối ưu hóa các tham số của nó để cải thiện hiệu suất. Quá trình này được gọi là điều chỉnh siêu tham số.
  • sự dự đoán: Sau khi đào tạo, đánh giá và tối ưu hóa mô hình, mô hình có thể được sử dụng để đưa ra dự đoán về dữ liệu mới, chưa được nhìn thấy.

Điều đáng chú ý là học máy là một quá trình lặp đi lặp lại. Ngay cả sau khi một mô hình đã được triển khai, nó có thể cần được cập nhật và đào tạo lại khi có dữ liệu mới.

Học máy có phải là trí tuệ nhân tạo?

Đúng, học máy (ML) là một tập hợp con của trí tuệ nhân tạo (AI). AI là một thuật ngữ rộng dùng để chỉ máy móc hoặc phần mềm bắt chước trí thông minh của con người, nhằm mục đích tái tạo quá trình suy nghĩ, ra quyết định và hành động của con người. AI bao gồm nhiều công nghệ và kỹ thuật, chẳng hạn như hệ thống dựa trên quy tắc, hệ thống chuyên gia và robot.

Mặt khác, học máy thì cụ thể hơn. Đó là một cách tiếp cận AI bao gồm việc phát triển các thuật toán cho phép máy móc học hỏi và đưa ra quyết định hoặc dự đoán dựa trên dữ liệu. Thay vì được lập trình rõ ràng để thực hiện một nhiệm vụ, hệ thống máy học được thiết kế để phân tích và học hỏi từ dữ liệu, sau đó sử dụng kiến ​​thức đã học được để đưa ra quyết định.

Trong những năm gần đây, học máy đã trở thành một trong những lĩnh vực quan trọng và có ảnh hưởng nhất của AI nhờ khả năng xử lý các bộ dữ liệu lớn, phức tạp cũng như khả năng học hỏi và cải thiện theo thời gian. Đó là công nghệ đằng sau nhiều ứng dụng quen thuộc, bao gồm các hệ thống đề xuất (như những ứng dụng được Netflix và Amazon), hệ thống nhận dạng giọng nói (như Siri và Alexa) và hệ thống nhận dạng hình ảnh (như hệ thống được Google Photos sử dụng).

Chính quy hóa trong học máy là gì?

Chính quy hóa là một kỹ thuật được sử dụng trong học máy để ngăn chặn tình trạng trang bị quá mức, đó là tình huống mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu không nhìn thấy (dữ liệu kiểm tra). Quá khớp thường xảy ra khi một mô hình quá phức tạp, chẳng hạn như có quá nhiều tham số so với số lượng quan sát. Một mô hình quá phù hợp sẽ học dữ liệu huấn luyện quá tốt, đến mức nó không chỉ nắm bắt được các mẫu cơ bản mà còn cả nhiễu và các ngoại lệ trong dữ liệu.

Chính quy hóa giải quyết tình trạng trang bị quá mức bằng cách thêm một số hạng phạt vào hàm mất mát mà thuật toán tối ưu hóa. Hình phạt này không khuyến khích các mô hình quá phức tạp bằng cách tăng lỗi huấn luyện của chúng một cách hiệu quả.

Có một số loại chính quy hóa, nhưng hai loại phổ biến nhất là chính quy L1 và L2:

Chính quy hóa L1 (Hồi quy Lasso): Hình phạt là giá trị tuyệt đối của độ lớn của các hệ số. Điều này có thể dẫn đến một số hệ số bị thu nhỏ về chính xác bằng 0, tương đương với việc tính năng tương ứng bị loại khỏi mô hình.

Chính quy hóa L2 (Hồi quy sườn): Hình phạt là bình phương độ lớn của các hệ số. Điều này có xu hướng trải đều các giá trị hệ số ra đồng đều hơn và không giống như chính quy hóa L1, nó không buộc các hệ số về 0.

Trong cả hai trường hợp, mức độ chính quy cần áp dụng đều được kiểm soát bởi siêu tham số. Chính quy hóa là một hình thức đánh đổi độ lệch-phương sai: tăng cường độ chính quy hóa sẽ làm tăng độ lệch của mô hình nhưng làm giảm phương sai của nó. Mức độ chính quy hóa tốt nhất (nghĩa là giá trị tốt nhất của siêu tham số) thường được tìm thấy thông qua xác thực chéo.

Nếu bạn muốn tìm hiểu thêm về trí tuệ nhân tạo, hãy chuyển sang bài viết trước của chúng tôi để tìm hiểu sâu hơn về AI là gì và nó đang định hình thế giới như thế nào.

Tuyên bố từ chối trách nhiệm: Một số bài viết của chúng tôi bao gồm các liên kết liên kết. Nếu bạn mua thứ gì đó thông qua một trong những liên kết này, APS Blog có thể kiếm được hoa hồng liên kết. Tìm hiểu về Chính sách tiết lộ của chúng tôi.