Tin tức và phân tích của tất cả các thiết bị di động

11 tài nguyên học máy và khoa học dữ liệu tốt nhất

Dữ liệu là dầu mới. Và học máy là lửa. Bất cứ ai kiểm soát hai điều này sẽ kiểm soát thế giới.

Không, ở trên không phải là một cụm từ khoa trương lấy từ một cuốn tiểu thuyết đen tối.

Đó là thực tế.

Trật tự thế giới mới xoay quanh việc thu thập lượng dữ liệu khổng lồ có liên quan và xử lý dữ liệu đó thành những hiểu biết có thể hành động – điều mà nhân loại đã không thể làm được trong lịch sử. Đó là loại công nghệ cho phép một quốc gia vượt qua các quốc gia khác và cuối cùng là thống trị thế giới.

Kết quả là, các quốc gia tiến bộ trên thế giới rất coi trọng vấn đề này.

Một sự lựa chọn nghề nghiệp hấp dẫn

Bên cạnh âm mưu quốc tế, khoa học dữ liệu và học máy là một lĩnh vực mới hấp dẫn với những cơ hội tuyệt vời. Nhu cầu nằm ngoài bảng xếp hạng (nói một cách nhẹ nhàng) và không có đủ nhà khoa học dữ liệu. Thậm chí trung bình.

Nó giống như việc chúng ta đột nhiên phát hiện ra rất nhiều hành tinh mới có thể ở được và không có đủ người để di chuyển chúng. Tôi có thể nói chuyện và nghe như một bản thu âm bị hỏng, nhưng tôi nghĩ đồ họa thông tin này hoạt động tốt hơn nhiều:

Nguồn: insidebigdata.com

Vì vậy, chúng tôi thấy rằng mức lương bắt đầu từ 50.000 đô la trở lên và đối với các nhà quản lý, họ có thể cao hơn 250.000 đô la.

Và không chỉ vậy, một người bình thường trên hành tinh này sẽ tạo ra 1,7 MB dữ liệu mỗi giây. Đó là hơn 3500 TB dữ liệu trong suốt vòng đời của nó – nhiều dữ liệu hơn chúng ta hiện biết cách xử lý, chưa nói đến việc sử dụng để phân tích. Nói rằng tương lai tươi sáng sẽ là một điều bất lợi cho đồng cỏ mới tuyệt vời này.

Khoa học dữ liệu và học máy có khó không?

Câu hỏi hay!

Theo kinh nghiệm của tôi, câu trả lời là có và không.

Trí tuệ nhân tạo (và nói rộng ra là học máy) là điều khó thực hiện nhất nếu bạn muốn nghiên cứu và vượt qua giới hạn. Thậm chí là bằng tiến sĩ cho công việc này. trong khoa học máy tính và toán học là không đủ. Nhưng người bình thường không có tham vọng cũng như thời gian cho những mục tiêu như vậy.

Mặt khác là cái mà tôi gọi là Khoa học dữ liệu ứng dụng và Học máy.

Điều này có nghĩa là bạn sử dụng các công cụ, kỹ thuật và thuật toán hiện có và áp dụng chúng để giải quyết một số vấn đề trong thế giới thực. Phần này đòi hỏi sự cống hiến, nhận thức và tư duy sáng tạo (và biết một vài khái niệm toán học đơn giản có thể học nhanh chóng), nhưng khi nói đến kiến ​​thức “kỹ thuật” thực sự, nó nhẹ nhàng hơn nhiều so với công việc của một kỹ sư phần mềm.

Nói cách khác, đó không phải là một miếng bánh dễ dàng, nhưng tuân thủ tỷ lệ phần thưởng trên nỗ lực là một trong những khoản đầu tư tốt nhất hiện có.

Giờ đây, bạn đã mài giũa quyết tâm trở thành nhà khoa học dữ liệu và kỹ sư máy học, hãy bắt đầu khám phá các tùy chọn tốt nhất hiện có.

Máy học (Google)

Ít người nhận ra điều này, nhưng Google có một khóa học mở rộng, rất thực tế và miễn phí về Machine Learning. Theo công ty, đây là một phần trong cam kết của họ trong việc thúc đẩy công nghệ AI/ML và mở rộng kiến ​​thức.

Điều tốt nhất về khóa học này là không có điều kiện tiên quyết, nhưng hãy sẵn sàng dành thêm thời gian để tự mình khám phá các khái niệm thống kê.

Ý tôi là, nó không cần thiết, nhưng nếu bạn không có bất kỳ nền tảng nào về thống kê nâng cao, những giải thích trong khóa học này có thể không đủ. Một điểm hấp dẫn khác là khóa học này giới thiệu về máy học thông qua Tensor Flow, đây là một triển khai ML do Google phát triển. Theo một cách nào đó, Google đang hướng tới việc quảng bá các API máy học của mình, nhưng với giá trị mà khóa học này mang lại, tôi không thấy điều đó sẽ gây trở ngại như thế nào.

Nếu có, TensorFlow là một trong những cách dễ dàng để tiếp cận ML và cực kỳ phổ biến (để so sánh các khung AI, xem tại đây).

Khoa học dữ liệu

Cái tên Harvard truyền cảm hứng cho sự ngưỡng mộ, khóa học này cũng vậy.

Đầu tiên, đây không phải là khóa học “hãy bắt đầu nhanh chóng” trong đó bạn lướt qua máy học bằng cách viết một đoạn mã hoặc đoạn mã ở đây. Khóa học này là một lễ rửa tội nặng nề đòi hỏi sự chăm chỉ và đầu tư thời gian đáng kể.

Khóa học bao gồm các video, mã miễn phí (được lưu trữ trên GitHub) và các giải pháp cho các bài tập trong phòng thí nghiệm, vì vậy bạn thực sự có thể tự do thực hiện.

Khán giả lý tưởng?

Bạn… tôi không đùa đâu.

Tôi muốn nói rằng các chuyên gia đang làm việc có nền tảng toán học khá, mặc dù họ có thể không còn hứng thú với toán học (thói quen suy luận và chứng minh cần thiết nhất). Nhưng một lần nữa, hãy lưu ý: bạn có thể nghĩ rằng mình giỏi, nhưng khóa học này sẽ giống như những chiếc đinh đóng chai cho bữa sáng – các bài tập đủ khó để khiến bạn phát khóc, nhưng mặt khác, đây có thể chính là thứ bạn đang tìm kiếm vì.” Tôi đang tìm!

học máy

Bước vào một quán bar đầy những nhà khoa học dữ liệu và hỏi Andrew Ng là ai và bạn sẽ có được nhịp đập của cuộc đời mình.

Trong giới khoa học dữ liệu và máy học, Andrew Ng đã đạt được vị thế thần thánh với khóa học độc đáo của mình trên Coursera – Machine Learning.

Và nếu bạn nghi ngờ về thông tin đăng nhập của Andrew Ng, tôi sẽ để điều này tự nói lên:

Đây là khóa học trả phí vì nó là một phần trong kế hoạch định giá của Coursera, nhưng cam kết và quyết tâm về tài chính không phải là điều kiện tiên quyết duy nhất. Đây là một khóa học dài khi Andrew đi sâu vào toán học đằng sau tất cả mọi thứ về ML và phân tích các thuật toán phổ biến. Nhưng may mắn thay, đó là một khóa học hoàn chỉnh và bạn sẽ được hướng dẫn từng bước vào vực sâu tăm tối nhất và được đưa trở lại.

Tôi đánh giá cao nó, chủ yếu là vì phô trương chứng nhận khóa học này đã trở thành một điều ngày nay!

Khoa học dữ liệu ứng dụng

Các chuyên ngành trên Coursera bao gồm một loạt các khóa học được thiết kế để đi từ con số 0 đến thành thạo một khái niệm cụ thể. Nếu bạn đang tìm kiếm một khóa học hoàn chỉnh, nghiêm túc nhưng thân thiện về Khoa học dữ liệu và Học máy bằng Python, tôi không thể đề xuất chuyên môn này đủ cao.

Vào cuối khóa học, bạn nhận được một chứng chỉ.

Trại dữ liệu

DataCamp cung cấp nhiều khóa học về phân tích dữ liệu, cũng bao gồm một số kỹ năng và con đường sự nghiệp. Từ thao tác dữ liệu đến học máy, bạn sẽ đạt được các kỹ năng xây dựng nghề nghiệp về khoa học dữ liệu bằng Python và R, những kỹ năng này sẽ giúp bạn thành công trong lĩnh vực khoa học dữ liệu.

Với nội dung DataCamp có kích thước bằng byte, bạn có thể học theo tốc độ của riêng mình. Các khóa học này cung cấp kinh nghiệm thực hành để giúp bạn phát triển kỹ năng phân tích dữ liệu của mình.

Bạn có thể bắt đầu với phiên bản miễn phí và đánh giá khóa học bằng cách xem chương đầu tiên.

edX

Học hỏi từ MITx, Harvardx, IBM, RICEx, UCsanDiegox và GTx trên nền tảng edX.

Tất cả đều có một chương trình giảng dạy toàn diện để giúp bạn thành thạo các kỹ năng khoa học dữ liệu của mình. Các chương trình này phù hợp nhất với những người có nền tảng về thống kê hoặc khoa học máy tính.

Nếu bạn không tìm kiếm một chương trình, bạn có thể gọi món. Trên edX, bạn sẽ tìm thấy hơn 200 khóa học về khoa học dữ liệu bao gồm Python, R, Excel, Xác suất, Thống kê, Học máy, Trực quan hóa dữ liệu, v.v.

Học viện mã hóa

Codecademy là một nền tảng khác là một trong những hệ thống tốt nhất giúp bạn học lập trình. Họ tin vào việc “vừa học vừa làm” và có rất nhiều dự án thực hành cũng như bài kiểm tra trên nền tảng của họ.

Khóa học về khoa học dữ liệu do Codecademy cung cấp bao gồm SQL, Python 3NumPy, Pandas, Matplotlib, Scikit-learning và nhiều thư viện khác.

Toàn bộ con đường sự nghiệp bao gồm 26 khóa học là quá đủ để giúp bạn trở thành một nhà khoa học dữ liệu thành công.

Khóa học dữ liệu này:

  • Nó cung cấp kiến ​​thức chuyên sâu về khoa học dữ liệu
  • Cung cấp một bản đồ đường dễ theo dõi
  • Nó giúp bạn sẵn sàng hành động bằng cách giúp bạn có đủ kinh nghiệm thực hành

Chúng tôi sẽ

Udemy không cần giới thiệu.

Python cho Data Science và Machine Learning Bootcamp trên Udemy là một trong những khóa học phổ biến nhất với hơn 85.000 xếp hạng 4,6với hơn 370.000 người tham dự sinh viên trên toàn thế giới.

Dưới đây là các chủ đề được đề cập trong khóa học này:

Dưới đây là các tính năng / phân phối của khóa học này:

  • 25 giờ video theo yêu cầu
  • Truy cập trọn đời
  • 13 bài báo và năm tài nguyên có thể tải xuống
  • Truy cập qua điện thoại di động và TV
  • Giấy chứng nhận hoàn thành
  • Đảm bảo hoàn tiền trong 30 ngày

Vì vậy, nếu bạn thích một khóa học ngân sách, tốt nhất là bạn nên bắt đầu.

Google trí tuệ nhân tạo

Bạn có quan tâm đến việc học máy học từ các chuyên gia ML của Google không?

Chà, vậy thì bạn phải kiểm tra tỷ lệ cược trên Trí tuệ nhân tạo của Google.

Nền tảng này cung cấp các khóa học và nội dung về học máy và khoa học dữ liệu cho sinh viên, kỹ sư phần mềm, nhà khoa học dữ liệu và thậm chí cả các nhà nghiên cứu. Các khóa học này là miễn phí.

Để bắt đầu, Google AI Machine Learning Fallout Course nên là khóa học chính của bạn. Đây là một khóa học nhanh với phần giới thiệu thực tế về cách sử dụng API TensorFlow. Dưới đây là thông tin chi tiết về khóa học này:

Nền tảng này cũng có các khóa học đặc biệt về các chủ đề quan trọng của máy học như phân cụm, hệ thống đề xuất, kiểm tra và gỡ lỗi máy học, phân tách dữ liệu và kỹ thuật tính năng máy học. Nếu bạn đã biết kiến ​​thức cơ bản về học máy, các khóa học này sẽ là một giá trị gia tăng.

sự táo bạo

Udacity cũng là một nền tảng học trực tuyến rất phổ biến, cung cấp rất nhiều khóa học về các công nghệ phổ biến. Nó có một số chương trình đầu ngành được xây dựng và công nhận bởi các công ty hàng đầu trên thế giới, chẳng hạn như AT&T, AWS, Google, IBM.

Một trong những chương trình tại Udacity là Khoa học dữ liệu – School of Data Science. Chương trình này giúp bạn tạo các công việc về nhà khoa học dữ liệu, nhà khoa học dữ liệu, kỹ sư dữ liệu và nhà phân tích kinh doanh. Khóa học Nhà khoa học dữ liệu trong chương trình này là khóa học chính bao gồm các khái niệm về học máy, học sâu và công nghệ phần mềm. Bạn phải có hiểu biết cơ bản về học máy để chọn khóa học này.

Nếu bạn đã quen thuộc với lập trình Python nhưng chưa quen với học máy, thì có một chương trình khác trên Udacity – Trường học AI. Chương trình này bao gồm các khóa học bắt đầu với kiến ​​thức cơ bản về máy học.

Học kĩ càng

Khóa học này là một điều may mắn và là đề xuất yêu thích của tôi trong danh sách này nếu bạn là nhà phát triển.

Tôi xin nói lại: nếu bạn là một lập trình viên.

Đó là bởi vì khóa học này không dành thời gian để học những kiến ​​thức cơ bản về lập trình. Mô tả khóa học nói rất rõ ràng (nhấn mạnh là bản gốc):

Chúng tôi giả định rằng mỗi người tham gia khóa học này đều có ít nhất một năm kinh nghiệm viết mã. Khóa học sử dụng Python làm ngôn ngữ giảng dạy, vì vậy nếu bạn chưa biết về nó, chúng tôi cho rằng bạn sẽ dành thời gian để học nó – đối với một nhà phát triển có kinh nghiệm, bạn sẽ thấy rằng Python là một ngôn ngữ khá dễ học.

Vì vậy, nếu bạn đã biết Python (nếu bạn không tìm hiểu ở đây) hoặc nhanh chóng cảm thấy thoải mái, thì đây là khóa học hoàn hảo cho những người thực dụng muốn xây dựng các hệ thống thực, có thể sử dụng được mà không phải lo lắng quá nhiều về nền tảng lý thuyết của các thuật toán.

Tôi thậm chí có thể nói nó dành cho những người tự làm thiếu kiên nhẫn (như tôi!), những người ghét lễ nghi và sự đơn điệu.

Và ồ, tôi đã đề cập đến việc nó miễn phí 100% và có một cộng đồng tuyệt vời chưa?!

Đăng kí

Phù!

Đây là một danh sách khó để biên dịch. Không phải vì không có đủ nguồn tốt, mà vì có quá nhiều!

Học máy là một lĩnh vực đã bùng nổ theo đúng nghĩa đen và giải quyết các vấn đề khó một cách thực sự tao nhã, đó là lý do tại sao có hàng trăm khóa học trực tuyến, miễn phí và trả phí, hầu hết đều thực sự rất tốt. Nhưng nó cũng có thể là một nguyên nhân gây nhầm lẫn, vì vậy tôi đã cố gắng rút gọn nó xuống còn mười một cho các loại sinh viên khác nhau tùy thuộc vào mức độ kinh nghiệm của họ.

Hy vọng nó đã giúp!