Tin tức và phân tích của tất cả các thiết bị di động

GTC 2023 của Nvidia cho thấy khoa học dữ liệu quan trọng như thế nào đối với các công nghệ trong tương lai

Tuần này, Nvidia đã vạch ra chiến lược phát triển thế hệ máy tính tiếp theo. Hội nghị Công nghệ Đồ họa Nvidia (GTC) chứng kiến ​​Giám đốc điều hành Jensen Huang tiết lộ nhiều công nghệ mà ông tuyên bố sẽ thúc đẩy làn sóng AI và thế giới thực tế ảo trong tương lai.

Mặc dù Hội nghị Công nghệ GPU của Nvidia, thường được gọi là GTC, được tổ chức trực tuyến trong năm nay, nó vẫn đưa ra những tin tức thú vị. Bài phát biểu quan trọng của Giám đốc điều hành Nvidia Jensen Huang là điểm nhấn chính của sự kiện. Vậy, hàng hóa mới nhất là gì và chúng liên quan như thế nào đến khoa học dữ liệu?

Tại Nvidia GTC 2022, công ty đã tiết lộ kiến ​​trúc GPU Hopper và GPU Hopper H100 thế hệ tiếp theo cùng một chip trung tâm dữ liệu mới tích hợp GPU với CPU hiệu suất cao, được mệnh danh là “Grace CPU Superchip” và tất nhiên là Nvidia Omniverse .

“GPU phễu” Nvidia H100

Nvidia đang tung ra một loạt tính năng Hopper mới và nâng cao. Tuy nhiên, điểm nhấn vẫn là các mô hình máy biến áp, đã trở thành kỹ thuật học máy được lựa chọn cho nhiều ứng dụng và các mô hình nguồn như GPT-3 và asBERT có thể là quan trọng nhất.

“GPU phễu” Nvidia H100

Transformer Engine mới trong chip H100 hứa hẹn sẽ tăng tốc độ học mô hình lên tới sáu lần. Bởi vì kiến ​​trúc mới này kết hợp NVLink của Nvidia Switch Công nghệ liên kết nhiều nút, các cụm máy chủ lớn được cung cấp bởi các chip này sẽ có thể mở rộng quy mô để hỗ trợ các mạng khổng lồ với ít chi phí hơn.

Lõi Tensor của khách hàng, có thể xử lý độ chính xác lên tới 16 bit trong khi vẫn duy trì độ chính xác, được sử dụng trong Transformer Engine mới.

CPU Nvidia Grace

Nvidia GPU Superchip là bước đột phá đầu tiên của Nvidia vào thị trường CPU trung tâm dữ liệu. Theo rò rỉ của Intel, chip dựa trên Arm sẽ có 144 lõi đáng kinh ngạc và băng thông bộ nhớ 1 terabyte mỗi giây. Nó kết hợp hai CPU Grace được kết nối thông qua kết nối NVLink của Nvidia, có thể so sánh với AppleKiến trúc M1 Ultra của

CPU mới, được hỗ trợ bởi RAM LPDDR5X nhanh, dự kiến ​​sẽ xuất hiện vào nửa đầu năm 2023 và sẽ mang lại hiệu suất gấp đôi so với các máy chủ trước đó. Nvidia hy vọng con chip này sẽ đạt điểm chuẩn 740 trên điểm chuẩn SPECrate®2017_int_base, so với các bộ xử lý trung tâm dữ liệu cao cấp của AMD và Intel.

Công ty đang hợp tác với “các khách hàng HPC, siêu máy tính, siêu quy mô và đám mây hàng đầu”, ngụ ý rằng các hệ thống này sẽ có thể truy cập được trên nhà cung cấp đám mây gần bạn.

Nvidia Omniverse là gì?

Tại GTC 2022Nvidia đang phát hành Omniverse Cloud, một bộ dịch vụ đám mây cho phép các nghệ sĩ, người sáng tạo, kiến ​​trúc sư và nhà phát triển cộng tác trên thiết kế và mô phỏng 3D từ bất kỳ thiết bị nào.

Nucleus Cloud, phần mềm chia sẻ chỉ bằng một cú nhấp chuột để cộng tác, được bao gồm trong danh mục dịch vụ của Omniverse Cloud. Nó cho phép các nghệ sĩ truy cập và thay đổi môi trường 3D khổng lồ từ mọi nơi mà không cần gửi các tệp dữ liệu lớn. The View là một ứng dụng dành cho người dùng không rành về kỹ thuật, truyền phát toàn bộ cảnh Omniverse bằng công nghệ Nvidia GeForce Now được hỗ trợ bởi GPU Nvidia RTX trên đám mây.

Ứng dụng còn lại, Create, dành cho các nhà thiết kế kỹ thuật, nghệ sĩ và người sáng tạo để tạo ra thế giới 3D trong thời gian thực, nằm trong số bộ dịch vụ do Omniverse Cloud cung cấp. Người dùng sẽ có thể truyền phát, tạo, xem và cộng tác với các khách hàng Omniverse khác từ bất kỳ thiết bị nào.

Khoa học dữ liệu được tăng tốc GPU với RAPIDS

Những sáng kiến ​​dịch vụ phần cứng và đám mây mới này nhằm xử lý dữ liệu lớn. “Dữ liệu lớn” đề cập đến dữ liệu đa dạng hơn với số lượng lớn hơn và di chuyển nhanh hơn. Ba chữ V còn được gọi là thế này.

Dữ liệu lớn là tập hợp dữ liệu lớn hơn, phức tạp hơn, đặc biệt là từ các nguồn mới. Phần mềm xử lý dữ liệu truyền thống không thể xử lý được lượng thông tin khổng lồ này. Tuy nhiên, việc sử dụng lượng dữ liệu khổng lồ này có thể giải quyết được các vấn đề mà trước đây bạn không thể giải quyết được. Nhưng Nvidia có giải pháp RAPIDS và là trung tâm của tất cả các phiên GTC 2022 liên quan đến khoa học dữ liệu.

RAPIDS là gì?

Tại GTC 2022, có 131 phiên liên quan đến dữ liệu và phiên đầu tiên là Nguyên tắc cơ bản về khoa học dữ liệu tăng tốc, giải thích RAPIDS là gì.

RAPIDS là một tập hợp các thư viện mã GPU nguồn mở có thể được sử dụng để phát triển các quy trình phân tích và khoa học dữ liệu từ đầu đến cuối. RAPIDS tăng tốc độ quy trình khoa học dữ liệu để giúp các tổ chức tạo ra quy trình công việc hiệu quả hơn.

Thư viện phần mềm nguồn mở chỉ dành cho GPU có tên RAPIDS là trung tâm xử lý dữ liệu và Nvidia có thể sản xuất một trong những phần cứng tốt nhất cho việc này. Nó giúp tăng tốc độ xử lý các thuật toán học máy mà không phát sinh chi phí tuần tự hóa dữ liệu. RAPIDS cũng hỗ trợ triển khai nhiều GPU cho quy trình khoa học dữ liệu từ đầu đến cuối trên các tập dữ liệu lớn.

RAPIDS hoạt động như thế nào?

RAPIDS sử dụng khả năng tăng tốc GPU để tăng tốc toàn bộ quy trình phân tích và khoa học dữ liệu. Khung dữ liệu lõi được tối ưu hóa GPU hỗ trợ phát triển cơ sở dữ liệu và ứng dụng máy học.

RAPIDS là một framework dựa trên Python cho phép bạn viết mã bằng C++ và chạy nó hoàn toàn trên GPU. Nó bao gồm các thư viện để thực thi quy trình khoa học dữ liệu hoàn toàn trên GPU.

Mối quan hệ giữa RAPIDS và khoa học dữ liệu

RAPIDS cố gắng giảm thời gian lấy dữ liệu theo thứ tự, thường là rào cản đáng kể trong khoa học dữ liệu. RAPIDS giúp bạn phát triển quy trình làm việc năng động và mang tính khám phá hơn bằng cách cải thiện quy trình truyền dữ liệu.

lợi thế RAPIDS

RAPIDS mang lại một số lợi thế khi kết hợp:

  • Tích hợp – Tạo chuỗi công cụ khoa học dữ liệu dễ bảo trì.
  • Chia tỷ lệ — Chia tỷ lệ GPU trên nhiều GPU khác nhau, bao gồm cấu hình nhiều GPU và cụm nhiều nút.
  • Độ chính xác – Cho phép tạo, thử nghiệm và sửa đổi nhanh chóng các mô hình học máy để cải thiện độ chính xác của chúng.
  • Tốc độ – Tăng năng suất khoa học dữ liệu và giảm thời gian đào tạo.
  • Mã nguồn mở — Kiến trúc chuỗi SPV được tối ưu hóa cho GPU đầu tiên trên thế giới. Nó tương thích với NVIDIA và được xây dựng trên nền tảng phần mềm sonviftware mã nguồn mở Apache Arrow.

GPU và CPU mới được giới thiệu tại GTC 2022 sẽ góp phần đáng kể vào việc xử lý dữ liệu với sự hỗ trợ của RAPIDS. Ngoài ra, bạn có thể sử dụng các hệ thống này trên mọi PC nhờ Nvidia Omniverse.

GTC 2022 là một hội nghị ảo cung cấp hơn 900 phiên, bao gồm các bài phát biểu quan trọng, hướng dẫn kỹ thuật, thảo luận nhóm và tọa đàm bàn tròn với các chuyên gia trong ngành. Mặc dù thiếu khán giả và cơ hội tiếp xúc với nhiều người tham dự từ cả khu vực công và tư nhân, nhưng sự kiện này vẫn có rất nhiều thông tin. Ngay cả khi bạn bỏ lỡ sự kiện trực tiếp thực tế, nhiều phiên, chẳng hạn như bài phát biểu quan trọng của Jensen Huang, sẽ được lưu trữ để xem sau.

Hệ sinh thái của Nvidia tiếp tục mở rộng và mở rộng quy mô với tốc độ chóng mặt, như đã thấy tại GTC 2022. Bài viết này trình bày một số tính năng mới và cách chúng được kết nối với khoa học dữ liệu. Bạn có nghĩ rằng những cải tiến hơn nữa là đủ để đưa khoa học dữ liệu tiến lên phía trước không?