Tin tức và phân tích của tất cả các thiết bị di động

NVIDIA CUTENSOR 1.4 hiện có sẵn để tạo các hoạt động Tensor đa GPU

NVIDIA cutTENSOR v1-4Tuần này NVIDIA đã công bố sự sẵn có của cuTENSOR v1.4, hiện hỗ trợ các tensor lên tới 64 chiều, các hoạt động tensor đa GPU được phân phối và giúp cải thiện các mô hình hiệu suất co tensor. CUTENSOR v1.4 phần mềm hiện có sẵn để tải xuống miễn phí cho phép bạn kiểm tra khả năng của nó. cuTENSOR là một thư viện CUDA hiệu suất cao dành cho các nguyên hàm tensor và các tính năng của nó bao gồm hỗ trợ độ chính xác hỗn hợp mở rộng cho
Đầu vào FP64 với tính toán FP32, đầu vào FP32 với tính toán FP16, BF16 hoặc TF32, hoạt động thời gian thực phức tạp và hỗ trợ Liên hợp (không chuyển vị).

NVIDIA cutTENSOR v1.4 Các tính năng mới

cutTENSOR v1.4 hỗ trợ các tensor lên tới 64 chiều, bố cục dữ liệu tùy ý và cấu trúc dữ liệu có thể tuần tự hóa tầm thường cũng như cung cấp hỗ trợ cho các chức năng kích hoạt khác nhau, hoán vị tensor tùy ý và chuyển đổi giữa các loại dữ liệu khác nhau.

  • Hỗ trợ tensor lên đến 64 chiều.
  • Hỗ trợ các hoạt động tensor phân tán, đa GPU.
  • Mô hình hiệu suất co tensor được cải thiện (tức là thuật toán CUTENSOR_ALGO_DEFAULT).
  • Cải thiện hiệu suất cho việc thu gọn tensor có kích thước thu nhỏ tổng thể lớn (nghĩa là đã thêm mức giảm song song).
  • Cải thiện hiệu suất cho sự co rút tensor có kích thước được thu nhỏ lại rất nhỏ (<= 8).
  • Cải thiện hiệu suất cho các phép co tensor giống như sản phẩm bên ngoài (ví dụ: C[a,b,c,d] = A[b,d] *B[a,c]).
  • Sửa lỗi bổ sung.

nguồn : NVIDIA

Tuyên bố từ chối trách nhiệm: Một số bài viết của chúng tôi bao gồm các liên kết liên kết. Nếu bạn mua thứ gì đó thông qua một trong những liên kết này, APS Blog có thể kiếm được hoa hồng liên kết. Tìm hiểu về Chính sách tiết lộ của chúng tôi.