Tin tức và phân tích của tất cả các thiết bị di động

AMD công bố HPC nhanh nhất thế giới cho siêu máy tính

CÁC Chúa ơi hôm nay đã ra mắt bộ tăng tốc mới nhất của nó Bản năng MI100 tập trung để sử dụng trong siêu máy tính. Mô hình này là cạc đồ họa máy chủ x86 đầu tiên trên thế giới phá vỡ rào cản hiệu suất của 10 teraflop (FP64)🇧🇷

Theo công ty, MI100 GPU HPC nhanh nhất trên thế giới và sẽ được hỗ trợ bởi các nền tảng máy tính tăng tốc mới từ dell🇧🇷 gigabyte🇧🇷 HPE supermicro🇧🇷 CÁC Chúa ơi đảm bảo rằng cạc đồ họa, kết hợp với CPU AMD EPYC và mở phần mềm ROCm 4🇧🇷0anh ấy đã được thiết kế để thúc đẩy những khám phá mới trong kỷ nguyên exascale🇧🇷

Được xây dựng theo kiến ​​trúc mới AMD CDNAthẻ video AMD Instinct Ml100 cho phép một loại hệ thống tăng tốc mới HPC Ở ĐÓtrở thành bảng hoàn hảo cho máy tính khoa học🇧🇷

Mô hình đến 11,5 FP64 hiệu suất TFLOPS cao nhất cho HPC và lên đến 46,1 Hiệu suất ma trận FP32 TFLOPS cho tải trọng của máy học và trí tuệ nhân tạo.

Tìm hiểu về các sản phẩm và công nghệ của AMD.

Tín dụng: AMD

So với thế hệ trước của Chúa ơimột ml100 có thể tăng đáng kể thông qua công nghệ mới Lõi ma trận AMD🇧🇷 Mô hình mới có tính năng tăng gần 7 lần hiệu suất Dấu chấm động đỉnh lý thuyết FP16, dành cho khối lượng công việc đào tạo AI.

Các công ty đang đầu tư mạnh mẽ vào tương lai thông qua máy tính exascalevới thẻ video mới của bạn, Chúa ơi tin rằng đang tiến thêm một bước nữa tới tương lai đó.

“Nhằm vào khối lượng công việc quan trọng trong máy tính khoa học, bộ tăng tốc mới nhất của chúng tôi, khi kết hợp với nền tảng phần mềm mở AMD ROCm, được thiết kế để cung cấp cho các nhà khoa học và nhà nghiên cứu một nền tảng vượt trội cho công việc HPC của họ.”
– Brad McCredie, Giám đốc công ty về GPU và xử lý tăng tốc của Trung tâm dữ liệu tại AMD cho biết

Tín dụng: AMD

ROCm 4🇧🇷0

AMD cũng đã công bố việc nâng cao phần mềm dành cho nhà phát triển của mình ROCm, tập trung vào tính toán exascale. Chương trình được nhiều nhà phát triển phần mềm sử dụng exascale để tạo các ứng dụng hiệu suất cao🇧🇷

Phần mềm đã được tối ưu hóa để có hiệu suất tốt hơn trên các hệ thống dựa trên ml100O ROCm 4🇧🇷0 đã cập nhật trình biên dịch thành mã nguồn mở và thống nhất để hỗ trợ OpenMP 5🇧🇷0 và HIP.

Ngoài ra, phần mềm cũng có những tối ưu hóa nhằm vào hiệu suất của các cấu trúc PyTorchTensorflow với GPU mới từ Chúa ơi🇧🇷

Qua: EP&T Nguồn: AMD

🇧🇷