Tin tức và phân tích của tất cả các thiết bị di động

Nvidia ra mắt máy gia tốc Tesla K20 và K20X

Nvidia đã vén bức màn hôm thứ Hai về thế hệ tiếp theo của máy gia tốc Tesla dựa trên GPU GK110. Theo ông, hai thẻ được giới thiệu có tên Tesla K20 và K20X sẽ cung cấp sức mạnh tính toán lớn hơn gấp ba lần so với thế hệ trước.

Mở đầu một tuần đầy ắp những thông báo về thế giới siêu máy tính, Nvidia đã chính thức khởi động thế hệ máy gia tốc dựa trên GPU tiếp theo, họ Tesla K20, vào thứ Hai. Hãy nhớ rằng các thẻ này nhằm trang bị cho các máy trạm hoặc máy chủ chuyên về tính toán chuyên sâu, chủ yếu trong thế giới khoa học và công nghiệp, nơi khả năng xử lý song song lớn của GPU bao gồm hàng trăm, thậm chí hàng nghìn ‘đơn vị máy tính riêng biệt, mang lại hiệu quả cao hơn nhiều hơn một bộ xử lý x86 tiêu chuẩn.

0168000005510377-photo-nvidia-tesla-k20.jpg

Về cấp độ kỹ thuật, điểm mới lạ chính ở đây là do đó, việc chuyển các thẻ Tesla từ kiến ​​trúc Fermi sang kiến ​​trúc Kepler, mà công chúng đã quen thuộc thông qua các thẻ đồ họa thuộc dòng GeForce 600. Tuy nhiên, Nvidia không bám sát chính xác vào GPU Kepler được thiết kế cho 3D: tại đây anh ấy cung cấp GK110, một GPU pha tạp hormone mới với 7,1 tỷ bóng bán dẫn (so với 3.54 tỷ cho GK104 của GeForce GTX 680).

Do đó, thẻ Tesla K20 (máy trạm và máy chủ) được cung cấp với 2 496 lõi thực thi CUDA, kết hợp với 5 GB bộ nhớ GDDR5, cho băng thông lý thuyết là 208 GB / s. Biến thể cao cấp nhất, được gọi là K20X và dành riêng cho máy chủ hoặc siêu máy tính, tính 2 688 lõi CUDA và 6 GB RAM, với băng thông nhất định là 250 GB / s. Lưu ý rằng trong thực tế, dung lượng bộ nhớ hữu ích thực sự có sẵn cho hệ thống sẽ ít quan trọng hơn: các cơ chế sửa lỗi (ECC) thực sự độc quyền 12,5% tổng công suất. Cả hai thẻ đều có một phong bì nhiệt được đặt ở mức 225W cho K20 và 250W cho K20X.

Ngoài sự gia tăng đáng kể về số lượng đơn vị tính toán và những đóng góp của kiến ​​trúc Kepler (chẳng hạn như cải tiến đáng kể về khả năng tính toán chính xác kép), K20 dựa vào một số điểm mới về kiến ​​trúc cụ thể của GK110 để nổi bật so với thế hệ trước. (K10), đã được Nvidia trình bày chi tiết trong lần liên lạc đầu tiên về chủ đề này và các nhà phát triển có thể truy cập thông qua bộ CUDA 5.0xuất bản vào giữa tháng Mười.

Do đó, chúng tôi thấy ở nền tảng Song song động, bao gồm một tập hợp các chức năng cho phép bản thân xử lý CUDA bắt đầu xử lý mới, sau đó khai thác kết quả mà không cần CPU tham gia (xem thông báo kỹ thuật, bằng tiếng Anh và PDF). Thứ hai, được gọi là Hyper-Q, cho phép GK110 chấp nhận tối đa 32 hàng đợi thực thi (hàng đợi các tác vụ được phân bổ cho GPU), so với chỉ một hàng trên các thẻ thế hệ Fermi: Nvidia tối đa hóa tốc độ ở đây chiếm các đơn vị tính toán và, do đó, sản lượng.

01CC000005510375-photo-nvidia-tesla-k20.jpg

Do những cải tiến khác nhau này, Tesla K20 sẽ đạt được 1.17 teraflop trên các phép tính chính xác gấp đôi và 3.52 teraflop với độ chính xác duy nhất. Chị gái lớn của nó, K20X sẽ đạt đến 1.31 TFlops và 3.95 Tflops trong cả hai trường hợp. Tất cả điều này cho phép Nvidia tuyên bố rằng nó hiện cung cấp hiệu suất / Watt / tỷ lệ đô la tốt nhất trên thị trường.

Người Mỹ cũng đang tận dụng những thông báo gần đây liên quan đến Titan, siêu máy tính mới tại phòng thí nghiệm Oak Ridge, để quét sạch – mà không cần bắt đầu thêm – những giả thuyết gợi lên những khó khăn trong việc sản xuất mà không gặp khó khăn (hiểu với sản lượng thỏa đáng) GPU: 18.000 thẻ thực sự đã được phân phối theo hợp đồng này và đang hoạt động ngày hôm nay. Tính sẵn có chung của Tesla K20 và K20X được thiết lập vào cuối tháng 11 với mức giá tương ứng là 3 200 và 5 000 đô la, với sự tích hợp đã được lên kế hoạch với một số tên tuổi lớn trong lĩnh vực này như Cray, IBM, SGI, Fujtisu hoặc HP.