Tin tức và phân tích của tất cả các thiết bị di động

Microsoft ra mắt siêu máy tính để đào tạo các mô hình trí tuệ nhân tạo mới

Trong hội nghị Build, được tổ chức trực tuyến lần đầu tiên, Microsoft đã tiết lộ các đường nét của siêu máy tính mới của mình, một trong những 5 mạnh nhất trên thế giới. Nó sẽ có thể đào tạo các mô hình trí tuệ nhân tạo mới và sẽ được hưởng lợi từ cơ sở hạ tầng mới, hiện đại và mạnh mẽ, có sẵn trên Azure, nền tảng đám mây của công ty Mỹ. Về đặc tính kỹ thuật, siêu máy tính này có một hệ thống độc đáo với hơn 285.000 lõi xử lý, 10.000 GPU và 400 gigabit / giây kết nối mạng cho mỗi máy chủ GPU.

Siêu máy tính này được thiết kế như một phần của sự hợp tác giữa Microsoft và OpenAI, một cấu trúc do Elon Musk và Sam Altman đưa ra vào năm 2015 nhằm thúc đẩy nghiên cứu về trí tuệ nhân tạo. Mục tiêu của Microsoft: cung cấp các mô hình lớn, công cụ tối ưu hóa và tài nguyên siêu máy tính thông qua các dịch vụ Azure AI và GitHub để các nhà phát triển, nhà khoa học dữ liệu và khách hàng doanh nghiệp có thể dễ dàng tận dụng sức mạnh của AI trên quy mô lớn. Siêu máy tính này có thể giúp tăng tốc quá trình này, để thiết lập và đào tạo một thế hệ mô hình mới mạnh mẽ hơn.

Siêu máy tính đáp ứng nhu cầu của thế hệ AI mới

Nếu thế hệ mô hình AI trước đây được thiết kế để học một nhiệm vụ đơn giản (dịch tiếng nước ngoài, nhận dạng các đối tượng hoặc văn bản để xác định các điểm chính, v.v.), thì một loại mô hình mới do cộng đồng nghiên cứu phát triển hiện đã có thể tối ưu hóa các tác vụ này với một mô hình duy nhất, mạnh mẽ hơn. Loại trí thông minh nhân tạo này có thể đồng hóa các sắc thái của ngôn ngữ, ngữ pháp, ngữ cảnh, mà còn cả kiến ​​thức hoặc khái niệm mới, trong khi thực hiện nhiều nhiệm vụ cụ thể: tóm tắt một bài phát biểu dài, kiểm duyệt nội dung trong các cuộc trò chuyện trực tiếp, tìm các đoạn có liên quan trong hàng nghìn tệp pháp lý hoặc thậm chí tạo mã từ GitHub.

Nhờ sự cải tiến của các mô hình mới này, có thể học các sắc thái của ngôn ngữ bằng cách kiểm tra hàng tỷ trang có sẵn trên web, chúng ngày càng trở nên hiệu quả hơn và có thể hiểu cách các từ liên kết với nhau để hiểu rõ hơn về nghĩa. Do đó, thế hệ mới này cần được đào tạo với khối lượng lớn dữ liệu và tài nguyên siêu máy tính. Microsoft đang nghiên cứu các mô hình AI quy mô lớn với các phương pháp học tập có tính đến văn bản, hình ảnh và video. Những tiến bộ mới này sẽ làm cho nó có thể cải thiện phụ đề tự động của hình ảnh cho khả năng truy cập trong Office hoặc để tối ưu hóa tìm kiếm cho người dùng Internet trên công cụ Bing, bằng cách hiểu nội dung của các yếu tố hình ảnh.

Các thông báo về trí tuệ nhân tạo khác của Microsoft

Công ty Mỹ đã công bố tin tức khác về AI trong hội nghị Xây dựng trực tuyến: Microsoft Turing sẽ có sẵn dưới dạng mã nguồn mở, phiên bản DeepSpeed ​​mới được tung ra và ONNX Runtime sẽ cải thiện hiệu suất của nó nhờ bản cập nhật mới. .

Các mô hình Microsoft Turing sắp có trong mã nguồn mở

Là một phần của sáng kiến ​​AI @ Scale, Microsoft đã phát triển dòng mô hình AI tuyệt vời của riêng mình: Turing-NLG (Turing Natural Language Generation). Đây là mô hình Turing lớn nhất cho thế hệ ngôn ngữ tự nhiên với 17 tỷ tham số, gấp đôi so với đối thủ cạnh tranh Megatron từ Nvidia. Mô hình Turing này đáng chú ý được sử dụng để cải thiện nhiều tác vụ hiểu ngôn ngữ trên Bing, Office, Dynamics và các sản phẩm khác của Microsoft. Việc phát triển thế hệ AI mới này đòi hỏi cơ sở hạ tầng siêu máy tính mới và phần cứng hiện đại để đào tạo các mô hình này.

Công ty Mỹ sẽ sớm mở mã nguồn các mô hình Microsoft Turing của mình, cũng như các phương pháp đào tạo chúng trong chương trình học máy của Azure. Do đó, các nhà phát triển sẽ có quyền truy cập vào cùng một nhóm mô hình mà công ty đã sử dụng để cải thiện sự hiểu biết về ngôn ngữ trên các sản phẩm của mình.

Phiên bản mới của thư viện DeepSpeed, công cụ ONNX Runtime được cập nhật

Trong số các thông báo khác, Microsoft đang phát hành phiên bản mới của DeepSpeed, thư viện học sâu mã nguồn mở dành cho PyTorch, giúp giảm lượng sức mạnh tính toán cần thiết để đào tạo các mô hình AI lớn. Theo Microsoft, bản cập nhật này sẽ hiệu quả hơn so với phiên bản trước đó đã phát hành trước đây 3 tháng. Người dùng sẽ có thể đào tạo các mô hình lớn hơn 15 lần và nhanh hơn 10 lần so với nếu họ không sử dụng DeepSpeed ​​trên cùng một cơ sở hạ tầng.

ONNX Runtime (Open Neural Network Exchange), công cụ suy luận mã nguồn mở hiệu suất cao dành cho các mô hình học máy, được phát triển với sự cộng tác của Facebook và Amazon Dịch vụ Web, cũng được hưởng lợi từ bản cập nhật mới. Nó bổ sung hỗ trợ đào tạo mô hình, cũng như bổ sung tối ưu hóa thư viện DeepSpeed, cung cấp cải tiến hiệu suất lên đến 17 lần so với ONNX Runtime hiện tại.

Nguồn: Microsoft.

Mục lục