Tin tức và phân tích của tất cả các thiết bị di động

NVIDIA công bố mô hình ngôn ngữ lớn NeMo và BioNemo mới tại GTC 2023

  • NVIDIA đã công bố hai dịch vụ AI đám mây mô hình ngôn ngữ lớn mới tại sự kiện GTC 2022: mô hình ngôn ngữ lớn NeMo và BioNemo.
  • Dịch vụ NeMo LLM cho phép các nhà phát triển nhanh chóng điều chỉnh một số mô hình nền tảng được đào tạo trước thông qua việc sử dụng phương pháp đào tạo được gọi là học nhanh.
  • Dịch vụ BioNeMo LLM hiện bao gồm hai mô hình ngôn ngữ BioNeMo bổ sung cho các ứng dụng hóa học và sinh học.
  • Ngoài khả năng thay đổi các mô hình nền tảng, các dịch vụ LLM còn mang đến cơ hội sử dụng các mô hình làm sẵn và đặt riêng thông qua API đám mây.
  • Bắt đầu từ tháng tới, các dịch vụ NeMo LLM và BioNeMo cũng như các API đám mây sẽ có sẵn ở dạng truy cập sớm.

Tại sự kiện GTC 2022, NVIDIA đã công bố hai dịch vụ AI đám mây mô hình ngôn ngữ lớn mới, Dịch vụ mô hình ngôn ngữ lớn NVIDIA NeMo và Dịch vụ NVIDIA BioNeMo LLM, cho phép các nhà phát triển dễ dàng điều chỉnh LLM và triển khai các ứng dụng AI tùy chỉnh để tạo nội dung, tóm tắt văn bản, chatbot, phát triển mã, cấu trúc protein và dự đoán đặc tính phân tử sinh học, v.v.

Mô hình ngôn ngữ lớn NeMo và BioNemo hướng tới mục tiêu gì?

Dịch vụ NeMo LLM cho phép các nhà phát triển nhanh chóng điều chỉnh nhiều mô hình nền tảng được đào tạo trước trên cơ sở hạ tầng do NVIDIA quản lý bằng cách sử dụng phương pháp đào tạo được gọi là học nhanh. Dịch vụ NVIDIA BioNeMo là giao diện lập trình ứng dụng đám mây (API) mở rộng các trường hợp sử dụng LLM ngoài ngôn ngữ và vào các ứng dụng khoa học để giúp các doanh nghiệp dược phẩm và công nghệ sinh học cải thiện việc khám phá thuốc.

NeMo LLM cho phép các nhà phát triển điều chỉnh nhiều mô hình nền tảng được đào tạo trước bằng cách sử dụng phương pháp đào tạo học tập nhanh chóng

Jensen Huang, người sáng lập và Giám đốc điều hành của NVIDIA cho biết: “Các mô hình ngôn ngữ lớn có tiềm năng biến đổi mọi ngành công nghiệp. Khả năng điều chỉnh các mô hình nền tảng đưa sức mạnh của LLM vào tầm tay của hàng triệu nhà phát triển, những người hiện có thể tạo ra các dịch vụ ngôn ngữ và hỗ trợ các khám phá khoa học mà không cần phải xây dựng một mô hình lớn từ đầu.”

NeMo LLM nhằm mục đích tăng tốc độ triển khai

Các nhà phát triển có thể sử dụng dữ liệu đào tạo của riêng họ để tùy chỉnh các mô hình nền tảng từ 3 tỷ thông số cho Megatron 530B, một trong những LLM lớn nhất thế giới, sử dụng Dịch vụ NeMo LLM. So với việc mất hàng tuần hoặc hàng tháng để đào tạo một mô hình ngay từ đầu, quy trình này chỉ mất vài phút đến vài giờ.

Học nhanh, sử dụng một kỹ thuật được gọi là điều chỉnh p, được sử dụng để tùy chỉnh các mô hình. Điều này cho phép các nhà phát triển nhanh chóng điều chỉnh các mô hình nền tảng được đào tạo ban đầu với hàng tỷ điểm dữ liệu chỉ bằng vài trăm phiên bản. Tùy chỉnh cung cấp mã thông báo nhắc nhở dành riêng cho nhiệm vụ, sau đó được tích hợp với các mô hình nền tảng để cung cấp câu trả lời chính xác và phù hợp hơn cho các trường hợp sử dụng cụ thể.

Tính năng sân chơi cho phép thử nghiệm không cần mã và tương tác với mô hình

Nhà phát triển có thể sử dụng cùng một mô hình để tùy chỉnh nhiều trường hợp sử dụng và tạo nhiều loại mã thông báo nhắc nhở. Tính năng sân chơi cho phép thử nghiệm và tương tác không cần mã với các mô hình, tăng tính hữu ích và khả năng tiếp cận của LLM đối với các trường hợp sử dụng cụ thể trong ngành. Khi sẵn sàng, các mô hình đã điều chỉnh có thể được thực thi trên phiên bản đám mây, hệ thống tại chỗ hoặc thông qua API.

BioNeMo LLM sẽ cho phép các nhà nghiên cứu sử dụng các mô hình lớn

Hai mô hình ngôn ngữ BioNeMo mới cho các ứng dụng hóa học và sinh học được đưa vào Dịch vụ BioNeMo LLM. Nó giúp các nhà nghiên cứu xác định các mô hình và hiểu biết sâu sắc về trình tự sinh học bằng cách hỗ trợ dữ liệu protein, DNA và sinh hóa.


Google AI: Mô hình ngôn ngữ Pathways có thể giải thích một trò đùa


BioNeMo cho phép các nhà nghiên cứu mở rộng phạm vi nghiên cứu của họ bằng cách sử dụng các mô hình với hàng tỷ tham số. Các mô hình lớn hơn có thể chứa nhiều thông tin hơn về cấu trúc protein và liên kết tiến hóa giữa các gen và có khả năng phát triển các phân tử sinh học mới cho mục đích điều trị.

BioNeMo LLM giúp các nhà nghiên cứu xác định các mô hình và hiểu biết sâu sắc về trình tự sinh học

Ngoài việc sửa đổi các mô hình nền tảng, các dịch vụ LLM còn cung cấp khả năng sử dụng các mô hình làm sẵn và đặt riêng thông qua API đám mây.

Điều này cung cấp cho các nhà phát triển quyền truy cập vào một loạt LLM được đào tạo trước, bao gồm Megatron 530B, cũng như T5 và GPT-3 các mô hình được sản xuất bằng khung NVIDIA NeMo Megatron, hiện đang có phiên bản beta mở để phù hợp với nhiều ứng dụng và nhu cầu dịch vụ đa ngôn ngữ.


GTC 2022 của Nvidia cho thấy khoa học dữ liệu quan trọng như thế nào đối với các công nghệ trong tương lai


Các NeMo LLMBioNeMo các dịch vụ và API đám mây sẽ được cung cấp dưới dạng truy cập sớm bắt đầu vào tháng tới. Khung NeMo Megatron hiện có sẵn dưới dạng bản phát hành beta từ NVIDIA NGC. Nó được thiết kế để chạy trên NVIDIA DGX Foundry và NVIDIA DGX SuperPOD, cũng như các phiên bản đám mây được tăng tốc từ Amazon Dịch vụ Web, Microsoft Azure và Cơ sở hạ tầng đám mây Oracle.