Tin tức và phân tích của tất cả các thiết bị di động

PHIẾN 2 : giữa Dalí và WALL.E, một AI có khả năng tạo hình ảnh từ văn bản ngẫu nhiên


Công ty nghiên cứu trí tuệ nhân tạo OpenAI đã giới thiệu phiên bản mới của trình tạo hình ảnh của mình thông qua các từ khóa: DALL.E 2. Một trình tạo chính xác và toàn diện hơn cho phép tạo ra sự kết hợp vô hạn của các hình ảnh nghệ thuật ở độ phân giải cao nhờ sức mạnh của công cụ AI của nó.

PHIẾN 2 tuy nhiên, hiện được dành riêng cho các nhóm nhà nghiên cứu cho đến khi AI được phát triển đúng cách và các nguy cơ sử dụng sai mục đích được loại bỏ.

Một văn bản, một hình ảnh

Trong trường chuyên dụng, hãy đánh dấu “ Một phi hành gia đang nằm dài trong một khách sạn nhiệt đới trong không gian theo phong cách nghệ thuật pixel “và nhảy! Bạn có được một hình ảnh với chính xác mọi thứ bạn đã viết. Không phải là một fan hâm mộ của kết quả cuối cùng? Thay đổi “pixel art” thành “Van Gogh” hoặc “phi hành gia” thành “một con chó” và hình ảnh xuất hiện đã được sửa đổi với kết quả mới. Đây là những gì DALL.E cung cấp 2từ OpenAI.

PHIẾN 2

Ra mắt vào tháng 1 năm 2021, công cụ DALL.E (hỗn hợp của Salvador Dalí cho khía cạnh nghệ thuật và WALL-E, robot nhỏ cho khía cạnh công nghệ) đã giúp nó có thể làm được nhiều hơn hoặc ít hơn những điều tương tự nhưng, một năm phát triển sau đó, các nhà nghiên cứu đằng sau dự án có thể phát hành một phiên bản thậm chí còn tiên tiến hơn và hoàn thiện hơn.

Nhờ công cụ này chưa được cung cấp cho công chúng, có thể thực hiện được ba điều sau:
tạo hình ảnh từ các từ khóa; tạo các biến thể của hình ảnh đã có (lấy nàng mô na Li Sa và gợi ý, ví dụ, mặc quần áo với kiểu tóc Iroquois) hoặc kết hợp hai hình ảnh với nhau.

Trí tuệ nhân tạo tại trái tim

Nói một cách cụ thể, điều đó hoạt động như thế nào? Trang web của công cụ giải thích nó khá tốt. PHIẾN 2 sử dụng hệ thống thần kinh được huấn luyện với hình ảnh và mô tả của chúng. Học sâu cho phép công cụ hiểu từ nào thuộc về hình ảnh nào bằng cách phân tích và kiểm tra chéo các mẫu của hàng nghìn bức ảnh được liên kết với một từ nhất định. Ví dụ, đối với từ “koala”, công cụ trước đây sẽ khám phá cơ sở dữ liệu của hàng triệu bức ảnh để xác định gấu túi là gì.

Khi tạo hình ảnh, công cụ sử dụng một quá trình được gọi là “khuếch tán”. Bắt đầu từ một mẫu các chấm được đặt ngẫu nhiên, nó dần dần chuyển thành một hình ảnh khi nó nhận ra các khía cạnh cụ thể của hình ảnh đó. Rõ ràng là có giới hạn. Nếu máy bay có từ “ô tô” trong mô tả của nó, khi bạn muốn tạo một chiếc ô tô, nó có thể đưa hình ảnh của một chiếc máy bay vào vì đối với AI, một chiếc ô tô sau đó là một chiếc máy bay.

PHIẾN 2 là một dự án nghiên cứu và do đó không có sẵn trên API. Một nhóm người dùng được chọn tham gia vào nghiên cứu và chỉ những nhà nghiên cứu đáng tin cậy mới có thể đăng ký tham gia. Công việc bảo mật của công cụ được thực hiện để ngăn chặn việc tạo ra các hình ảnh bạo lực, thù địch, chính trị hoặc khiêu dâm. Nó cũng bị cấm để tạo ra hình ảnh bằng cách sử dụng ảnh của người thật hoặc nhân vật.

Nguồn : Tạp chí Smithsonian