Tin tức và phân tích của tất cả các thiết bị di động

Cái thời nhà thơ trở thành họa sĩ

Nếu trong những tuần qua TwitterNếu bạn bắt gặp những bức vẽ thú vị bằng… nhưng vẫn chưa tìm ra được họa sĩ nào đã thực hiện nó thì rất có thể bạn đã gặp DALL-E mini. Lấy cảm hứng từ hệ thống trí tuệ nhân tạo của OpenAI có tên DALL-E, công cụ do Boris Dayma phát triển, cho phép tạo hình ảnh đơn giản bằng cách nhập văn bản, đồng thời giới thiệu trí tuệ nhân tạo cho người dùng phổ thông không có mối quan hệ sâu sắc với công nghệ. DALL-E mini chỉ là phần nổi của tảng băng chìm vì hình ảnh tuyệt đẹp được tạo ra bởi các công cụ kế tiếp như DALL-E, Midjourney AI và Stable Diffusion chỉ với đầu vào văn bản đã cho thấy rằng công nghệ trí tuệ nhân tạo đang phát triển với tốc độ vượt xa những gì chúng ta đang có. tưởng tượng. Cần nhấn mạnh rằng sự xuất hiện của những công cụ này không chỉ đơn thuần là tạo ra hình ảnh.

Công nghệ trí tuệ nhân tạo, vốn chưa được giải thích đầy đủ cho người dùng cuối trong nhiều năm và dựa trên đó nhiều thuyết âm mưu đã được xây dựng, đã không còn là điều cấm kỵ và cho phép bất kỳ ai có quyền truy cập Internet thử nghiệm những người sáng tạo hình ảnh. Về mặt này, chúng tôi nghĩ rằng sự xuất hiện của những công cụ này là tiêu chuẩn sẽ thay đổi cách xã hội nhìn nhận về trí tuệ nhân tạo. Tuy nhiên, nếu bạn muốn nhìn vào tấm kính trống một nửa, có thể khá rùng rợn khi nhận ra rằng những cảnh mà bạn không thể nhìn thấy ngay cả trong những bộ phim kinh dị chân thực nhất có thể được vẽ trong vài phút nhờ những công cụ này.

Trí tưởng tượng của bạn là giới hạn

Trong hình ảnh trên, bạn có thể thấy kết quả mà chúng tôi nhận được với “bài hát của còi báo động” (tên được đặt cho các bài hát của còi báo động được cho là có trong thần thoại Hy Lạp) khi chúng tôi lần đầu thử AI giữa hành trình. Nguyên tắc hoạt động cơ bản của những công cụ này dựa trên khả năng biến bất kỳ mô tả, câu, lời bài hát hoặc từ nào xuất hiện trong đầu thành hình ảnh bắt mắt. Ngoài ra, hãy đề cập rằng bạn có thể tạo các lệnh xác định kích thước, kiểu dáng và màu sắc của những hình ảnh này. Thật không may, chúng tôi có thể đưa ra một ví dụ để bạn hình dung về cách tạo các mục trong những công cụ chưa cung cấp hỗ trợ lệnh Thổ Nhĩ Kỳ này: “Một con chó lông trắng theo phong cách của Van Gogh, 16:9, thực tế.” Khả năng là vô tận và mọi thứ đều phụ thuộc vào trí tưởng tượng của bạn. Nếu bạn có ý định liên tục tạo ra hình ảnh bằng những công cụ này, bạn cần dành chút thời gian tìm hiểu cách nền tảng bạn sử dụng mang lại kết quả với những lệnh nào. Bây giờ, chúng ta hãy tìm hiểu những công cụ đang gây bão này.

DALL-E

phiên bản đầu tiên 5 Được OpenAI ra mắt vào tháng 1 năm 2021, DALL-E lấy tên từ sự kết hợp giữa họa sĩ siêu thực nổi tiếng người Catalan “Salvador Dalí” và bộ phim hoạt hình 3D năm 2008 “WALL-E”, kể về câu chuyện của robot sẽ nhặt rác trong không gian và quyết định số phận của con người. Công ty, đã đi một chặng đường dài sau phiên bản đầu tiên có thể tạo ra hình ảnh đơn giản hơn, sẽ ra mắt DALL-E vào tháng 4 năm 2022. 2 quay lại với. Nhà phát triển DALL-E 2′ có thể tạo ra các hình ảnh và tác phẩm nghệ thuật nguyên bản, chân thực bằng văn bản mô tả; định nghĩa nó như một công cụ có thể kết hợp các khái niệm và phong cách”. Nền tảng đã giới thiệu tính năng có tên “Outpainting” vào đầu tháng 9, cho phép người dùng tưởng tượng vượt ra ngoài biên giới của những bức tranh hiện có trên canvas, đã được mở cho tất cả mọi người kể từ ngày 28 tháng 9 năm 2022. Bằng cách sử dụng tính năng này, bạn cũng có thể thiết kế từng phần xung quanh của hình ảnh đã chọn và bạn có thể nhận được bản in có độ phân giải cao hơn. Nền tảng này xác định 50 điểm, được gọi là “tín dụng”, cho người dùng khi họ mở tài khoản lần đầu tiên. Sau một tháng sử dụng, nó sẽ cấp 15 tín dụng vào đầu mỗi tháng. Nếu giới hạn của bạn đã đầy, bạn có thể mua thêm 115 quyền sử dụng bằng cách trả 15 USD. Mỗi điểm này cung cấp một bản in duy nhất. Cũng rất hữu ích khi nhấn mạnh rằng tính năng Outpainting được mở cho mọi người sử dụng.

Hãy nói thêm rằng bạn có thể sử dụng hình ảnh bạn tạo bằng DALL-E cho mục đích thương mại miễn là bạn tuân thủ chính sách nội dung và điều khoản sử dụng của OpenAI.

AI giữa hành trình

Midjourney AI, dự án của một phòng thí nghiệm nghiên cứu độc lập cùng tên, đã cố gắng tạo dựng được tên tuổi kể từ khi xuất hiện. Phiên bản dùng thử của công cụ mà bạn có thể truy cập thông qua ứng dụng nhắn tin tức thời Discord, được các game thủ biết đến, dựa vào một nhóm toàn thời gian gồm 11 người do David Holz lãnh đạo. Tạp chí Economist đã tạo thêm danh tiếng cho chiếc xe bằng cách thiết kế bìa trước của số báo xuất bản vào tháng 6 năm 2022 với Midjourney AI. Bằng cách trả 10 USD mỗi tháng, bạn có thể đăng ký gói thành viên cơ bản của Midjourney AI và hưởng lợi từ các tính năng như tạo 200 hình ảnh mỗi tháng và xem thư viện chỉ dành cho thành viên. Gói mà bạn có thể có bằng cách trả 30 đô la một tháng, mang đến những cơ hội như sản xuất hình ảnh không giới hạn và in nhanh hơn trong 900 phút. Cũng giống như DALL-E, bạn có thể sử dụng những hình ảnh bạn đã tạo bằng Midjourney AI cho mục đích thương mại, tuy nhiên công ty phát triển không cho phép tạo NFT với những hình ảnh này.

khuếch tán ổn định

Được phát triển bởi StabilityAI với sự cộng tác của EleutherAI và LAION, Stable Diffusion là một công cụ khác để tạo hình ảnh bằng cách nhập văn bản, hoạt động với logic tương tự như các công cụ khác. Hãy nhấn mạnh rằng mã nguồn của phần mềm này có sẵn trên GitHub. Hơn 10 nghìn người thử nghiệm beta mỗi ngày trong quá trình học máy của mô hình 1,7 đã tạo ra hàng triệu hình ảnh. Nếu bạn muốn duyệt các hình ảnh được tạo bởi người dùng Stable Diffusion, bạn có thể truy cập trang web có tên “lexica.art”. Nếu bạn muốn biến những ý tưởng tuyệt vời của mình thành hình ảnh, beta.dreamstudio.ai Bạn có thể trải nghiệm Khuếch tán ổn định bằng cách truy cập trang web hoặc cài đặt ứng dụng liên quan trên máy tính của mình. Nhóm StabilityAI không đặt ra bất kỳ rào cản nào trước mặt người dùng liên quan đến việc sử dụng thương mại các hình ảnh được tạo ra.

Nghệ sĩ con người sẽ thất nghiệp?

Nhiều người dùng Internet cho rằng khả năng sáng tạo “nghệ thuật” bằng cách nhập văn bản sẽ khiến các nghệ sĩ thực thụ mất việc theo thời gian. Trước khi đi sâu hơn vào chủ đề này, chúng tôi muốn nói chuyện với các bạn về “định lý con khỉ vô tận” được đưa ra vào thế kỷ 19 bởi nhà sinh vật học nổi tiếng Thomas Henry Huxley, một trong những người bảo vệ vĩ đại nhất cho thuyết tiến hóa của Darwin. Để nhấn mạnh một thực tế toán học ở thời kỳ tiền internet, Huxley đề cập rằng nếu chúng ta đưa cho vô số con khỉ một số lượng máy đánh chữ vô hạn, thì một trong những con khỉ này cuối cùng sẽ có thể viết được cả một tác phẩm của Shakespeare.

Mặt khác, doanh nhân và tác giả Andrew Keen, trong cuốn sách xuất bản năm 2007 của mình có tựa đề “Sự sùng bái người nghiệp dư: Internet ngày nay đang giết chết nền văn hóa của chúng ta như thế nào”, đã trích dẫn “định lý khỉ vô hạn” làm ví dụ và ví von những người có cơ hội để sản xuất nội dung trên Internet cho những con khỉ này. Ông phàn nàn rằng thế hệ kết nối internet, mà ông gọi là những con khỉ nghiệp dư ngày nay, đã tạo ra một “khu rừng kỹ thuật số tầm thường” vô tận. Mặc dù một số người trong chúng ta có thể viết những cuốn tiểu thuyết hấp dẫn, những bài báo ấn tượng trên tạp chí, vẽ những bức tranh bắt mắt hoặc tạo ra những bài hát đáng ngưỡng mộ nhờ những cơ hội mà Internet mang lại, nhưng có một thực tế không thể phủ nhận là có rất nhiều nội dung tương đối kém hoặc chất lượng kém đang lan truyền trên internet. mà chúng ta bỏ qua. Có thể tạo ra hình ảnh tuyệt đẹp bằng cách sử dụng các câu đầu vào đơn giản thông qua các công cụ trí tuệ nhân tạo thế hệ mới. Tuy nhiên, điều này không làm thay đổi thực tế rằng đầu ra thu được bằng lệnh đã cho không nhất quán và nhiều tác phẩm được gọi là “nghệ thuật”, không mấy ấn tượng, lại được lan truyền trên internet.

Các công cụ AI có thể sẽ tạo ra hình ảnh nhất quán hơn nhiều trong một vài năm tới, nhưng vẫn cần có các nhà thiết kế và giám tuyển tài năng để xử lý vấn đề đó một cách chuyên nghiệp. Bạn hỏi tại sao?

Cuối cùng…

Chúng ta chỉ có thể dự đoán mức độ phát triển của các công cụ sản xuất hình ảnh được hỗ trợ bởi AI theo thời gian. Ngày nay, chúng ta thấy những công cụ này thường được sử dụng trên bìa tạp chí, quảng cáo, triển lãm và thậm chí cả trong báo chí. Không còn nghi ngờ gì nữa, chúng ta sẽ tiếp tục thấy được những kết quả ấn tượng hơn nhiều nhờ phản hồi của người dùng và sự làm việc của đội ngũ chuyên gia.

Cần nhấn mạnh rằng có nhiều dấu hỏi về mặt đạo đức trong quá trình phát triển các công cụ này. Hàng nghìn tác phẩm có bản quyền, phong cách vẽ nguyên bản, ảnh người thật và hơn thế nữa có thể được sử dụng trong quá trình đào tạo trí tuệ nhân tạo.

Giống như mọi ý tưởng lạc hậu về trí tuệ nhân tạo mà chúng ta đã nói đến cho đến nay, luận điểm cho rằng công nghệ này sẽ tiêu diệt các nghệ sĩ thực thụ dường như không nhất quán với chúng ta. Giống như mọi đổi mới công nghệ, chúng tôi dự đoán rằng quá trình này sẽ tạo ra những cách thức kinh doanh và điểm thu hút mới. Tuy nhiên, thật tốt khi không nói lớn. Rốt cuộc, làm sao bạn biết rằng bài viết này không được viết bởi trí tuệ nhân tạo?

Bài viết này đã được đăng trên tạp chí Digital Report số 15.

Mục lục