Tin tức và phân tích của tất cả các thiết bị di động

AI Art Generator Wars: Newcomer Stable Diffusion là giải pháp thay thế miễn phí cho DALL-E và Midjourney

Kết hợp với EleutherAI, LAION và StabilityAI, một mô hình máy học chuyển văn bản thành hình ảnh có tên là Trình tạo nghệ thuật AI khuếch tán ổn định đã được tạo ra để tạo ra hình ảnh kỹ thuật số từ các mô tả bằng ngôn ngữ tự nhiên.

Nghệ thuật do AI sản xuất đã xuất hiện được một thời gian. Tuy nhiên, phần mềm phát hành năm nay, DALL-E 2AI giữa hành trình và Khuếch tán ổn định, đã cho phép ngay cả những nghệ sĩ thiếu kinh nghiệm nhất tạo ra các tác phẩm phức tạp, trừu tượng hoặc chân thực bằng cách chỉ cần nhập một vài từ vào hộp văn bản.

Trình tạo nghệ thuật AI khuếch tán ổn định là gì?

Stable Diffusion là một công cụ tạo nghệ thuật AI mã nguồn mở được phát hành vào ngày 22 tháng 8 bởi AI ổn định. Khuếch tán ổn định được viết bằng Python và loại của nó là mô hình ngôn ngữ biến đổi. Nó có thể hoạt động trên mọi hệ điều hành hỗ trợ nhân Cuda.

Bạn cần 10GB (ish) dung lượng lưu trữ

Nhờ mô hình tổng hợp hình ảnh Khuếch tán ổn định nguồn mở, bất kỳ ai có PC và GPU đáng nể đều có thể tạo ra bất kỳ thực tế hình ảnh nào mà họ có thể hình dung. Nếu bạn đặt cho nó một câu mô tả, nó có thể bắt chước hầu hết mọi phong cách hình ảnh và kết quả sẽ xuất hiện một cách kỳ diệu trên màn hình của bạn.

Khuếch tán ổn định làm cho mã nguồn của nó có sẵn, không giống như các phương pháp tiếp cận như DALL-E. Giấy phép cấm một số tình huống sử dụng nguy hiểm nhất định.

Đạo đức AI đã bị chỉ trích bởi những người gièm pha, những người cho rằng mô hình này có thể được sử dụng để tạo ra các tác phẩm sâu và đặt ra vấn đề liệu có được phép tạo ra hình ảnh bằng cách sử dụng mô hình được đào tạo trên tập dữ liệu chứa nội dung có bản quyền mà không có sự cho phép của người sáng tạo ban đầu hay không .

PC của bạn phải có GPU với ít nhất 6 gigabyte (GB) của VRAM

Một phần của bộ dữ liệu LAION-Aesthetics V2 được dùng làm tập huấn luyện cho Khuếch tán ổn định. Nó được đào tạo với giá 600.000 USD sử dụng 256 GPU Nvidia A100.

Hoạt động kinh doanh dựa trên Khuếch tán ổn định, AI ổn định, đang thảo luận để huy động tiền với mức định giá lên tới $1 tỷ tính đến tháng 9 năm 2022.


AI sẽ thay thế các nhà thiết kế?


Có rất nhiều trường hợp sử dụng trí tuệ nhân tạo trong đời sống hàng ngày.

Bạn có sợ thuật ngữ AI không? Chúng tôi đã tạo một bảng chú giải chi tiết về AI cho các thuật ngữ trí tuệ nhân tạo được sử dụng phổ biến nhất và giải thích những kiến ​​thức cơ bản về trí tuệ nhân tạo cũng như những rủi ro và lợi ích của trí tuệ nhân tạo đối với các tổ chức và đối tượng khác.

Yêu cầu tải xuống Khuếch tán ổn định

Vào năm 2022, Stable Diffusion sẽ hoạt động trên PC chơi game thông thường nhưng không hoạt động trên điện thoại hoặc hầu hết máy tính xách tay của bạn. Đây là những yêu cầu tải xuống Khuếch tán ổn định mà bạn cần phải đáp ứng:

  • Một GPU có tại ít nhất 6 gigabyte (GB) của VRAM
    • Điều này bao gồm hầu hết các GPU NVIDIA hiện đại nhất
  • 10GB (ish) dung lượng lưu trữ trên ổ cứng hoặc ổ cứng thể rắn của bạn
  • Trình cài đặt Miniconda3
  • Các tệp Khuếch tán ổn định từ GitHub
  • Điểm kiểm tra mới nhất (Phiên bản 1.4tính đến thời điểm viết bài, nhưng 1.5 sẽ được phát hành sớm)
  • Trình cài đặt Git
  • Windows 810 hoặc 11
    • Khuếch tán ổn định cũng có thể chạy trên Linux và macOS
Trình tạo nghệ thuật AI khuếch tán ổn định là nguồn mở

Nếu bạn không có phần cứng, bạn có thể sử dụng AI giữa hành trình hoặc các trình tạo AI dựa trên web khác.

Làm cách nào để chạy AI khuếch tán ổn định?

Nó có đơn giản như âm thanh không? Không hẳn.

Cài đặt Git

Git là một công cụ cho phép các lập trình viên kiểm soát các bước lặp khác nhau của phần mềm mà họ đang tạo. Họ có thể để các nhà phát triển khác đóng góp cho dự án đồng thời duy trì một số phiên bản phần mềm mà họ đang làm việc trong một kho lưu trữ chung.

Git cung cấp một cách dễ dàng để truy cập và tải xuống các dự án này nếu bạn không phải là nhà phát triển. Vì vậy, chúng tôi sẽ sử dụng nó trong tình huống này. Cài đặt Git yêu cầu chạy Windows trình cài đặt x64 có thể được tải xuống từ trang web Git.

Trong khi trình cài đặt chạy, bạn sẽ được phép chọn từ một số lựa chọn; giữ tất cả chúng được đặt thành giá trị mặc định. Trang tùy chọn “Điều chỉnh môi trường PATH của bạn” là một trang quan trọng. “Git từ dòng lệnh và cả từ phần mềm của bên thứ 3” là tùy chọn duy nhất nên được chọn.

Cài đặt Miniconda3

Một số thư viện Python khác nhau được Stable Diffusion sử dụng. Đừng lo lắng quá nhiều về điều này nếu bạn không biết nhiều về Python; chỉ cần nói rằng thư viện chỉ là các gói phần mềm mà máy tính của bạn có thể sử dụng để thực hiện các tác vụ cụ thể, như thay đổi hình ảnh hoặc thực hiện các phép toán khó.

Về bản chất, Miniconda3 là một công cụ tiện lợi. Nó cho phép bạn quản lý tất cả các thư viện cần thiết để chạy Khuếch tán ổn định mà không cần nhiều lao động thủ công. Đó cũng sẽ là cách chúng ta áp dụng sự khuếch tán ổn định vào thực tế.

Nhận cài đặt mới nhất bằng cách truy cập Trang tải xuống Miniconda3 và chọn “Miniconda3 Windows 64-bit.”

Sau khi tải xuống, bấm đúp vào tệp thực thi để khởi chạy cài đặt. Cài đặt bằng Miniconda3 yêu cầu ít lần nhấp vào trang hơn so với Git. Tuy nhiên, bạn nên thận trọng với sự lựa chọn này:

Trước khi chọn nút tiếp theo và hoàn tất cài đặt, hãy đảm bảo rằng “Tất cả người dùng” đã được chọn.

Sau khi thiết lập Git và Miniconda3, máy tính của bạn sẽ yêu cầu bạn khởi động lại.

Tải xuống kho lưu trữ GitHub khuếch tán ổn định và Điểm kiểm tra mới nhất

Bây giờ phần mềm cần thiết đã được thiết lập, chúng ta có thể tải xuống và cài đặt Stable Diffusion.

Các trạm kiểm soát mới nhất nên được tải xuống đầu tiên. Trước tiên bạn phải tạo một tài khoản để tải xuống trạm kiểm soát, nhưng tất cả những gì họ muốn là tên và địa chỉ email của bạn.

“sd-v1-4Liên kết .ckpt” sẽ khởi chạy quá trình tải xuống. Mặc dù “sd-v1-4-full-ema.ckpt,” tệp còn lại, lớn gần gấp đôi, nó có thể mang lại kết quả tốt hơn. Hoặc có thể được sử dụng.

Khuếch tán ổn định sau đó phải được tải xuống từ GitHub. Nhấp vào “Tải xuống ZIP” sau khi chọn nút “Mã” màu xanh lá cây. Bạn cũng có thể dùng liên kết tải xuống trực tiếp này.

Bây giờ chúng ta cần thiết lập một vài thư mục để có thể giải nén các tệp để Khuếch tán ổn định. Nhập “miniconda3” vào thanh tìm kiếm của Menu Bắt đầu bằng cách nhấp vào nút Bắt đầu, sau đó chọn “Mở” hoặc Enter.

Sử dụng dòng lệnh, chúng ta sẽ tạo một thư mục có tên là “ổn định-khuếch tán”. Nhấn Enter sau khi dán khối mã sau vào cửa sổ Miniconda3.

Cửa sổ Miniconda3 sẽ xuất hiện nếu mọi thứ diễn ra theo đúng kế hoạch. Chúng tôi sẽ cần lại Miniconda3 trong giây lát, vì vậy hãy tiếp tục mở nó.

Mở kho lưu trữ ZIP “stable-diffusion-main.zip” mà bạn nhận được từ GitHub trong trình lưu trữ tệp ưa thích của mình. Nếu bạn không có một cái, Windows có thể tự mở các tệp ZIP để thay thế. Mở cửa sổ File Explorer thứ hai và điều hướng đến thư mục “C:stable-diffusion” mà chúng ta vừa tạo trong khi vẫn mở tệp ZIP trong cửa sổ đầu tiên.

Kéo và thả thư mục “ổn định-khuếch tán-chính” từ kho lưu trữ ZIP vào thư mục “ổn định-khuếch tán”.

Quay lại Miniconda3 và dán các lệnh bên dưới vào cửa sổ:

cd C:\stable-diffusion\stable-diffusion-main
conda env create -f environment.yaml
conda activate ldm
mkdir models\ldm\stable-diffusion-v1

Đừng dừng thủ tục. Có thể mất chút thời gian để tải xuống vì một số tệp lớn hơn gigabyte. Bạn phải xóa thư mục môi trường và chạy lại conda env create -f môi trường.yaml nếu bạn tạm dừng quá trình do nhầm lẫn. Trong trường hợp đó, hãy thực hiện lệnh trước đó sau khi xóa thư mục “ldm” trong “C:Users(Your User Account).condaenvs.”

Chúng ta đã đến giai đoạn cuối cùng của quá trình cài đặt. Sao chép và dán tệp điểm kiểm tra (sd-v1-4.ckpt) vào thư mục “C:stable-diffusionstable-diffusion-mainmodelsldmstable-diffusion-v1” bằng File Explorer.

Sau khi truyền xong tệp, hãy chọn “Đổi tên” từ menu ngữ cảnh khi bạn nhấp chuột phải vào “sd-v1-4.ckpt.” Để đổi tên tệp, hãy nhập “model.ckpt” vào vùng được đánh dấu và nhấn Enter.

Và với điều đó, chúng tôi đã hoàn thành.

Trình tạo nghệ thuật AI khuếch tán ổn định: Có một công cụ tìm kiếm nghệ thuật AI Khuếch tán ổn định có tên là Lexica

Bây giờ chúng tôi đã sẵn sàng để sử dụng khuếch tán ổn định. Nhưng bằng cách nào?

Làm cách nào để sử dụng trình tạo nghệ thuật AI Khuếch tán ổn định?

  • Kích hoạt môi trường ldm
  • Thay đổi thư mục
  • Sử dụng txt2img.py và viết văn bản của bạn
  • Chờ quá trình
  • Kiểm tra kết quả

Khuếch tán ổn định hoạt động như thế nào? Bạn phải kích hoạt môi trường ldm mà chúng tôi đã xây dựng mỗi khi bạn muốn sử dụng tính năng khuếch tán ổn định vì điều này rất quan trọng. Trong cửa sổ Miniconda3, nhập conda activate ldm và nhấn “Enter”. (ldm) ở phía bên trái biểu thị sự hiện diện của môi trường ldm đang hoạt động.

Trước khi tạo bất kỳ hình ảnh nào, trước tiên chúng ta phải thay đổi thư mục (do đó là commandcd) thành “C:stable-diffusionstable-diffusion-main.” Thêm đối số dòng lệnh cd C:stable-diffusionstable-diffusion-main.

Chúng tôi sẽ sử dụng một chương trình có tên txt2img.py để biến lời nhắc văn bản thành đồ họa 512512.

Bảng điều khiển sẽ hiển thị cho bạn thanh tiến trình khi nó tạo hình ảnh.

Tất cả các hình ảnh được tạo ra đều nằm ở “C:\stable-diffusion\stable-diffusion-main\outputs\txt2img-samples\samples”.

Ví dụ về khuếch tán ổn định

Đây là một số ví dụ về Khuếch tán ổn định tốt nhất:

Nghệ thuật Lexica là gì?

Có một công cụ tìm kiếm và thư viện tên là Lexica dành cho các tác phẩm nghệ thuật được tạo ra bằng Stable Diffusion.

Anh có thể kiểm tra từ điển, một trang web dành cho công cụ tìm kiếm hình ảnh do AI tạo ra Khuếch tán ổn định. Trong Lexica, bạn có thể tìm thấy lời nhắc về hình ảnh được tạo.


Trí tuệ nhân tạo có tốt hơn trí tuệ con người không?


Công cụ tạo nghệ thuật AI Khuếch tán ổn định lớn đến mức nào?

Bạn cần 10GB (ish) dung lượng lưu trữ trên ổ cứng hoặc ổ cứng thể rắn.

Là nguồn mở phổ biến ổn định?

Đúng. Một mạng lưới thần kinh được huấn luyện dựa trên hàng triệu bức ảnh được tải xuống từ Internet sẽ tạo ra những hình ảnh được sử dụng trong Stable Diffusion, nó đã trở thành nguồn mở vào ngày 22 tháng 8.

Phần kết luận

Mô hình tạo hình ảnh nguồn mở từ Stability AI có thể so sánh với DALL-E 2 về mặt chất lượng. Ngoài ra, họ còn ra mắt DreamStudio, một trang web vì lợi nhuận cung cấp thời gian tính toán để tạo hình ảnh bằng cách sử dụng Stable Diffusion. Không giống như DALL-E 2bất kỳ ai cũng có thể sử dụng Khuếch tán ổn định và vì mã là nguồn mở nên các dự án có thể xây dựng dựa trên mã đó với một số hạn chế.

Trình tạo nghệ thuật AI khuếch tán ổn định: DALL-E và Midjourney AI là những công cụ AI chuyển văn bản thành hình ảnh phổ biến nhất

Có một cảnh sát trưởng mới trong thị trấn. DALL-E và Midjourney AI vừa có đối thủ cạnh tranh mới. Quan trọng nhất là nó miễn phí! Chúng ta sẽ xem điều gì sẽ thay đổi trong cuộc chiến tạo ra nghệ thuật AI.

Nghề nghiệp trí tuệ nhân tạo đang rất hot và đang gia tăng, cùng với các công việc về kiến ​​trúc dữ liệu, điện toán đám mây, kỹ sư dữ liệu và kỹ sư máy học. Hãy xem những bậc thầy giỏi nhất về trí tuệ nhân tạo và cải thiện kỹ năng của bạn.