Tin tức và phân tích của tất cả các thiết bị di động

Bây giờ hình ảnh sẽ được tạo bằng ChatGPT

Công nghệ đột phá này có thể thay đổi bộ mặt của các mô hình văn bản và hình ảnh vốn từ lâu đã phải vật lộn để thích ứng với bối cảnh ngôn ngữ. Trong một bài báo khám phá sự hiểu biết mang tính quan hệ của các mô hình AI tổng quát, các nhà nghiên cứu nhận thấy rằng họ “không hiểu” mối quan hệ vật lý của một số đối tượng nhất định. Trò chuyện trực quanGPT có thể giúp khắc phục hạn chế này và dẫn đến sự phát triển trong tương lai về trí tuệ nhân tạo tổng hợp (AGI).

Trò chuyện trực quanGPT hoạt động như thế nào?

Visual ChatGPT về cơ bản được xây dựng dựa trên khả năng của các mô hình nền tảng trực quan như Khuếch tán ổn định, ControlNet và BLIP. Trò chuyệnGPTđặc điểm hiểu ngôn ngữ của “người quản lý nhanh chóng“Nó hoạt động như một giao diện giữa ChatGPT và các mô hình trực quan, cho phép xử lý đầu ra liền mạch.

Sự tích hợp này giúp khắc phục những hạn chế của cả hai nền tảng và dẫn đến phiên bản ChatGPT có khả năng cao hơn nhiều bằng cách tận dụng khả năng của VFM thông qua trình quản lý lời nhắc, thay vì dựa vào ảo giác.

Đây là hình ảnh về cách nó hoạt động:

Một trong những ưu điểm chính của Visual ChatGPT là nó cho phép chia sẻ hình ảnh với ChatGPT. Người quản lý nhanh chóng nói, “phục vụ namvới ” (ChatGPT)đầu bếpMột “” truyền đơn đặt hàng và thực phẩm giữa ” (VFM)quản lý bếpNó di chuyển như thế.

Hệ thống này cũng bao gồm một dạng lý luận, cho phép ChatGPT quyết định khi nào cần một công cụ như VFM để cung cấp đầu ra cần thiết.

Visual ChatGPT là gì và cách sử dụng nó?

Trước khi sử dụng bản demo Visual ChatGPT, bạn cần làm theo các bước được nêu trên trang GitHub. Đây là những gì bạn cần làm để chạy Visual ChatGPT:

# tạo môi trường mới
conda tạo -n visgpt python=3.8
# kích hoạt môi trường mới
conda kích hoạt visgpt
# chuẩn bị môi trường cơ bản
cài đặt pip -r request.txt
#tải về các mô hình nền tảng trực quan
tải xuống bash.sh
# chuẩn bị khóa riêng openAI riêng tư của bạn
xuất OPENAI_API_KEY={Your_Private_Openai_Key}
# tạo thư mục để lưu ảnh
mkdir ./hình ảnh
# Bắt đầu trò chuyện trực quanGPT!
python visual_chatgpt.py

Do mô hình mới không được phát triển riêng biệt như các mô hình LLM và T2I trước đây nên đây là một công cụ hữu ích có khả năng giảm thời gian học tập của các mô hình chuyển văn bản thành hình ảnh và cho phép các chương trình AI tương tác với nhau.

Với sự phát triển đổi mới, hiệu suất của các mẫu trước đó có thể được tăng lên đáng kể.

Dự kiến ​​​​sẽ vượt trội trong việc tạo hình ảnh với ChatGPT GPT-4đầu ra của được chờ đợi với sự nhiệt tình lớn lao. Tuy nhiên, ngày phát hành của mẫu máy dự kiến ​​này hiện vẫn chưa rõ.

Cơ hội kinh doanh mới được cung cấp bởi trí tuệ nhân tạo

Với sự phát triển của lĩnh vực kỹ thuật nhanh chóng, các hạng mục kinh doanh mới quan trọng đang nổi lên, chẳng hạn như AI thì thầm. Những chuyên gia này giúp các mô hình AI “hiểu” ngôn ngữ và bối cảnh của con người, cho phép xử lý ngôn ngữ tự nhiên hiệu quả hơn.

Trình quản lý lời nhắc trong mô hình trí tuệ nhân tạo mới được coi là một bước tiến quan trọng trong lĩnh vực này và đơn giản hóa việc truyền thông tin bằng mô hình mà không cần đến những lời nhắc phức tạp. Do đó, những công việc như kỹ thuật nhanh chóng ngày càng trở nên dễ tiếp cận hơn đối với những người quan tâm đến công nghệ AI.

Phần kết luận

Visual ChatGPT được coi là một tiến bộ đáng kể trong lĩnh vực nhân tạo và có tiềm năng mở rộng khả năng của các mô hình mới nhất. Nó mang lại tiềm năng bằng cách kết hợp các điểm mạnh của mô hình LLM và T2I, giảm các rào cản gia nhập và tăng khả năng tương thích giữa các công cụ AI khác nhau.

Chúng ta vẫn cần tìm hiểu nhiều về khả năng của Visual ChatGPT và các công nghệ tương tự.