Tin tức và phân tích của tất cả các thiết bị di động

OpenAI: tất cả về công ty đã tạo ra ChatGPT và DALL-E

Vào cuối năm 2022, trí tuệ nhân tạo nổi lên như một chủ đề thời sự. Chỉ qua một đêm, rất nhiều nội dung – hình ảnh hoặc văn bản – do trí tuệ nhân tạo tạo ra đã xuất hiện trên các bài báo hoặc trên mạng xã hội. Trình tự này cho thấy sự say mê thực sự của công chúng đối với AI, dù khen ngợi hay chỉ trích nó. Đằng sau sự phấn khích này, chúng tôi tìm thấy hai công cụ đặc biệt: trình tạo hình ảnh DALL-E và bot ChatGPT. Do đó, công ty Mỹ đứng sau hai giải pháp này, OpenAI, đã bất ngờ được đưa ra ánh sáng. Trong bài viết này, chúng tôi mời bạn quay trở lại cuộc hành trình của anh ấy!

Nguồn gốc của OpenAI

OpenAI được thành lập vào cuối năm 2015. Cấu trúc ban đầu xuất hiện dưới hình thức một hiệp hội phi lợi nhuận, được tạo ra theo sáng kiến ​​​​của Elon Musk và Sam Altman. Vào thời điểm OpenAI thành lập, Sam Altman điều hành một trong những vườn ươm khởi nghiệp nổi tiếng nhất Thung lũng Silicon: Y Combinator. Doanh nhân này bắt đầu sự nghiệp vào năm 2005, tạo ra ứng dụng mạng xã hội Loopt khi mới 19 tuổi. Công ty được bán vài năm sau đó với giá 43,4 hàng triệu đô la.

Khi ra mắt, mục tiêu của OpenAI là đạt được những tiến bộ lớn trong lĩnh vực trí tuệ nhân tạo. Để đạt được điều này, Elon Musk đang đầu tư 100 triệu USD vào dự án. Nhưng sau đó 3 Sau nhiều năm hợp tác, người sáng lập SpaceX rời tàu, thất vọng vì tiến độ công việc. Sau đó, tỷ phú tin rằng kết quả của OpenAI thấp hơn kết quả mà các đối thủ cạnh tranh của nó đạt được, chẳng hạn như Google Deepmind. Về mặt chính thức, sự ra đi của Musk là do có thể xảy ra xung đột lợi ích liên quan đến mong muốn thiết kế một chiếc xe tự hành tại Tesla của ông.

Hợp tác với Microsoft và phát hành các mô hình ngôn ngữ đầu tiên

Năm 2019, OpenAI trở thành công ty vì lợi nhuận, cho phép thu hút vốn. Trong quá trình này, mối quan hệ hợp tác được ký kết với Microsoft, sau đó công ty sẽ đầu tư 1 dự án trị giá hàng tỷ USD. Hiệp hội này, sau đó được hợp nhất bằng khoản đầu tư 10 tỷ đô la, sẽ cho phép OpenAI phát triển đáng kể, tận dụng siêu máy tính được lưu trữ trên đám mây Azure.

Vào tháng 2 cùng năm, OpenAI phát hành GPT-2một mô hình ngôn ngữ được đào tạo trên một tập dữ liệu lớn – 8 triệu trang web và 1,5 tỷ tham số – và có thể tạo văn bản như con người. Mô hình này gây ấn tượng mạnh với các nhà nghiên cứu OpenAI đến mức họ từ chối xuất bản mã dưới dạng nguồn mở như kế hoạch ban đầu. Các chuyên gia tin rằng mô hình loại này có thể được sử dụng cho mục đích xấu, chẳng hạn như viết và phát tán tin tức giả mạo hoặc thực hiện các hành vi lừa đảo. Những nghi ngờ này sẽ càng được khuếch đại sau này, khi ChatGPT được phát hành.

Vào tháng 5 năm 2020, OpenAI phát hành phiên bản cải tiến của mô hình ngôn ngữ: GPT-3. Cái này hiệu quả hơn đáng kể, được đào tạo trên 175 tỷ thông số. Hơn nữa, nguồn học tập của mô hình rộng hơn và vốn từ vựng của nó phong phú hơn (500.000 từ, so với 40.000 từ của GPT-2).

Đầu ra của DALL-E

DALL-E, được cung cấp bởi GPT-3, ra đời vào tháng 1 năm 2021. Trình tạo hình ảnh trí tuệ nhân tạo này cho phép, từ lời nhắc, tạo ảnh và hình minh họa, thực hiện sửa đổi và tạo các biến thể. Để hoạt động, DALL-E sử dụng mạng thần kinh có tên CLIP (Đào tạo trước ngôn ngữ-hình ảnh tương phản), có thể dự đoán mô tả văn bản tốt nhất cho hình ảnh. Một năm sau, phiên bản thứ 2 của máy phát điện (DALL-E 2) được ném. So với phiên bản trước, DALL-E 2 hiểu rõ hơn về các truy vấn, thực hiện nhanh hơn và tạo ra hình ảnh chất lượng tốt hơn.

Việc phát hành DALL-E và các đối thủ cạnh tranh của nó (Midjourney hoặc Stable Diffusion) là chủ đề thực sự thu hút sự quan tâm, đặc biệt là trên các mạng xã hội nơi hình ảnh được chia sẻ ồ ạt. Đồng thời, những nghi ngờ đầu tiên bắt đầu xuất hiện. Sau đó, mối quan tâm chính liên quan đến bản quyền của hình ảnh được thuật toán sử dụng và rủi ro tạo ra những bức ảnh sai lệch nhằm mục đích đưa thông tin sai lệch. Tuy nhiên, nền tảng này đặt ra một số rào cản, chẳng hạn như không thể tạo ra hình ảnh đại diện cho các nhân vật chính trị.

Thành quả của sự hợp tác với Microsoft, công nghệ DALL-E sẽ được sử dụng để tạo ra Bing Image Creator, công cụ tạo hình ảnh của công ty Redmond.

Hiện tượng ChatGPT

Nếu DALL-E được nhắc đến nhiều thì vào cuối năm 2022, OpenAI sẽ bước vào một chiều hướng khác, với việc phát hành ChatGPT. Trình tạo văn bản trí tuệ nhân tạo sử dụng mô hình ngôn ngữ GPT-3.5phiên bản được tối ưu hóa của GPT-3. Công cụ này có thể trả lời các câu hỏi của người dùng Internet, phân loại và trích xuất dữ liệu, tạo mã máy tính hoặc tạo ra các loại văn bản khác nhau (email, câu chuyện, nội dung SEO, v.v.).

Ngay lập tức, chatbot trở thành một hiện tượng thực sự, khiến một số người tỏ ra hào hứng và một số khác lại mất lòng tin. Danh tiếng của nó vượt xa hệ sinh thái công nghệ và công cụ này được giới truyền thông đưa tin đáng kể. Từ đầu năm 2023, nhiều công ty áp dụng GPT-3.5 : ứng dụng ChatGPT được tạo cho Slack, Microsoft tạo chatbot liên kết với Bing, Snaptchat tích hợp người bạn ảo sử dụng công nghệ, v.v.

Tuy nhiên, ChatGPT có một số hạn chế. Dữ liệu của anh ấy bị giới hạn đến tháng 9 năm 2021 và anh ấy không được kết nối với web. Ngoài ra, một số người dùng nhận thấy đôi khi thời gian phản hồi lâu và khó tiếp thu lượng lớn văn bản. Vì vậy, OpenAI đã chọn cung cấp phiên bản trả phí, ChatGPT Plus, cung cấp dịch vụ nhanh hơn, có khả năng xử lý dữ liệu lớn hơn. Công thức đăng ký này mang lại cơ hội cho OpenAI kiếm thêm thu nhập, việc phát triển ChatGPT đặc biệt tốn kém.

GPT-4 : một mô hình ngôn ngữ thậm chí còn tiên tiến hơn

Vào tháng 3 năm 2023, OpenAI phát hành GPT-4, mô hình AI đa phương thức mới của nó. So với GPT 3.5, mô hình cho thấy hiệu suất vượt trội. Nó có thể tích hợp lời nhắc bao gồm văn bản và hình ảnh, để quản lý tốt hơn các ngôn ngữ khác nhau và tiếp thu số lượng nội dung lớn hơn. Nó cũng được ưu đãi với khả năng sáng tạo tiên tiến hơn. Mô hình này ngay lập tức được tích hợp vào ChatGPT Plus.

Một số plugin sử dụng GPT-4 sau đó nổi lên, ban đầu là với các đối tác của OpenAI: KAYAK, Expedia, OpenTable, v.v. Trong quá trình này, nhiều tiện ích mở rộng trên chrome, hưởng lợi từ API, cũng xuất hiện. Ví dụ: họ cho phép ChatGPT duyệt web.

Mối quan tâm đầu tiên của cơ quan công quyền

Đồng thời, một số cơ quan công quyền bắt đầu băn khoăn về nhiều vấn đề liên quan đến trí tuệ nhân tạo và đặc biệt là ChatGPT. Tại Ý, chính quyền đã đưa ra quyết định quyết liệt để chặn chatbot, cáo buộc OpenAI không tôn trọng luật pháp liên quan đến dữ liệu cá nhân và không xác minh độ tuổi của người dùng.

Nếu các quốc gia châu Âu khác dường như không hướng tới lệnh cấm thì các hoạt động của OpenAI sẽ đáng lo ngại và nhiều cuộc điều tra đã được mở, đặc biệt là ở Tây Ban Nha và Pháp (sau khi nộp 5 đơn khiếu nại). Sau đó, một giải pháp được dự tính ở quy mô châu Âu, với việc thành lập một nhóm làm việc do Ủy ban bảo vệ dữ liệu châu Âu (EDPB) khởi xướng.

Triển vọng nào cho AI mở?

Sam Altman, hiện là người đứng đầu OpenAI một mình, chia sẻ những lo ngại về trí tuệ nhân tạo. Về vấn đề này, người quản lý đã nói chuyện vớiTin tức ABC :

Tôi đặc biệt lo ngại rằng những mô hình này sẽ được sử dụng để cung cấp thông tin sai lệch trên quy mô lớn […] Bây giờ chúng đã biết cách viết mã máy tính tốt hơn, chúng có thể được sử dụng cho các cuộc tấn công mạng mang tính tấn công.

Sam Altman giải thích rằng ông sẽ giải quyết một loạt vấn đề bảo mật như một phần của quá trình phát triển GPT-4. Mặt khác, doanh nhân này cho rằng sự phát triển của GPT-5 vẫn chưa có trong chương trình nghị sự tại OpenAI.

OpenAI trong một vài số liệu

Dưới đây là một số con số giúp hiểu được quy mô của OpenAI:

186 triệu tài khoản được tạo ra (số liệu từ tháng 3 năm 2023),
1,6 tỷ lượt truy cập chỉ trong tháng 3 năm 2023 trên ChatGPT,
700.000 USD một ngày để duy trì hoạt động của ChatGPT. Hầu hết các chi phí đều liên quan đến máy chủ,
8 phút thời gian truy cập trung bình trên ChatGPT,
1 Tỷ đô la về doanh thu vào năm 2024: đây là những tham vọng mà công ty đã thể hiện với các nhà đầu tư của mình.