▷ Trò chuyệnGPT-4 vs ChatGPT-3.5 mặc định so với Trò chuyệnGPT-3.5 Phiên bản cũ hơn: Sự khác biệt đã được kiểm tra

ChatGPT được mong đợi 4.0 sẽ tạo nên làn sóng lớn trong thế giới chatbot. Nhưng liệu nó có thực sự vượt trội hơn người tiền nhiệm của nó? Hãy kiểm tra.

ChatGPT chỉ là phần nổi của tảng băng trôi tự động hóa sắp tới và Google, Microsoft cũng như nhiều công ty AI khác đã làm theo.

Để bắt đầu, chúng tôi đã tìm thấy một số chatbot như ChatGPT, nhiều trong số đó không phải là công nghệ lớn.

Nhưng hãy gọi nó là sức mạnh tiếp thị; ChatGPT vẫn là ông vua trị vì của tất cả các bot AI như vậy. Nó có thể làm được nhiều việc, bao gồm toán, thơ, viết blog và thậm chí mọi người còn sử dụng nó để nộp đơn kiện.

DoNotPay đang nghiên cứu sử dụng GPT-4 để tạo ra “các vụ kiện chỉ bằng một cú nhấp chuột” để kiện những kẻ gọi tự động đòi 1.500 đô la. Hãy tưởng tượng bạn trả lời cuộc gọi, nhấp vào nút, cuộc trò chuyện được chép lại và một vụ kiện 1000 từ được tạo ra. GPT-3.5 không đủ tốt, nhưng GPT-4 anh ấy xử lý nhiệm vụ này một cách xuất sắc: pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) Ngày 14 tháng 3 năm 2023

Anh ấy khiến hàng chục chuyên gia lo lắng rằng kỹ năng của họ sẽ trở nên vô dụng trong tương lai gần.

Tuy nhiên, tôi đã đọc một bài đăng trên Linkedin có nội dung:

AI không thể thay thế bạn, nhưng ai đó sử dụng AI thì có thể.

Vì vậy, hãy cùng chờ xem bản cập nhật ChatGPT mới nhất và xem nó khác với các phiên bản trước như thế nào.

ChatGPT: Kế thừa, Mặc định và Cập nhật

Vì vậy, đối với người dùng trả phí, có ba phiên bản: Legacy (3.5), mặc định (3.5) và bản cập nhật ChatGPT mới nhất (4).

Mặc dù chúng ta sẽ tìm hiểu sâu hơn một chút về khả năng của chúng nhưng đây là những gì OpenAI nói về sự khác biệt:

Nguồn: OpenAI

Vì vậy, mặc dù người dùng miễn phí chỉ có Legacy để chơi 3.5đăng ký trả phí cung cấp cả ba tính năng này để cố gắng đáp ứng những gì người dùng cho là tốt nhất.

Tóm lại hình ảnh trước đó, các gói trả phí đều nhằm mục đích nhận được kết quả chính xác hơn với tốc độ vừa phải. Tuy nhiên, sự khác biệt chỉ dễ nhận thấy khi các gợi ý phức tạp và đòi hỏi sự sáng tạo.

Tham sốChatGPT 4ChatGPT 3Điểm thi .5BarCao nhất 10%Thấp hơn 10%Thử thách lý luận AI2 (ARC)96,3%85,2% Điểm mã hóa Python67%48,1%Giải thích trực quanCóKhôngNgữ cảnhHơn 25.000 ít từ hơn Nguồn: OpenAI

Ngoài ChatGPT 4 có thể chấp nhận dữ liệu trực quan.

Vâng, đủ các định nghĩa trong sách giáo khoa. Hãy bắt tay vào đánh giá những ứng cử viên này trên chiến trường thực sự.

Các phần sau đây chứa đầy hình ảnh có vẻ mờ nhạt. Trong trường hợp này, nhấp chuột phải vào bất kỳ hình ảnh nào và chọn Mở trong Tab mới để xem chính xác.

toán học

Là một sinh viên tốt nghiệp ngành kỹ thuật, tôi không thể không ném ra một số vấn đề cơ bản cho họ. Hãy bắt đầu với các phương trình đại số đơn giản.

giai đoạn 1

Nhiều người trong chúng ta đã thấy những phương trình này ax2+bx+c=0mà chúng ta cần giải để tìm X. Ở đây tôi đã đưa ra một gợi ý đơn giản: Giải tìm x: x2 + x – 6 = 0

Trong khi tất cả chúng đều có cùng một gốc (X= -3,2), Legacy và Update giống nhau hơn ở chỗ sử dụng trực tiếp công thức (như bất kỳ học sinh nào cũng làm) để tìm kết quả.

Tuy nhiên, trong Mặc định 3.5 giải thích hai phương pháp, bao gồm phân tích nhân tử, mà bất kỳ học sinh giỏi nào cũng thường sử dụng khi giải các phương trình thông thường như vậy.

giai đoạn 2

Sau đó tôi nhờ anh ấy giải một phương trình bậc ba hơi phức tạp: x^3 -12x^2 + 48x – 64 = 0.

Điều này thực sự đã chứng minh tại sao ChatGPT 4 là một “bản cập nhật”.

Đây là những câu trả lời:

Tất cả sự cường điệu đó và ChatGPT Legacy và Default đều không thể giải được phương trình bậc ba tổng quát. Tuy nhiên, Legacy đã làm tốt hơn một chút và tìm thấy chính xác hai gốc, trong khi Default đều thất bại với tất cả chúng.

Bản cập nhật là người chiến thắng rõ ràng trong giai đoạn thứ hai và giải phương trình một cách hoàn hảo, tìm ra cả ba nghiệm với lời giải thích hay.

Lý luận logic

Chúng ta có thể giả định một cách an toàn rằng hầu hết các bài toán cơ bản đều có lời giải từ điển. Nếu bạn biết định lý hoặc công thức, hãy nhập các giá trị và nhận được kết quả.

Và ChatGPT, là một AI, có thể hoạt động nhanh chóng với những truy vấn như vậy. Tuy nhiên, lý luận logic là một lĩnh vực khác có khả năng AI thất bại cao.

giai đoạn 1

Tôi đã cho họ một câu kinh điển:

A lớn tuổi hơn B.
C lớn tuổi hơn A.
B lớn tuổi hơn C.
Câu thứ ba đúng hay sai nếu hai câu đầu đều đúng?

Tất cả các phiên bản của ChatGPT đều đúng khi tuyên bố rằng tuyên bố thứ ba là sai.

Sau đó, tôi sử dụng tên thay vì bảng chữ cái và kết quả có thể làm bạn ngạc nhiên:

Vì vậy, phiên bản mặc định 3.5 cô ấy tiếp tục thành tích kém cỏi của mình và bối rối với sự đa dạng khiêm tốn này. Tuy nhiên, Legacy và cập nhật vẫn hoạt động tối ưu.

giai đoạn 2

Bạn có thể đã nhận thấy rằng mục đích của Giai đoạn I và Giai đoạn II này là tìm ra điểm khác biệt trong đó độ phức tạp của một lời nhắc nhất định khiến Bản cập nhật khác biệt với hai giai đoạn còn lại.

Lời nhắc ở đây là một câu đố logic đơn giản:

Một buổi sáng sau khi mặt trời mọc, Rohit đang quay mặt về phía cột điện. Bóng của cây cột rơi thẳng vào bên phải anh. Anh ấy đang đối mặt với hướng nào?
A. Bắc
B. Tây
C. Nam
D. Đông

Điều này buộc Legacy phải đưa ra câu trả lời không chính xác, trong khi Default lại đáp lại bằng những lời giải thích mơ hồ dẫn đến kết luận sai lầm.

Chỉ có Cập nhật mới đưa ra câu trả lời đúng, với những câu nói dễ hiểu.

Bức thư

Việc nộp đơn kiện có thể khó khăn nhưng đôi khi điều đó không xảy ra nếu bạn có thể soạn thảo một thông báo đầu tiên nổi bật.

Đây là nơi tôi thực hiện với lời nhắc này: Viết thư cho Tim Cook để tặng tôi một quả táo vì đã không phản hồi một trong những dòng tweet của tôi.

Buồn cười nhỉ, vâng! Nhưng hãy xem AI có thể làm được gì.

di sản 3.5 anh ta ngay lập tức chấp nhận lời nhắc như một nô lệ robot và gửi một lá thư có thể khiến tôi trở thành sự chế giễu hoàn hảo nếu nó đến được đích đã định.

Mặc định cũng không tốt. Tuy nhiên, nó khiến tôi im lặng như một ông già gắt gỏng làm với một đứa trẻ năm tuổi.

Mặc dù các lập luận được trình bày là chính xác nhưng nó lại kết thúc cuộc vui mà không có nhiều khoa học.

Mặc dù đây là một động lực khá đơn giản nhưng nó đòi hỏi sự suy nghĩ và sáng tạo. Và đó là lúc người anh lớn Update đưa ra quan điểm của mình:

Đầu tiên, nó đã được chỉnh sửa gần như hoàn hảo. Thứ hai, nó đã giúp tôi tìm kiếm trên Google địa chỉ của văn phòng đã đăng ký Apple (mặc dù các mục như vậy cần được xác minh).

Thứ ba, nó được viết hay, với giọng điệu trang trọng và pha chút hài hước. Ngoài ra, ý định đã rõ ràng ngay trong chủ đề.

Tuy nhiên, bức thư vẫn truyền tải được cảm xúc của một người hâm mộ bất mãn Apple.

Điều này khiến ChatGPT 4 (còn gọi là Cập nhật) vượt xa những người anh em họ cũ của nó. Anh ta cực kỳ thông minh và có một số dấu hiệu thông thường, điều này khiến anh ta không chỉ là một chatbot buồn tẻ, nhàm chán.

Thơ

Tôi nghĩ khi ChatGPT đang chạy, thơ có thể là điểm yếu của nó.

Suy cho cùng, một người cần có cảm xúc, sự sáng tạo và rất nhiều nỗ lực để tạo ra thứ gì đó thực sự gây được tiếng vang với người đọc.

Nói một cách đơn giản, thơ ca là nghệ thuật đẹp nhất và tôi thầm mong AI sẽ thất bại. Nhưng đó là trước khi đồng nghiệp của tôi tấn công mạnh mẽ chúng tôi trên Slack newsblog.pl bằng việc tạo ra ChatGPT trước bản cập nhật này 4.0.

giai đoạn 1

Đây là lời khuyên mà tôi dành cho các ứng viên của chúng tôi: “Hãy diễn đạt một cách thơ mộng tại sao hoặc tại sao không phục vụ bánh mì kẹp thịt cùng với thực đơn hiện tại của họ có thể mang lại lợi ích cho chuỗi cửa hàng pizza domino. Đừng vượt quá 100 từ.”

Bạn có thể nhận ra sự khác biệt?

Phiên bản Default rất ngắn, chỉ có 32 từ và không thể tận dụng băng thông sẵn có để thể hiện sự sáng tạo của mình.

Legacy, mặc dù sử dụng tối đa ba từ, nhưng kết luận rằng việc cố gắng phục vụ pizza ở nhà bên cạnh không có rủi ro và sẽ dẫn đến một số thành công, điều này không hoàn toàn đúng.

Thơ của Bản cập nhật chỉ có 53 từ, lãng phí gần một nửa số từ được phân bổ. Mặc dù vậy, phần thưởng và cạm bẫy tiềm ẩn đã rõ ràng và không thể đạt được kết quả nào, điều mà tôi cho là nhân đạo hơn những điều còn lại.

giai đoạn 2

Sau đó tôi yêu cầu tất cả họ “giải thích thơ cho một đứa trẻ năm tuổi”.

Điều thú vị là Legacy không thể lấy bối cảnh từ cuộc trò chuyện và giải thích theo nghĩa đen là “Thơ”. Default lấy bối cảnh và tóm tắt nó trong một đoạn văn vẫn hợp lý.

Tiếp nối xu hướng này, ChatGPT 4 ông đơn giản hóa khả năng sáng tạo của mình trong khi vẫn giữ được hương vị thơ mộng.

ChatGPT Premium và ChatGPT miễn phí

Chậm là chậm thiếu tốc độ và độ chính xác và không phù hợp với ChatGPT 4nhưng nó cũng không hoàn toàn vô dụng.

Để so sánh nó trên một sân chơi bình đẳng, tôi đã đưa ra những lời nhắc tương tự như chúng tôi đã thử nghiệm Legacy, Default và Update.

🔵 Toán: giải phương trình bậc hai nhưng lại trả lời sai phương trình bậc ba. (như Legacy và Default)

🔵 Lý luận logic: vượt qua giai đoạn đầu tiên với bảng chữ cái và tên, nhưng thất bại ở giai đoạn thứ hai (như Kế thừa).

🔵 Thư: Anh ấy không viết thư và cho rằng lời kêu gọi đó là phi đạo đức và không phù hợp. (như mặc định)

🔵 Thơ: Thơ trên 30 từ được sáng tác và giải thích rõ ràng. (tương tự như mặc định).

Vì vậy, chúng ta có thể kết luận rằng phiên bản miễn phí cũng không tệ. Nó thực sự ngang bằng với Mặc định 3.5và ở một số khía cạnh thậm chí còn tốt hơn.

Cũng đọc: Những gợi ý mạnh mẽ để cải thiện trải nghiệm ChatGPT của bạn

Con đường phía trước

Những tin đồn cho rằng trí tuệ nhân tạo sẽ thay thế công việc trong tương lai không hoàn toàn sai.

Đầu tiên, tự động hóa đã làm được điều đó trong sản xuất và giờ đây nó đang sải cánh đi khắp mọi nơi.

Cá nhân anh ấy nhanh hơn tôi rất nhiều trong việc giải phương trình bậc ba, làm thơ hay viết thư. Tuy nhiên, thực tế là anh ấy hiếm khi nói KHÔNG với lời nhắc và hầu như không học được gì từ những sai lầm của mình còn kém xa con người chúng ta.

Một lần nữa, AI không thể thay thế chúng ta, nhưng ai đó sử dụng AI thì có thể.

Nhóm tiếp thị của chúng tôi tại newsblog.pl sử dụng ChatGPT một cách thú vị. Ví dụ: gần đây chúng tôi đã đạt được cột mốc 100 triệu lượt xem và Giám đốc điều hành của chúng tôi đã nghĩ đến việc tặng nó cho người xem như một quà tặng.

Và tôi nghĩ các nhà tiếp thị cần một tiêu đề để thu hút sự chú ý của người đọc. Vì vậy, họ đưa ra một lời nhắc và yêu cầu ChatGPT đề xuất một số biến thể như thế này:

Ngoài ra, chúng tôi sử dụng nó để tóm tắt nội dung, kiểm tra ngữ pháp, gợi ý tiêu đề cho bài viết mới, v.v.

Tóm lại, có nhiều cách để thu được lợi ích và vượt lên trên những định kiến coi AI là thứ rác rưởi vô dụng.

Điều duy nhất cần nhớ là phải có ai đó (con người) đánh giá hoạt động của AI vì nó có thể (hoàn toàn) không chính xác và gây hiểu nhầm.

Cập nhật thực sự là một cái gì đó!

Trong cuộc họp ChatGPT ngắn ngủi của tôi 4 Tôi thấy nó sáng tạo hơn, hiểu biết hơn và thực tế hơn. Tuy nhiên, đó là một cỗ máy và nó có thể đưa ra những câu trả lời sai cho bạn.

Nhưng điều đáng kinh ngạc là mức độ cải tiến mà OpenAI đã thực hiện đối với dự án này chỉ sau vài tháng.

Và tôi nóng lòng muốn xem bản cập nhật tiếp theo có thể làm chúng ta ngạc nhiên với điều kỳ diệu gì!

Tái bút: Không chỉ là một cửa sổ trò chuyện; khai thác sức mạnh của nó bằng các tiện ích mở rộng ChatGPT Chrome tốt nhất này. Bạn đã bao giờ nghĩ đến việc tích hợp ChatGPT với Siri chưa?

Mục lục

Trò chuyệnGPT-4 vs ChatGPT-3.5 mặc định so với Trò chuyệnGPT-3.5 Phiên bản cũ hơn: Sự khác biệt đã được kiểm tra

ChatGPT: Kế thừa, Mặc định và Cập nhật

toán học

Lý luận logic

Bức thư

Thơ

ChatGPT Premium và ChatGPT miễn phí

Con đường phía trước

Cập nhật thực sự là một cái gì đó!

Khuyến Khích: