Tin tức và phân tích của tất cả các thiết bị di động

GitHub Copilot: những gì các nhà phát triển phàn nàn về trợ lý lập trình

Ra mắt vào cuối tháng 6, GitHub Copilot là một công cụ sử dụng Codex, hệ thống AI mới do OpenAI tạo ra, cho phép các nhà phát triển tiết kiệm thời gian bằng cách đề xuất các dòng mã và toàn bộ chức năng ngay lập tức. Trợ lý mã hóa mới này đang gây ra rất nhiều giấy mực. Câu hỏi được đặt ra: các câu hỏi xung quanh bản quyền của những dòng mã được tạo tự động này, mà còn về tính công bằng của cách tiếp cận như vậy trong cộng đồng nguồn mở.

Câu hỏi về sự công bằng, hợp pháp và hợp pháp

Được đào tạo bằng cách sử dụng máy học từ các cơ quan lớn có sẵn công khai, GitHub Copilot đã thu hút được phản ứng mạnh mẽ từ các nhà phát triển, mà còn từ Tổ chức Phần mềm Tự do (FSF). Tổ chức phi lợi nhuận của Mỹ, có nhiệm vụ quảng bá và bảo vệ phần mềm miễn phí, khuyến nghị các nhà phát triển không lưu trữ mã của họ trên nền tảng vì các vấn đề bản quyền. FSF tin rằng trợ lý “như vậy là không thể chấp nhận được và không công bằng”. Khiếu nại chính đối với giải pháp do GitHub phát triển: “nó yêu cầu thực thi phần mềm không miễn phí (Visual Studio hoặc các phần của Visual Studio Code)” để cung cấp một dịch vụ thay thế phần mềm, trong khi bằng cách sử dụng lại mã nguồn công cộng với các mục đích sử dụng thương mại có thể có, mà không có giấy phép thích hợp.

Theo FSF, việc sử dụng Copilot đặt ra các câu hỏi về tính công bằng, hợp pháp và hợp pháp, điều này vẫn chưa được đánh giá và cần được xem xét cẩn thận, có thể xảy ra các tác động pháp lý.

Chúng ta có thể thấy rằng việc Copilot sử dụng phần mềm được cấp phép tự do có nhiều tác động đối với một bộ phận rất lớn của cộng đồng mã nguồn mở. Các nhà phát triển muốn biết liệu việc đào tạo mạng nơ-ron trên phần mềm của họ có thực sự được coi là sử dụng hợp lý hay không. Những người khác có thể quan tâm đến việc sử dụng Copilot đang tự hỏi liệu các đoạn mã và các nội dung khác được sao chép từ các kho lưu trữ trên GitHub có thể dẫn đến vi phạm bản quyền hay không. Và ngay cả khi mọi thứ có thể được sao chép hợp pháp, các bên liên quan tự hỏi liệu có điều gì đó không công bằng về cơ bản trong thực tế là nhà xuất bản phần mềm độc quyền xây dựng một dịch vụ từ công việc của họ hay không, FSF giải thích trong một thông báo.

Lập trường của GitHub về các khiếu nại vi phạm bản quyền

Đối mặt với các cáo buộc vi phạm bản quyền, thậm chí là “rửa mã” được chia sẻ qua mạng xã hội, nền tảng phát triển do Microsoft sở hữu đề cập đến các yếu tố có trong FAQ của nó. Nói một cách dí dỏm: “GitHub Copilot là một công cụ tổng hợp mã, không phải là một công cụ tìm kiếm: phần lớn mã mà nó gợi ý được tạo ra một cách độc đáo và chưa từng thấy trước đây. Chúng tôi thấy rằng khoảng 0,1 % thời gian, đề xuất có thể chứa các đoạn trích văn bản từ tập huấn luyện. »

Theo GitHub, những trường hợp này phát sinh khi các nhà phát triển không cung cấp đủ ngữ cảnh trong yêu cầu của họ, khi chỉnh sửa một tệp trống hoặc “khi có một giải pháp chung, thậm chí phổ biến, cho vấn đề.” Ông cũng cho biết thêm: “Chúng tôi đang trong quá trình triển khai hệ thống theo dõi nguồn gốc để phát hiện các trường hợp hiếm hoi mà mã được lặp lại từ tập dữ liệu đào tạo, nhằm giúp bạn đưa ra quyết định theo thời gian thực đối với các đề xuất do GitHub Copilot đưa ra”.

Lời kêu gọi dành cho sách trắng để trả lời các câu hỏi từ các nhà phát triển

Để đáp lại nhiều yêu cầu mà nền tảng nhận được, nó vừa khởi động một cuộc kêu gọi tài trợ cho các sách trắng về việc sử dụng GitHub Copilot, bản quyền, máy học và rộng hơn là phần mềm mã nguồn mở. Mục tiêu: trả lời các câu hỏi do cộng đồng đặt ra và “xác định các cơ hội tốt nhất để bảo vệ quyền tự do của người dùng trong không gian này”.

Nếu bạn muốn sách trắng của mình được xuất bản, nó phải đáp ứng các nguyên tắc nhất định (tìm tại đây) và được gửi trước Thứ Hai, ngày 23 tháng 8 lúc 4 giờ chiều. Phần thưởng 500 đô la (423 euro) sẽ được đưa ra cho các vật phẩm sẽ được chọn. Để khởi động cuộc tranh luận, FSF đã liệt kê một loạt câu hỏi mở, bao gồm:

Đào tạo Copilot trên kho công cộng có vi phạm bản quyền không? Đây có phải là sử dụng hợp pháp không? Làm thế nào các nhà phát triển có thể đảm bảo rằng bất kỳ mã nào họ sở hữu đều có bản quyền đối với các vi phạm do Copilot tạo ra? Có cách nào để các nhà phát triển sử dụng Copilot tuân thủ các giấy phép phần mềm miễn phí như GPL không? Nếu Copilot tạo ra mã vi phạm một tác phẩm được cấp phép phần mềm miễn phí, thì làm cách nào để chủ sở hữu bản quyền của tác phẩm cơ bản có thể phát hiện ra hành vi vi phạm đó? Mô hình AI / ML do Copilot đào tạo có bản quyền không? Nếu vậy, ai sở hữu bản quyền này?

Sách trắng này và câu trả lời cho những câu hỏi này đặc biệt được chờ đợi, đặc biệt là để làm sáng tỏ pháp lý về vấn đề bản quyền mà Copilot nêu ra. Nói một cách tổng thể hơn, trợ lý lập trình do GitHub phát triển nêu bật nhu cầu về khuôn khổ cần thiết cho việc sử dụng loại phần mềm được tạo từ mã nguồn công khai này.