Tin tức và phân tích của tất cả các thiết bị di động

Việc tìm kiếm trí tuệ nhân tạo tổng hợp (AGI)

Trong việc tìm kiếm trí tuệ tổng hợp nhân tạo (AGI), loạt ứng dụng AI ngày nay cho thấy rất ít khả năng về nhiều thứ mà bất kỳ đứa trẻ ba tuổi nào cũng có thể nắm bắt được – hiểu được nguyên nhân và kết quả, mối quan hệ trọng lực và không gian cũng như thời gian trôi qua.

Phần lớn, điều này có thể là do thực tế là mặc dù chúng ta có một ví dụ tuyệt vời về trí thông minh tổng quát trong não người, nhưng mạng lưới thần kinh của AI hoạt động theo những cách hoàn toàn khác với cách hoạt động của não. Chắc chắn, cả hai đều có những thứ gọi là tế bào thần kinh được kết nối với nhau bằng các khớp thần kinh có trọng số và trạng thái của tế bào thần kinh sẽ tác động đến trạng thái của tế bào thần kinh mà nó được kết nối.

Trí tuệ tổng hợp nhân tạo so với trí thông minh chung của con người

Tuy nhiên, từ đó, sự tương đồng dừng lại. Các nơ-ron sinh học không xuất hiện theo các lớp có trật tự với các kết nối có trật tự giữa lớp này với lớp tiếp theo giống như cách mà mạng lưới thần kinh của AI thực hiện. Thay vào đó, bộ não có một mớ mối liên kết mà chúng ta vẫn chưa làm sáng tỏ được. Tế bào thần kinh sinh học tích lũy điện tích từ các khớp thần kinh đến và phát ra điện tích tăng đột biến khi đạt đến ngưỡng. Hơn nữa, giá trị của các nơ-ron sinh học là nhị phân: hoặc có đột biến hoặc không có.

Các chuyên gia AI thường khắc phục sự khác biệt đó bằng cách đặt kích hoạt mạng lưới thần kinh của AI thành chức năng bước để đầu ra sẽ là một 1 hoặc 0. Tuy nhiên, vấn đề với cách tiếp cận đó là nó bỏ qua điện tích tích lũy từ chu kỳ này sang chu kỳ tiếp theo. Để tạo nên sự khác biệt, chúng ta cũng cần thêm bộ nhớ trong, bộ nhớ này không được phản ánh trong hầu hết các mạng thần kinh.

Nhiều chuyên gia AI cũng cho rằng thay vì các đột biến riêng lẻ, đầu ra của các nơ-ron nhân tạo thể hiện sự tăng đột biến. tỷ lệ của tế bào thần kinh và tốc độ đó có thể thay đổi liên tục. Tuy nhiên, trên thực tế, tốc độ tăng vọt không thể thay đổi liên tục vì các nơ-ron sinh học có tốc độ tăng vọt tối đa khoảng 250 Hz và các tín hiệu thần kinh không thể hữu ích ở tần số dưới khoảng 20 Hz. Ở giữa, mức độ tiếng ồn cao trong não sẽ hạn chế số lượng các tốc độ khác nhau có thể được thể hiện một cách đáng tin cậy. Hơn nữa, việc phát hiện nhiều tốc độ tăng đột biến hóa ra lại vượt xa khả năng của từng tế bào thần kinh và việc phát hiện chúng theo cách đơn giản là cực kỳ chậm.

Cũng có những vấn đề khi bạn xem xét làm thế nào hai tín hiệu đầu vào tăng vọt ở cùng một tốc độ có thể tạo ra tốc độ tăng vọt đầu ra khác nhau tùy thuộc vào pha hoặc thời gian tương đối của chúng – cả hai đều bị thiếu trong AI – mang lại cho tế bào thần kinh sinh học cả một vũ trụ chức năng tiềm năng còn thiếu. Mạng lưới thần kinh AI.

khớp thần kinh

Tất cả những điều đó đưa chúng ta đến với khớp thần kinh. Vấn đề cơ bản ở đây là trong bối cảnh sinh học, không có cách nào để não tiếp cận chính xác trọng lượng của khớp thần kinh. Nếu bạn nhìn vào một nơ-ron kích hoạt với tốc độ cố định được kết nối với một nơ-ron khác có khớp thần kinh có trọng lượng không xác định và thấy rằng nơ-ron đầu ra đang kích hoạt với tốc độ bằng một nửa tốc độ của đầu vào, điều đó không có nghĩa là khớp thần kinh có trọng số bằng 0.5. Đúng hơn, nó có nghĩa là trọng số khớp thần kinh nằm ở đâu đó trong phạm vi 0.5 lên đến 1.0.

Trong mô phỏng não nhân tạo, có thể chỉ cần nhấp vào khớp thần kinh và đọc trọng lượng của nó hoặc nhấp vào tế bào thần kinh và xem khớp thần kinh đóng góp bao nhiêu vào điện thế màng. Tuy nhiên, trong bộ não sinh học, chúng ta không biết cách đo trọng lượng của khớp thần kinh và cách duy nhất để đo điện thế màng tế bào thần kinh là dùng các điện cực kim – không phải là một viễn cảnh đặc biệt dễ chịu hay hiệu quả.

Vậy điều đó có nghĩa là trọng lượng khớp thần kinh là vô ích? Cách xa nó. Chúng chỉ vô dụng trong việc lưu trữ các giá trị chính xác mà bạn có thể muốn đọc lại. Cách tốt hơn để tiếp cận vấn đề này là khớp thần kinh đại diện cho một bit thông tin trong khi giá trị trọng số thể hiện độ tin cậy rằng bit đó là đúng. Trọng lượng càng gần 0.0 hoặc 1.0độ tin cậy càng cao vì sẽ cần nhiều đột biến hơn để thay đổi trọng số sang trạng thái khác.

Lan truyền ngược

Cuối cùng, có sự lan truyền ngược, không thể đại diện cho cách các nơ-ron học hỏi vì hai lý do cơ bản. Chắc chắn có vấn đề với lượng dữ liệu đào tạo khổng lồ cần thiết để tạo ra chức năng mạng học sâu, điều này rõ ràng cho thấy mạng lưới thần kinh đang học theo một cơ chế khác với cơ chế của một đứa trẻ. Nhưng ở cấp độ cơ bản hơn nữa, việc xem nhanh công thức lan truyền ngược cho thấy rằng nó phụ thuộc vào việc biết trọng số khớp thần kinh hiện tại là gì và có thể sửa đổi trực tiếp trọng số của bất kỳ khớp thần kinh nào trong mạng với độ chính xác cao. Điều này đơn giản là không thể thực hiện được trong một thế giới hợp lý về mặt sinh học. Ngoài ra, phương pháp tính toán sự thay đổi trọng lượng trong lan truyền ngược sẽ không hoạt động nếu trường gradient không liên tục trơn tru, điều này sẽ không xảy ra do tính chất rời rạc của các tế bào thần kinh và trọng lượng khớp thần kinh trong não người.

Tất cả những điều này không có nghĩa là các phương pháp tiếp cận AI ngày nay là sai hoặc không hiệu quả. Ngược lại, nhiều hệ thống AI hoạt động rất tốt. Nhưng các thuật toán của AI ngày nay khác với cách mà bộ não con người thực hiện các nhiệm vụ tương tự. Điều này là do các thuật toán trong mạng nơ-ron nhân tạo không thể thực hiện được trong nơ-ron. Sau bốn thập kỷ thử nghiệm AI mà không có trí thông minh tổng quát xuất hiện, đã đến lúc nhận ra rằng cần có những phương pháp tiếp cận mới nếu AGI muốn xuất hiện.

Lớn hơn = tốt hơn?

Nhiều chuyên gia AI cho rằng mặc dù các hệ thống AI ngày nay rõ ràng còn thiếu sót nếu chúng ta có thể xây dựng chúng đủ lớn và đưa vào đủ dữ liệu đào tạo, nhưng trí thông minh nói chung sẽ xuất hiện. Ngay cả nếu điều này là có thể thì trí thông minh được tạo ra sẽ khác với trí thông minh nói chung của con người vì những cách tiếp cận cơ bản khác nhau được mô tả ở trên. Điều này rất giống với suy nghĩ ban đầu trong quá trình phát triển hệ thống chuyên gia—nếu chúng ta có thể lập trình đủ các trường hợp sử dụng thì hệ thống dường như sẽ “hiểu được”. Nhưng trí thông minh của con người lại đi theo hướng khác – sự phức tạp trong hành vi của con người, nhiều “trường hợp sử dụng” của nó là kết quả của sự hiểu biết.

Chúng ta sẽ được phục vụ tốt hơn nếu coi deep learning như một công cụ thống kê mạnh mẽ và tinh vi. Với nó, chúng ta có thể tìm thấy các mối quan hệ trong các tập dữ liệu mà trí óc con người không thể phát hiện được, nhưng nó không thể tạo ra sự hiểu biết một cách tự nhiên. Thay vào đó, chúng ta cần tập trung vào khả năng của trẻ ba tuổi. Mặc dù những điều này không mang lại nhiều lợi ích cho các ứng dụng thương mại ngay lập tức, nhưng điều quan trọng là bất kỳ đứa trẻ ba tuổi nào cũng có khả năng phát triển thành một đứa trẻ bốn tuổi và cứ thế cho đến khả năng tư duy ở cấp độ người lớn. Nhìn vào cách mà bất kỳ đứa trẻ nào học về môi trường cũng như mối quan hệ giữa chúng và thế giới thực là chìa khóa cho sự hiểu biết thực sự, nền tảng cho bất kỳ sự phát triển AGI nào trong tương lai.