Tin tức và phân tích của tất cả các thiết bị di động

Niềm tin mất cả đời để xây dựng nhưng chỉ mất một giây

Stephan Schnieber, Trưởng nhóm bán hàng IBM Cloud Pak cho Dữ liệu – DACH tại IBM Deutschland, giải thích bốn cách để có được niềm tin nhiều hơn vào AI trong cuộc phỏng vấn của chúng tôi.

Hôm nay, bạn và nhóm của mình đã theo dõi một hội thảo về chủ đề AI đáng tin cậy – tại SỰ KIỆN AI và khoa học dữ liệu lớn nhất Châu Âu, Hội nghị về người bản địa dữ liệu ở Berlin, DN22. Nó thế nào?

Nó rất, rất tốt- tôi nghĩ nó thực sự thành công về tổng thể. Thành công theo nghĩa là việc hợp tác có thể cực kỳ khó khăn trong môi trường hội thảo. Có thể nói, chúng tôi đã có rất nhiều sự tương tác với những người tham gia, một ngôi nhà đầy đủ. Căn phòng đã được đặt kín, có người ở và mọi người thực sự tham gia.

Chúng tôi đã có một phiên tương tác ngay từ đầu để thu thập quan điểm của mọi người. Có một số quy tắc cơ bản quan trọng mà chúng tôi phải cùng nhau đặt ra trong nhóm- Làm cách nào để xác định niềm tin? Làm thế nào để người tham gia liên lạc với cơ sở nếu họ cần? Và một khi chúng tôi đã thiết lập được điều đó, hội thảo sẽ trở thành một môi trường năng động, linh hoạt để cộng tác. Hơn nữa, chúng tôi thực sự đã đăng ký đầy đủ, điều mà tôi không hề mong đợi. Hội thảo do ba người chúng tôi đến từ IBM điều hành và tất cả chúng tôi đều rất hào hứng với những gì mình thấy.

Sau đó, chúng tôi tổ chức một cuộc họp khác để có thể khám phá một số chủ đề mà chúng tôi đã tìm ra được trong hội thảo. Có rất nhiều câu hỏi mà người tham gia vẫn muốn có câu trả lời. Vì vậy, chúng tôi thực sự đã tạo điều kiện cho một diễn đàn cho điều đó. Quan điểm của họ về AI đáng tin cậy là gì? Những thách thức của họ, cuộc gặp gỡ của họ với nó là gì? Chúng tôi cũng tận dụng cơ hội này để thảo luận về một số ý tưởng lặp đi lặp lại mà chúng tôi đã chọn ra được; làm sao chúng ta hiểu được câu trả lời của người tham gia? Chúng tôi có thể đưa ra giải pháp gì? Bởi vì nhiều điểm họ nêu ra đã là những cuộc trò chuyện đang diễn ra xung quanh AI trong một thời gian.

Ngoài ra, IBM còn có một sản phẩm hỗ trợ AI đáng tin cậy và chúng tôi đã có thể trình bày một số sản phẩm đó trong hội thảo, đồng thời thu thập phản hồi về nó. Vì vậy, đó là 90 phút thực sự hấp dẫn, thú vị.

Cơ cấu người tham gia hội thảo như thế nào?

Điều tôi thích ở Data Native là sự đa dạng của người tham dự, điều này thực sự tốt hơn những gì tôi trải nghiệm trong một số cuộc họp khách hàng. Chính sự thiếu đa dạng đó có thể khiến lĩnh vực CNTT trở nên nhàm chán. Và tất nhiên, bầu không khí thoải mái tại hội nghị đã thực sự giúp ích. Xét về cơ cấu độ tuổi, chúng tôi có rất nhiều người tham gia trẻ tuổi hơn, Thế hệ X và thậm chí cả Thế hệ Z, đây là một điều khác mà tôi thấy khá thú vị.

‘AI đáng tin cậy’ có ý nghĩa khác nhau đối với những người khác nhau. AI đáng tin cậy có ý nghĩa gì ở IBM?

Ý kiến ​​​​cá nhân của tôi tình cờ phù hợp với IBM. Vì vậy, mục tiêu của Trustworthy AI là tích hợp AI vào hoạt động kinh doanh, để đảm bảo rằng IBM hỗ trợ việc ra quyết định của họ bằng các phương pháp AI, cả tự động hóa và tự động hóa một phần. Đó là ý tưởng cơ bản. Câu hỏi thực sự là làm thế nào chúng ta có thể đạt được điều này? Điều quan trọng nhất chúng ta có thể làm là xây dựng “niềm tin” vào AI với tư cách là người ra quyết định hoặc bên liên quan. Mục đích cuối cùng là chứng minh độ tin cậy của AI, để khi đưa ra một quyết định, bạn không cảm thấy cần phải đắn đo và nói, “Hm, giúp tôi với, tại sao tôi lại cảm thấy không chắc chắn về điều này?” Vì vậy, điều đó có nghĩa là tôi phải có thể tự tin nói rằng tôi sẵn sàng cho phép ngày càng nhiều tính năng tự động hóa trong công việc của mình và yêu cầu AI hỗ trợ các quy trình kinh doanh của tôi. Đó là ý tưởng thực sự đằng sau nó.

Và đó là lý do tại sao, như IBM thấy, AI bắt đầu bằng dữ liệu. Vì vậy, trước hết, chúng ta cần đảm bảo chất lượng dữ liệu truyền vào hệ thống AI. Có nghĩa là chúng ta không chỉ xem xét AI và mô hình, mô hình hóa và sau đó là phân phối mô hình, mà sự thành công của tất cả các bước trước đó đều bắt đầu từ dữ liệu và chất lượng của dữ liệu nói trên. Đó là lý do tại sao sự hợp tác lại rất quan trọng trong lĩnh vực AI.

Như tôi đã nói trước đây, sự đa dạng đã làm phong phú thêm Data Natives như một hội nghị và hội thảo của tôi thực sự phụ thuộc vào nhiều mức độ ảnh hưởng trong khán giả, người nghe và người tham gia của chúng tôi để mở rộng cuộc trò chuyện xung quanh AI. Như bạn có thể tưởng tượng, nhóm của tôi nhận thấy rằng cuộc thảo luận sôi nổi trong hội thảo bị ảnh hưởng trực tiếp bởi những nền tảng và ý tưởng đa dạng này.

Vì vậy, cuối cùng, nền tảng mà hội thảo của chúng tôi được tiến hành đều xuất phát từ việc hiểu được giá trị của một nền tảng hợp tác thực sự.

Tôi tin rằng sự hợp tác là một trong những công cụ quan trọng nhất của chúng tôi để hỗ trợ sự phát triển và chấp nhận AI. Có nhiều cách tiếp cận AI trong lĩnh vực này có xu hướng chạy ở định dạng độc lập và không tận dụng được sự đổi mới do làm việc theo nhóm mang lại. Vì vậy, đối với chúng tôi tại IBM, cộng tác là một thành phần thiết yếu cho sự phát triển của AI. Trong các dự án làm việc theo nhóm, bạn có thể đưa mọi người vào, đưa họ đi. Tôi có thể kiểm soát ai xem dữ liệu nào về dự án nào hoặc ai có thể xem mô hình AI nào, v.v. Vì vậy, sự hợp tác thực sự là chìa khóa cho mọi thứ. Tất nhiên, sự cộng tác giữa các vai trò cũng quan trọng không kém, bởi vì, nếu bạn nghĩ về tất cả các chức danh công việc khác nhau liên quan đến việc kiểm tra chất lượng dữ liệu- tôi phải chuẩn bị dữ liệu của mình, phát triển nó, thậm chí có thể chuyển đổi nó. Và đó mới chỉ là sự khởi đầu. Chúng tôi phải làm việc thực sự chặt chẽ với các nhà khoa học dữ liệu, vì vậy điều quan trọng là thái độ của họ đối với sự hợp tác giữa các vai trò cũng giống như thái độ của chúng tôi – họ phải có được công việc sơ bộ chính xác và có thể phối hợp với đồng nghiệp. Chính những kỹ năng của con người đã quyết định sự thành công của AI. Và sau đó, tất nhiên, chúng tôi có công cụ mới, Gói đám mây của IBM dành cho nền tảng dữ liệu. Gói này cho phép bạn thu thập, sắp xếp và phân tích dữ liệu bất kể dữ liệu được lưu trữ ở đâu, vì vậy nó thực sự hỗ trợ môi trường cộng tác mà chúng tôi đã nỗ lực tạo ra tại IBM.

AI tự động: Đây là công cụ chúng tôi sử dụng cho cách tiếp cận nền tảng, không chỉ xử lý khoa học dữ liệu mà còn xử lý cả chuyển đổi dữ liệu. Khoa học dữ liệu gần như là một thuật ngữ dễ hiểu, được sử dụng một cách yêu thích bởi những người trong số chúng ta, những người mà tôi muốn gọi là “những người không biết viết mã”. Về cơ bản thì bất kỳ ai không phải là nhà khoa học dữ liệu. Tất nhiên, “những người không có mã” cũng cần AI, vì vậy đối với họ, chúng tôi đã tạo ra một tính năng phần mềm có tên Auto AI. Các đối thủ cạnh tranh của chúng tôi gọi nó là Auto ML, nhưng chúng tôi gọi nó là Auto AI.

AI tự động giúp việc nhập dữ liệu trở nên rất dễ dàng. Tôi chỉ cần nói với nó những gì tôi cần nó làm, cung cấp cho nó các giá trị mục tiêu và AI tự động sẽ tự động tạo ra một mô hình cho tôi, như nghiên cứu cho thấy, có khả năng chính xác cao. Sau khi tự mình sử dụng sáng kiến ​​này, tôi đã tận mắt thấy rằng kết quả do AI tạo ra đáng tin cậy đến mức tôi có thể tự tin sử dụng chúng trong môi trường hiệu quả. Chúng tôi cũng có những khách hàng lớn, chủ yếu là các công ty DAX, những người đã đạt được những thành công đáng kể với Auto AI của chúng tôi.

Chúng tôi cũng giải quyết vấn đề Low-Code, rõ ràng là một thành phần nổi tiếng của thiết kế đồ họa. Phần mềm SPSS của chúng tôi có thể được coi là một phần của nền tảng này và nó cho phép mọi người làm việc bằng đồ họa cũng như phát triển các mô hình AI và dữ liệu mạnh hơn. Tất nhiên, điều này phù hợp với ý tưởng rộng hơn về mã hóa như một cách tiếp cận có lập trình, được thấy trong những năm gần đây với Teyssen, Jupyter Notebooks, AR và CoR Studio. Mã trực quan có nghĩa là chúng tôi có thể cải thiện việc tích hợp dữ liệu và API để nâng cao tính linh hoạt và kết nối các lĩnh vực dữ liệu khác nhau. Hơn nữa, việc có thể làm sáng tỏ các khái niệm như Low-Code sẽ mang lại cho nhiều người quyền truy cập cá nhân hơn vào học máy.

Mô hình phát triển đáng tin cậy

Điều này tạo ra một môi trường phát triển cho phép tôi cộng tác với những người khác, điều này thực sự quan trọng trong lĩnh vực khoa học dữ liệu. Tất nhiên, tất cả đều là về sự cộng tác có kiểm soát: khi nói đến dữ liệu, quyền riêng tư là tất cả. Mặc dù sự cộng tác có thể làm phong phú thêm sự hiểu biết của chúng ta về dữ liệu, nhưng điều quan trọng không kém là tôi có thể kiểm soát dữ liệu nào tôi nên che giấu và ai nên hoặc không nên có quyền truy cập vào dữ liệu đó.

Tạo ra một mô hình phát triển đáng tin cậy có nghĩa là tôi có thể bảo vệ dữ liệu cá nhân như địa chỉ email và số điện thoại một cách an toàn. Ngược lại, việc tôi có thể kiểm soát mọi thứ một cách rõ ràng và đáng tin cậy là điều cần thiết để tạo dựng niềm tin vào các hệ thống AI mà chúng tôi sử dụng tại IBM. Về vận hành, tôi phải tự tin triển khai mô hình của mình. Đã có lúc tôi hỏi khách hàng: “Bạn đã bắt đầu với học máy chưa? Có bao nhiêu mô hình được tích hợp vào các quy trình?” Và nó rất ít. Một số công ty đang trên đường phát triển, nhưng khi hoạt động thì đó là một công trường xây dựng lớn.. Đó là nơi chúng tôi thực sự có thể bắt đầu phát triển các quy trình của mình.

Những điểm quan trọng nhất để có thêm niềm tin vào AI là gì?

Có 4 điểm: Phát hiện sai lệch, Trôi dữ liệu, Tính minh bạch, Khả năng giải thích.

Phát hiện sai lệch: Tôi sẽ bắt đầu với chủ đề phát hiện sai lệch. Cuối cùng, sự thiên vị là câu hỏi: Phụ nữ và nam giới có được đối xử giống nhau không? Người trẻ có được đối xử như người già không? Chúng tôi cũng đã thảo luận vấn đề này trong hội thảo. Ví dụ, với bảo hiểm ô tô, phụ nữ luôn nhận được mức giá ô tô rẻ hơn. Điều này phải được phản ánh và tôi phải đảm bảo tính công bằng trong mô hình của mình, đồng thời đảm bảo rằng tôi có được các mô hình và kết quả có thể sử dụng được phản ánh thực tế. Tôi phải xây dựng niềm tin và sự chấp nhận trong mô hình học máy như vậy.

Trôi dữ liệu: Sau khi tạo mô hình và đưa vào sản xuất, tôi phải tính đến các sự kiện trong mô hình học máy của mình mà chúng tôi không bao giờ có thể lên kế hoạch. Lấy Covid, hay cuộc chiến ở Ukraine chẳng hạn. Hành vi của người tiêu dùng thay đổi hoàn toàn. Toàn bộ mô hình học máy của tôi có thể không sử dụng được do hành vi của người dùng đã thay đổi. Vì vậy, tôi phải đào tạo lại các mô hình của mình và điều chỉnh chúng cho phù hợp với các điều kiện khung tương ứng. Việc phát hiện điều này tự động được thực hiện thông qua việc trôi dạt dữ liệu. Tôi có thể đặt các giá trị ngưỡng và sau đó có tín hiệu cảnh báo, sau đó chúng tôi có thể theo dõi – ngày nay, tôi thậm chí có thể đảm bảo rằng tôi có khả năng tự động lập mô hình lại và triển khai lại. Vì vậy, tôi cũng có thể vận hành điều đó nếu bạn muốn.

Tính minh bạch và khả năng giải thích đi tay trong tay. Tôi cần sự minh bạch. Những quyết định nào được đưa ra khi nào? Trên cơ sở mô hình nào chẳng hạn? Vậy nếu tôi đang nói về sự trôi dạt dữ liệu, làm cách nào tôi có thể tìm ra mô hình học máy nào đã được sử dụng vào ngày hôm kia? Dữ liệu nào đã được sử dụng? Quyết định được đưa ra như thế nào? Tôi cần biết tất cả những điều này. Nó phải minh bạch và bền vững. Chúng ta luôn cần biết những giá trị nào đã được nhập vào, mô hình nào đã được sử dụng, những gì xuất hiện để có thể theo dõi nó. Chẳng ích gì khi nói, “Ồ, có chuyện gì đó đã xảy ra và tôi không biết phải làm gì.” Chúng ta cần có sự minh bạch hoàn toàn về những gì chúng ta đang làm và mọi thứ cần phải được theo dõi. Tôi luôn phải có khả năng giải thích những quyết định mà tôi đã đưa ra.

Bạn có một ví dụ về điều này?

Giả sử tôi đăng ký vay ngân hàng và họ nói không vì tôi đã quá già. Cố vấn ngân hàng đưa ra quyết định nghĩ rằng tôi sẽ không sống đủ lâu để trả lại số tiền đó. 5 triệu tôi yêu cầu. Tuy nhiên, nếu tôi không đồng ý với anh ấy, có khả năng tôi sẽ có thể đảo ngược quyết định.

Với mô hình AI, tôi phải có khả năng lập bản đồ những thứ tương tự. Điều này có nghĩa là, về nguyên tắc, khi tôi thực hiện cuộc gọi, tôi không phải nói chuyện với AI trong máy nhưng cuối cùng tôi phải nói chuyện với con người. Nhưng bạn tôi ở đầu dây bên kia phải hiểu được hệ thống, ông Schnieber không được phép vay ngân hàng do đã lớn tuổi. Đây là những điều mà tính minh bạch của hệ thống cho phép chúng tôi cung cấp. Về nguyên tắc, hệ thống của chúng tôi đưa ra dấu hiệu cho thấy rằng nếu tham số tuổi thay đổi thì rất có thể các giá trị khác nhau sẽ xuất hiện và người quản lý ngân hàng của chúng tôi sẽ đưa ra kết luận khác.

Với mạng lưới thần kinh, việc có khả năng giải thích các quy trình giờ đây trở nên khá quan trọng. Có nghĩa là đó là điều chúng tôi phải tính đến. Và cố vấn ngân hàng sau đó có thể nói với tôi rằng kết quả khoản vay của tôi được quyết định bởi một cái máy, rằng anh ấy đã quyết định chống lại nó, nhưng tuổi tác là yếu tố chính. Và ngân hàng không thể làm gì với tuổi của tôi. Thật khó. Nhưng nếu bây giờ tôi đề nghị cho họ thêm vốn chủ sở hữu, hoặc nếu tôi sẵn sàng giảm số tiền cho vay, thì ngân hàng có thể giảm năm triệu xuống còn ba triệu rưỡi. Và cả hai chúng tôi đều thỏa hiệp. Vì vậy, tôi có thể sử dụng ví dụ này để trình bày vấn đề về tính minh bạch, nhu cầu hiểu hệ thống AI và cách áp dụng điều này đối với các tương tác của khách hàng với phần mềm của chúng tôi.

Tất nhiên, tôi phải cẩn thận với dữ liệu. Điều tôi thực sự muốn nói là, nếu tôi xây dựng một mô hình, tôi phải tạo ra thứ gì đó mà tôi có thể tin tưởng. Và niềm tin phải mất cả đời để xây dựng nhưng chỉ mất một giây. Và chính vì vậy tôi phải tạo ra một môi trường ổn định để đổi mới và phát triển. Bởi vì khi chúng tôi làm điều đó, đó là lúc chúng tôi thực sự có thể tạo ra một nền tảng an toàn để dân chủ hóa và mở rộng kiến ​​thức về AI, cũng như tăng độ chính xác của phần mềm.