Tin tức và phân tích của tất cả các thiết bị di động

Chris Latimer cho biết cách sử dụng dữ liệu thời gian thực để mở rộng quy mô và hoạt động tốt hơn

Dữ liệu thời gian thực quan trọng hơn bao giờ hết. Chúng tôi cần nó để đưa ra quyết định nhanh chóng và xoay chuyển kịp thời. Tuy nhiên, hầu hết các doanh nghiệp không thể làm được điều này vì họ phải nâng cấp phần mềm và phần cứng của mình để đáp ứng các tiêu chuẩn quy mô và hiệu suất khắt khe của xử lý dữ liệu theo thời gian thực. Và khi họ không thể, chúng tôi chỉ còn lại dữ liệu cũ.

DataStax gần đây đã công bố tính năng Change Data Capture (CDC) cho Astra DB, tính năng này mang khả năng truyền dữ liệu được xây dựng trên Apache Pulsar tới cơ sở dữ liệu nhiều đám mây được xây dựng trên Apache Cassandra.

Chức năng mới cung cấp dữ liệu thời gian thực để sử dụng trên các hồ dữ liệu, kho dữ liệu, tìm kiếm, trí tuệ nhân tạo và học máy bằng cách xử lý các thay đổi cơ sở dữ liệu trong thời gian thực thông qua các luồng sự kiện. Nó sẽ cho phép nhiều ứng dụng phản ứng nhanh hơn có thể hưởng lợi từ dữ liệu thời gian thực được kết nối.

Giải quyết vấn đề ngày nay: Làm thế nào để sử dụng dữ liệu thời gian thực?

Để biết thêm chi tiết về vấn đề này, chúng tôi đã có cơ hội trò chuyện với Chris Latimer, Phó Chủ tịch Quản lý Sản phẩm tại DataStaxvề sản phẩm mới của họ và bối cảnh hiện tại về dữ liệu.

Bạn có thể thông báo cho độc giả của chúng tôi về thị trường hiện tại trong truyền dữ liệu thời gian thực không?

Nhu cầu truyền dữ liệu theo thời gian thực đang tăng lên nhanh chóng. Các giám đốc dữ liệu và lãnh đạo công nghệ đã nhận ra rằng họ cần nghiêm túc thực hiện chiến lược dữ liệu thời gian thực để hỗ trợ nhu cầu kinh doanh của mình. Do đó, các nhà lãnh đạo doanh nghiệp ngày càng gây áp lực lên các tổ chức CNTT để cung cấp cho họ quyền truy cập nhanh hơn vào dữ liệu đáng tin cậy và đầy đủ. Khi các doanh nghiệp tiến bộ hơn về khoa học dữ liệu, việc có thể áp dụng AI để tăng cường dữ liệu trong thời gian thực đang trở thành một khả năng quan trọng mang lại lợi thế cạnh tranh cho các công ty nắm vững các kỹ thuật này và gây ra mối đe dọa lớn cho các công ty không thể làm được.

Truyền dữ liệu thời gian thực ảnh hưởng như thế nào đến trải nghiệm người dùng?

Chúng ta đã quen với việc truyền dữ liệu trong các ứng dụng tiêu dùng mà tất cả chúng ta đều sử dụng. Chúng ta có thể xem vị trí của tài xế khi đặt đồ ăn hoặc khi chờ đợi đơn hàng trực tuyến mà chúng ta đã thực hiện để được giao đến. Mặc dù những tính năng đó đã cải thiện rõ ràng trải nghiệm của chúng tôi nhưng chúng cũng cung cấp dữ liệu có giá trị mà sau này có thể được sử dụng để tạo ra các hiệu ứng thứ hai và thứ ba có tác động ít rõ ràng hơn đến trải nghiệm người dùng.

Những hiệu ứng này bao gồm những tối ưu hóa mới có thể được thực hiện bằng cách ghi lại các luồng dữ liệu. Ví dụ: dịch vụ giao đồ ăn có thể phân tích vị trí tài xế, thời gian lái xe, các tuyến đường đã chọn và bắt đầu khuyến khích khách hàng đặt hàng từ những nhà hàng có thời gian giao hàng tổng thể thấp hơn, cho phép tài xế hoàn thành nhiều chuyến giao hàng hơn và giảm thời gian chờ đợi cho người tiêu dùng.

Tương tự, trong các ứng dụng như bán lẻ, việc thu thập dữ liệu luồng nhấp chuột từ tập thể người mua sắm trong ứng dụng thương mại điện tử có thể cho phép các nhà bán lẻ chọn những ưu đãi tốt nhất để đưa ra cho khách hàng nhằm cải thiện chuyển đổi và quy mô đơn hàng. Mặc dù người tiêu dùng hiện đã quen và yêu cầu những kiểu tương tác này, nhưng nhiều cải tiến trong số này là vô hình và người dùng cuối sẽ thấy mức giảm giá phù hợp đối với sản phẩm về thực phẩm hoặc quần áo có thể được giao đến tay họ một cách nhanh chóng.

Công nghệ Pulsar đã giúp bạn xây dựng tính năng CDC mới như thế nào?

Pulsar là nền tảng cho những khả năng mới này của CDC. Với Pulsar, chúng tôi có thể cung cấp cho khách hàng nhiều thứ hơn là chỉ một giải pháp CDC; chúng tôi có thể cung cấp giải pháp phát trực tuyến hoàn chỉnh. Điều này có nghĩa là khách hàng có thể gửi luồng thay đổi dữ liệu đến nhiều điểm đến khác nhau như kho dữ liệu, nền tảng SaaS hoặc các kho dữ liệu khác. Họ cũng có thể xây dựng các đường dẫn dữ liệu thông minh hơn bằng cách tận dụng các khả năng của chức năng serverless được tích hợp trong giải pháp phát trực tuyến CDC của chúng tôi. Tốt hơn nữa, các thay đổi được ghi lại để người dùng có thể phát lại các luồng thay đổi đó để thực hiện những việc như đào tạo mô hình ML để tạo các ứng dụng thông minh hơn.

Chris Latimer cho biết cách sử dụng dữ liệu thời gian thực để mở rộng quy mô và hoạt động tốt hơn

Người dùng của bạn sẽ được hưởng lợi như thế nào từ tính năng mới này?

Tính năng này giúp người dùng xây dựng các ứng dụng thời gian thực dễ dàng hơn nhiều bằng cách lắng nghe các sự kiện thay đổi và cung cấp trải nghiệm phản hồi nhanh hơn. Đồng thời, nó cung cấp những gì tốt nhất của cả hai thế giới cho những người dùng cần một giải pháp NoSQL tốt nhất, hiệu suất cao, có khả năng mở rộng quy mô lớn, đồng thời phân phối dữ liệu đó trong toàn bộ phần còn lại của hệ sinh thái dữ liệu của họ.

Nếu bạn so sánh giải pháp CDC của mình với giải pháp khác, thì lợi thế là gì?

Sự khác biệt lớn nhất là DataStax đang cung cấp nền tảng phát trực tuyến sự kiện toàn diện như một phần của CDC. Các giải pháp khác hiện có cung cấp API thô gửi các thay đổi khi chúng xảy ra. Với CDC dành cho Astra DB, chúng tôi cung cấp cho khách hàng tất cả các công cụ cần thiết để nhanh chóng kết nối luồng dữ liệu thay đổi của họ với các nền tảng khác bằng thư viện trình kết nối và nền tảng chức năng serverless đầy đủ nhằm tạo điều kiện cho các đường dẫn dữ liệu thời gian thực thông minh hơn.

Chúng tôi cũng cung cấp các thư viện thân thiện với nhà phát triển để các luồng thay đổi có thể hỗ trợ các ứng dụng thời gian thực bằng Java, Golang, Python, Node.js và các ngôn ngữ khác.

Với khả năng phát lại các luồng thay đổi, DataStax cũng cung cấp các khả năng khác biệt cho các tổ chức khi họ xây dựng các thuật toán học máy và các trường hợp sử dụng khoa học dữ liệu khác.