▷ Dữ liệu phi cấu trúc sẽ là chìa khóa cho phân tích vào năm 2023

Trong nhiều thập kỷ, quản lý dữ liệu về cơ bản có nghĩa là thu thập, lưu trữ và đôi khi truy cập dữ liệu đó. Tất cả đã thay đổi trong những năm gần đây, khi các doanh nghiệp tìm kiếm thông tin quan trọng mà họ có thể lấy từ lượng dữ liệu khổng lồ được tạo, truy cập và lưu trữ ở vô số địa điểm, từ trung tâm dữ liệu của công ty đến đám mây và biên.

Do đó, phân tích dữ liệu – được hỗ trợ bởi các công nghệ hiện đại như trí tuệ nhân tạo (AI) và học máy – đã trở thành một khả năng bắt buộc phải có và vào năm 2022, tầm quan trọng sẽ càng được nâng cao. Các doanh nghiệp cần nhanh chóng phân tích dữ liệu – phần lớn dữ liệu không có cấu trúc – để tìm thông tin sẽ thúc đẩy các quyết định kinh doanh. Họ cũng cần tạo ra một môi trường dữ liệu hiện đại để biến điều đó thành hiện thực.

Dưới đây là một số xu hướng quản lý dữ liệu sẽ nổi lên vào năm 2022:

Người quản lý dữ liệu sẽ mở rộng trọng tâm của họ từ dữ liệu có cấu trúc sang phân tích dữ liệu phi cấu trúc

Theo truyền thống, phần lớn khoa học dữ liệu tập trung vào việc cung cấp dữ liệu có cấu trúc cho kho dữ liệu. Nhưng với 90% dữ liệu của thế giới trở nên phi cấu trúc và với sự phát triển của máy học, dựa trên dữ liệu phi cấu trúc, các nhà khoa học dữ liệu nên mở rộng kỹ năng của mình để kết hợp phân tích dữ liệu phi cấu trúc. Họ cần học cách thu thập giá trị từ dữ liệu không có cấu trúc hoặc lược đồ cụ thể và nằm trong phạm vi các tệp video, tệp gen, hình ảnh địa chấn, dữ liệu IoT, bản ghi âm và dữ liệu người dùng như email. Việc phát triển những kỹ năng này, bao gồm việc cập nhật và thử nghiệm các khả năng phân tích dữ liệu phi cấu trúc mới trong hồ dữ liệu cũng như học các kỹ thuật quản lý dữ liệu phi cấu trúc, sẽ là điều tối quan trọng vào năm 2022.

Phân tích ‘Dữ liệu phù hợp’ sẽ vượt qua phân tích Dữ liệu lớn như một xu hướng chính

Dữ liệu lớn gần như quá lớn và đang tạo ra các đầm lầy dữ liệu khó tận dụng. Việc tìm kiếm chính xác dữ liệu phù hợp tại chỗ bất kể dữ liệu đó được tạo ở đâu và sử dụng dữ liệu đó để phân tích dữ liệu là một yếu tố thay đổi cuộc chơi vì nó sẽ tiết kiệm nhiều thời gian và công sức thủ công trong khi đưa ra phân tích phù hợp hơn. Vì vậy, thay vì Dữ liệu lớn, một xu hướng mới sẽ là phát triển cái gọi là phân tích “dữ liệu phù hợp”.

Quản lý dữ liệu bất khả tri về lưu trữ sẽ trở thành một thành phần quan trọng của cơ cấu dữ liệu hiện đại

Cấu trúc dữ liệu là một kiến trúc cung cấp khả năng hiển thị dữ liệu và khả năng di chuyển, sao chép và truy cập dữ liệu trên các tài nguyên lưu trữ và đám mây kết hợp. Thông qua phân tích gần thời gian thực, nó giúp chủ sở hữu dữ liệu kiểm soát nơi dữ liệu của họ tồn tại trên các đám mây và bộ lưu trữ để dữ liệu có thể nằm ở đúng nơi vào đúng thời điểm. Các nhà quản lý CNTT và lưu trữ sẽ chọn kiến trúc kết cấu dữ liệu để mở khóa dữ liệu từ bộ lưu trữ và cho phép quản lý tập trung vào dữ liệu so với tập trung vào lưu trữ. Ví dụ: thay vì lưu trữ tất cả hình ảnh y tế trên cùng một NAS, các chuyên gia lưu trữ có thể sử dụng phân tích và phản hồi của người dùng để phân đoạn các tệp này, chẳng hạn như sao chép hình ảnh y tế để truy cập bằng máy học trong nghiên cứu lâm sàng hoặc di chuyển dữ liệu quan trọng sang bộ lưu trữ đám mây bất biến để bảo vệ chống lại ransomware.

Kết cấu dữ liệu sẽ là xu hướng CNTT chiến lược của doanh nghiệp vào năm 2022

Kết cấu dữ liệu vẫn là một tầm nhìn. Nó nhận ra rằng dữ liệu của bạn tồn tại ở nhiều nơi và một kết cấu có thể kết nối các silo và mang lại khả năng di động, khả năng hiển thị và quản trị cao hơn. Nghiên cứu kết cấu dữ liệu thường tập trung vào dữ liệu bán cấu trúc và có cấu trúc. Nhưng 90% dữ liệu của thế giới là không có cấu trúc (như video, tia X, tệp gen, tệp nhật ký và dữ liệu cảm biến) và không có lược đồ xác định. Các hồ dữ liệu và ứng dụng phân tích không thể dễ dàng truy cập vào dữ liệu tối bị khóa trong tệp này. Công nghệ kết cấu dữ liệu cần kết nối việc lưu trữ dữ liệu phi cấu trúc (lưu trữ tệp và lưu trữ đối tượng) và nền tảng phân tích dữ liệu (bao gồm hồ dữ liệu, học máy, bộ xử lý ngôn ngữ tự nhiên và phân tích hình ảnh). Phân tích dữ liệu phi cấu trúc đang trở nên quan trọng vì học máy dựa vào dữ liệu phi cấu trúc. Công nghệ kết cấu dữ liệu cần phải mở, dựa trên tiêu chuẩn và nhìn xuyên suốt các môi trường. Vào năm 2022, kết cấu dữ liệu sẽ chuyển từ tầm nhìn sang một tập hợp các nguyên tắc quản lý dữ liệu kiến trúc. Với mức độ liên quan ngày càng tăng và tầm quan trọng tuyệt đối của nó, các nhà cung cấp công nghệ cần kết hợp dữ liệu phi cấu trúc vào kiến trúc kết cấu dữ liệu của họ.

Multi-cloud sẽ phát triển với các chiến lược dữ liệu khác nhau

Ngày nay, nhiều tổ chức có môi trường đám mây lai, trong đó phần lớn dữ liệu được lưu trữ và sao lưu trong các trung tâm dữ liệu riêng tư trên nhiều hệ thống của nhà cung cấp. Khi dữ liệu (tệp) phi cấu trúc tăng lên theo cấp số nhân, đám mây được sử dụng làm tầng lưu trữ thứ cấp hoặc cấp ba. Có thể khó nhìn thấy các bộ phận quản lý chi phí, đảm bảo hiệu suất và quản lý rủi ro. Do đó, các nhà lãnh đạo CNTT nhận ra rằng việc trích xuất giá trị từ dữ liệu trên các đám mây và môi trường tại chỗ là một thách thức ghê gớm. Chiến lược nhiều đám mây hoạt động tốt nhất khi các tổ chức sử dụng các đám mây khác nhau cho các trường hợp sử dụng và tập dữ liệu khác nhau. Tuy nhiên, điều này lại gây ra một vấn đề khác: việc di chuyển dữ liệu rất tốn kém khi và nếu sau này bạn cần di chuyển dữ liệu từ đám mây này sang đám mây khác. Một khái niệm mới hơn là kéo tính toán về dữ liệu ở một nơi. Vị trí trung tâm đó có thể là một trung tâm colocation có liên kết trực tiếp tới các nhà cung cấp đám mây. Nhiều đám mây sẽ phát triển với các chiến lược khác nhau: đôi khi tính toán đến với dữ liệu của bạn, đôi khi dữ liệu nằm trong nhiều đám mây.

Sẽ cần có dữ liệu tổng hợp + dữ liệu phi cấu trúc để quản lý sự tăng trưởng dữ liệu

Bảo mật và quyền riêng tư dữ liệu ngày càng trở nên cấp bách và dữ liệu tổng hợp là một giải pháp tuyệt vời để ngăn chặn việc thu thập dữ liệu người dùng. Dữ liệu tổng hợp cũng dễ mang theo hơn vì bạn không cần phải xem xét nhiều luật về quyền riêng tư. Mặc dù dữ liệu tổng hợp làm giảm dấu vết của dữ liệu khách hàng nhưng nó vẫn chỉ là một phần rất nhỏ trong tổng số dữ liệu phi cấu trúc. Phần lớn dữ liệu được tạo bởi ứng dụng chứ không phải dữ liệu người dùng, do đó cần có dữ liệu tổng hợp kết hợp với quản lý dữ liệu phi cấu trúc để quản lý sự tăng trưởng dữ liệu.

Các doanh nghiệp tiếp tục chịu áp lực ngày càng tăng trong việc áp dụng các chiến lược quản lý dữ liệu cho phép họ lấy được thông tin hữu ích từ cơn sóng thần dữ liệu để đưa ra các quyết định kinh doanh quan trọng. Phân tích sẽ là trọng tâm của nỗ lực này, cũng như việc tạo ra các kết cấu dữ liệu mở và dựa trên tiêu chuẩn cho phép các tổ chức kiểm soát tất cả dữ liệu này để phân tích và hành động.

Mục lục

cầu chia cho DU khoa la liệu năm Phan Phi se tích trực vào

Dữ liệu phi cấu trúc sẽ là chìa khóa cho phân tích vào năm 2023