Tin tức và phân tích của tất cả các thiết bị di động

Google làm cho bộ dữ liệu dễ dàng hơn để tìm trực tuyến

Các nhà nghiên cứu và học giả đang tìm kiếm bộ dữ liệu trực tuyến giờ đây sẽ dễ dàng thực hiện hơn vì Tìm kiếm dữ liệu của Google hiện đã hết giai đoạn thử nghiệm và bao gồm các công cụ mới để lọc tìm kiếm tốt hơn với quyền truy cập vào gần 25m bộ dữ liệu.

Dataset Search lần đầu tiên ra mắt vào năm 2018 như là một phần trong mục tiêu của công ty nhằm chấm dứt sự phân mảnh dữ liệu truy cập mở.

Trong khi nhiều trường đại học, chính phủ và phòng thí nghiệm công bố dữ liệu của họ trực tuyến, thường rất khó tìm thấy bằng cách sử dụng các công cụ tìm kiếm truyền thống. Tuy nhiên, bằng cách thêm các thẻ siêu dữ liệu nguồn mở vào các trang web của họ, các nhóm này có thể có dữ liệu của họ được lập chỉ mục bởi Tìm kiếm dữ liệu của Google.

  • Hệ thống AI của Google đánh bại các bác sĩ trong bài kiểm tra ung thư
  • Những thách thức của việc lưu trữ dữ liệu khoa học
  • Google giúp việc di chuyển dữ liệu lên đám mây dễ dàng hơn

Mặc dù gã khổng lồ tìm kiếm không chia sẻ số liệu sử dụng cụ thể cho Tìm kiếm dữ liệu, công ty nói rằng hàng trăm ngàn người dùng đã dùng thử kể từ khi ra mắt và công cụ này đã nhận được sự hỗ trợ tích cực từ cộng đồng khoa học.

Tìm kiếm dữ liệu

Bờm đã nói chuyện với một nhà khoa học nghiên cứu tại Google AI, người đã giúp tạo ra công cụ có tên Natasha Noy, người nói rằng kho lưu trữ dữ liệu (hầu hết) dữ liệu đã rất phản hồi và rằng Dataset Search thậm chí còn khuyến khích các tổ chức khoa học cũ hơn nghiêm túc hơn trong việc xuất bản siêu dữ liệu.

Giờ đây, công cụ đã hết giai đoạn thử nghiệm, Google đã bổ sung các tính năng mới cho nó bao gồm khả năng lọc dữ liệu theo loại (bảng, hình ảnh, văn bản, v.v.), cho dù nó có miễn phí sử dụng và cả khu vực địa lý mà nó bao gồm. Dataset Search hiện cũng có sẵn trên thiết bị di động và nó đã mở rộng các mô tả dữ liệu.

Theo Google, công cụ tìm kiếm của công cụ này bao gồm gần 25 triệu bộ dữ liệu, mặc dù đây chỉ là một phần nhỏ của bộ dữ liệu trên web. Các chủ đề lớn nhất được Dataset Search lập chỉ mục bao gồm khoa học địa chất, sinh học và nông nghiệp với giáo dục, thời tiết, ung thư, tội phạm, bóng đá và chó là những truy vấn phổ biến nhất.

Cung cấp dữ liệu cho người dùng là những gì Google làm tốt nhất và công ty có kế hoạch tiếp tục thêm nhiều bộ dữ liệu vào Tìm kiếm dữ liệu.

  • Ngoài ra kiểm tra máy tính xách tay kinh doanh tốt nhất

Qua Verge