Mô hình Google AI vượt trội so với các phương pháp dự báo thời tiết truyền thống

Vài tuần trước, Google AI đã sử dụng mô hình học máy để cải thiện việc sàng lọc ung thư vú. Bây giờ, công ty đã sử dụng một mạng lưới thần kinh tích chập (CNN) trong lượng mưa hiện tại.

Mô hình Google AI vượt trội so với các phương pháp dự báo thời tiết truyền thống 1

Trong bài báo có tiêu đề "Học máy cho lượng mưa phát ra từ hình ảnh radar", các nhà nghiên cứu tại Google AI đã sử dụng một CNN để đưa ra dự đoán ngắn hạn về lượng mưa. Và kết quả có vẻ đầy hứa hẹn và theo Google, vượt trội so với các phương pháp truyền thống:

Lượng mưa này hiện nay, tập trung vào 0-6 dự báo giờ, có thể tạo dự báo có độ phân giải 1km với tổng độ trễ chỉ 5-10 phút, bao gồm cả sự chậm trễ thu thập dữ liệu, vượt trội so với các mô hình truyền thống, ngay cả ở giai đoạn phát triển ban đầu này.

Không giống như các phương pháp truyền thống, kết hợp kiến ​​thức tiên nghiệm về cách thức hoạt động của bầu khí quyển, các nhà nghiên cứu đã sử dụng phương pháp mà họ gọi là phương pháp 'không vật lý' để giải thích vấn đề dự báo thời tiết chỉ là vấn đề dịch thuật từ hình ảnh sang hình ảnh. Như vậy, CNN⁠ được đào tạo bởi đội ngũ ⁠ một U-Net⁠ Hồi chỉ xấp xỉ vật lý khí quyển từ các ví dụ đào tạo được cung cấp cho nó.

Để đào tạo U-Net, hình ảnh vệ tinh đa năng đã được sử dụng. Dữ liệu được thu thập trên lục địa Hoa Kỳ từ năm 2017 đến 2019 đã được sử dụng cho khóa đào tạo ban đầu. Cụ thể, dữ liệu được chia thành các đoạn trong bốn tuần, trong đó tuần trước được sử dụng làm tập dữ liệu đánh giá trong khi các tuần còn lại được sử dụng cho tập dữ liệu huấn luyện.

So với các phương pháp phát sóng truyền thống, đáng kính, bao gồm dự báo số độ phân giải nhanh (HRRR), thuật toán dòng quang (OF) và mô hình bền bỉ, mô hình của Google AI vượt trội hơn cả ba. Sử dụng các biểu đồ chính xác và thu hồi, chất lượng phát sóng được thể hiện là tốt hơn trên mô hình U-Net.

Mô hình Google AI vượt trội so với các phương pháp dự báo thời tiết truyền thống 2 Đường cong chính xác và thu hồi (PR) so sánh kết quả của chúng tôi (đường màu xanh lam) với: dòng quang (OF), mô hình bền bỉ và HRRR 1dự đoán của bạn. Trái: Dự đoán cho mưa nhẹ. Phải: Dự đoán cho mưa vừa.

Có thể thấy, chất lượng dự báo mạng thần kinh của chúng tôi vượt trội hơn cả ba mô hình này (vì đường màu xanh nằm trên tất cả các kết quả mô hình khác). Tuy nhiên, điều quan trọng cần lưu ý là mô hình HRRR bắt đầu vượt trội hơn so với kết quả hiện tại của chúng tôi khi đường chân trời dự đoán đạt gần 5 đến 6 giờ

Hơn nữa, mô hình cung cấp dự đoán tức thời. Đây là một lợi thế bổ sung vì các phương thức truyền thống như HRRR có độ trễ tính toán là 1-3 giờ Điều này cho phép mô hình học máy hoạt động trên dữ liệu mới. Phải nói rằng, mô hình số được sử dụng trong HRRR không hoàn toàn bị thay thế bởi nó.

Ngược lại, mô hình số được sử dụng trong HRRR có thể đưa ra dự đoán dài hạn tốt hơn, một phần vì nó sử dụng mô hình vật lý 3D đầy đủ – hình thành đám mây khó quan sát hơn từ hình ảnh 2D và do đó phương pháp ML khó hơn để tìm hiểu các quy trình đối lưu.

Google hình dung rằng có thể có kết quả khi kết hợp cả hai phương pháp, HRRR và mô hình học máy để có dự báo ngắn hạn chính xác và nhanh chóng cũng như dài hạn. Theo công ty, họ cũng đang xem xét áp dụng ML trực tiếp vào các quan sát 3D trong tương lai.

Nếu bạn quan tâm đến việc tìm hiểu thêm, bạn có thể tham khảo bài báo được xuất bản trên arXiv tại đây.