Tìm hiểu về vòng đời dữ liệu

Vòng đời dữ liệu gồm bốn yếu tố sau đây: (1) đầu vào và thu thập dữ liệu; (2) quản lý dữ liệu; (3) phân tích và sử dụng dữ liệu; và (4) đầu ra và truyền thông dữ liệu.

Đầu vào và thu thập dữ liệu được định nghĩa rộng rãi bao gồm dữ liệu, kiến ​​thức chuyên môn và các quy trình cần thiết để tạo ra các khối kiến thiết (building blocks) cho mô hình và dự báo. Các mục tiêu trong yếu tố này bao gồm: xác định và tập hợp các nhóm liên ngành để hỗ trợ mô hình và dự báo; xây dựng cơ chế cải thiện việc thu thập dữ liệu và bảo đảm chất lượng dữ liệu; thiết lập cơ sở dữ liệu cơ bản về dữ liệu quan trọng; và phát triển một quy trình để khuyến khích đổi mới sáng tạo, tăng cường chia sẻ dữ liệu và cải thiện tính linh hoạt.

Dữ liệu đầu vào cũng bao gồm các quy trình thu thập và đánh giá các nguồn dữ liệu mới, chẳng hạn như các thỏa thuận chia sẻ dữ liệu giữa các cơ quan, quốc gia và lĩnh vực để cho phép dữ liệu nhanh chóng được thu thập, chia sẻ, sử dụng và cập nhật trong những thời điểm cần thiết. Yếu tố này sẽ tạo ra một môi trường cởi mở để khám phá và tạo ra các nguồn dữ liệu mới và mới lạ có thể chứng tỏ tiện ích. Hơn nữa, tiện ích dữ liệu có thể được tăng cường đáng kể bằng cách tăng cường sử dụng các chuyên gia về chủ đề và người quản lý dữ liệu để đáp ứng nhu cầu ngày càng tăng của người dùng và đảm bảo rằng tất cả dữ liệu đều hữu ích, được kiểm tra và truy cập.

Quản lý dữ liệu bao gồm việc lưu trữ và tài liệu hóa dữ liệu theo cách cho phép các bộ dữ liệu được nhận dạng, truy cập và được hiểu bởi tất cả người dùng. Các mục tiêu trong yếu tố này bao gồm: xây dựng cơ sở hạ tầng để lưu trữ, quản lý và truy cập dữ liệu; thiết lập một định dạng siêu dữ liệu linh hoạt hỗ trợ việc khám phá, lập chỉ mục và lập danh mục dữ liệu cho các kiểu dữ liệu đa dạng; hỗ trợ nghiên cứu để phát triển các tiêu chuẩn dữ liệu hiện đại và luôn cập nhật chúng; và hỗ trợ nghiên cứu để phát triển các công cụ nhằm duy trì dữ liệu.

Phân tích và sử dụng dữ liệu liên quan đến nỗ lực tạo ra thông tin chi tiết có thể hành động từ dữ liệu, bao gồm phân tích, cảnh báo sớm, mô hình hóa và dự báo. Các mục tiêu trong yếu tố này bao gồm: tạo điều kiện tích hợp dữ liệu từ nhiều nguồn và nhiều lĩnh vực; phát triển cơ sở hạ tầng để tạo thuận lợi cho việc sử dụng và phân tích dữ liệu; và chính thức hóa các cơ chế để phát triển và xác nhận các mô hình và dự báo thông qua các nhóm liên ngành.

Đầu ra và truyền thông dữ liệu bao gồm các phương pháp được chuẩn hóa để truyền đạt kết quả dự báo, nền tảng và nhân sự để hỗ trợ giải thích thông tin và bảng điều khiển liên kết dữ liệu, kết quả đầu ra của mô hình và các thông điệp chính. Các mục tiêu thúc đẩy đổi mới sáng tạo trong yếu tố này bao gồm: hỗ trợ nghiên cứu để xác định các hành động thực tiễn hiệu quả nhằm truyền đạt kết quả và xác định các hạn chế của mô hình; xây dựng và phổ biến các tiêu chuẩn để truyền đạt kết quả mô hình cho các đối tượng chính; phát triển các trang tổng quan tích hợp mà người dùng có thể truy cập dữ liệu và mô hình trong thời gian thực; xác định số lượng, đào tạo và tổ chức các tuyên truyền viên chuyên nghiệp để diễn giải và phổ biến các kết quả của mô hình; và phát triển dự báo và mô hình hóa các khóa học và đào tạo ngắn hạn.

P.A.T (NASATI), theo Plan to Advance Data Innovation, Epidemic Modeling and Forecasting Fast Track Action Committee, National Science and Technology Council, https://www.whitehouse.gov/, 2/2022