Dữ liệu lớn và Phân tích nâng cao

Dữ liệu lớn mô tả dữ liệu thể hiện những thách thức đáng kể về khối lượng, tốc độ, sự đa dạng, tính xác thực và hình ảnh hóa. Sự gia tăng kỹ thuật số hóa, sự gia tăng của các cảm biến mới, các phương thức giao tiếp mới, internet vạn vật và ảo hóa các không gian nhận thức xã hội (ví dụ: mạng xã hội) đã góp phần đáng kể vào sự phát triển của Dữ liệu lớn.

Phân tích nâng cao (dữ liệu) mô tả các phương pháp phân tích nâng cao để hiểu và hình dung khối lượng lớn thông tin. Những kỹ thuật này bao gồm một loạt các phương pháp được rút ra từ các lĩnh vực nghiên cứu về khoa học dữ liệu và quyết định, bao gồm trí tuệ nhân tạo, tối ưu hóa, lập mô hình & mô phỏng (M&S), kỹ thuật yếu tố con người và nghiên cứu vận hành.

Kể từ đầu những năm 1960, thế giới của chúng ta ngày càng trở nên số hóa và ảo. Và trong 20 năm tới, xu hướng này dự kiến sẽ tăng tốc và có tác động bứt phá cơ bản. BDAA (Dữ liệu lớn và Phân tích nâng cao) là sự phát triển trực tiếp của thế giới ảo và kỹ thuật số ngày càng tăng của chúng ta, và nhu cầu tiếp theo sẽ là hiểu rõ về sự tràn ngập thông tin. Cụ thể, phân tích là quá trình tạo ra sự hiểu biết (ví dụ thông qua phân tích toán học và trực quan) và cung cấp những hiểu biết sâu sắc về trạng thái hệ thống hiện tại (mô tả) hoặc trạng thái hệ thống trong tương lai (dự đoán). Nhà phân tích thường phải đối mặt với việc dữ liệu có những thách thức về khối lượng, tốc độ, sự đa dạng, tính xác thực hoặc trực quan hóa đáng kể.

Một lượng lớn dữ liệu có sẵn trong không gian vật lý, con người hoặc thông tin trong tương lai sẽ cho phép phân tích cung cấp thông tin chi tiết và dự đoán, cung cấp hỗ trợ quyết định theo thời gian thực, đồng thời nêu bật các chỉ báo sớm về thành công và cảnh báo về khủng hoảng. Việc tăng cường sử dụng phân tích dự báo và M&S sẽ cho phép những người ra quyết định vượt qua giới hạn nhận thức của họ trong khi cải thiện khả năng cân nhắc, sự phụ thuộc lẫn nhau, trong quá trình kiểm tra và động lực thời gian. Cuối cùng, điều này sẽ cho phép những người ra quyết định hiểu rõ hơn về tác động tiềm tàng của các quyết định của họ và điều chỉnh kế hoạch cho phù hợp. Nhiều khía cạnh của BDAA đã được phát triển tốt, mặc dù nó đang và sẽ tiếp tục mang tính đột phá cao, một số người đã đặt câu hỏi liệu nó có thực sự là một công nghệ mới nổi vào thời điểm này hay không.

BDAA được hiểu là bao gồm bốn thành phần thiết yếu: (1) thu thập (cảm biến); (2) thông tin liên lạc; (3) phân tích; và, (4) ra quyết định. Các tính chất của chúng được thể hiện bằng 5V (5 chữ đầu của các từ tiếng Anh là: khối lượng (volume), tốc độ (velocity), sự đa dạng (variety), tính trung thực (veracity) và trực quan (visualisation)) mô tả thách thức thiết yếu của BDAA: làm thế nào để hiểu được lượng lớn dữ liệu không đồng nhất đến quá nhanh và tính xác thực và độ chính xác có khả năng gây nghi ngờ. BDAA bao gồm các lĩnh vực con người (truyền thông xã hội, tin sinh học...), vật lý (cảm biến) và thông tin (mạng, phân tích...).

BDAA là một công nghệ nền tảng và như vậy, hiểu được sự phát triển dự kiến của nó là một bước quan trọng để hiểu các EDT khác. Từ góc độ theo dõi công nghệ, BDAA sẽ được kích hoạt bởi sự phát triển của KH&CN trong nhiều lĩnh vực, bao gồm: khai thác chữ ký của con người; mô hình hóa và mô phỏng cho phương tiện truyền thông xã hội; động cơ nhiệt hạch đa cảm biến mô-đun; cung cấp và khám phá các công cụ và dịch vụ M&S trên đám mây điện toán; phân tích hình ảnh; hỗ trợ quyết định và hỗ trợ lập kế hoạch với M&S; các khu vực nhiệm vụ ảo; các công nghệ sổ cái phân tán (ví dụ: blockchain); cảm nhận nhận thức; cảm biến nén; hình ảnh tính toán; học sâu; cảm biến điện trường và từ trường; mạch tích hợp quang tử; kết hợp dữ liệu nguồn cảm biến; hệ thống trung tâm bầy đàn; và viễn thông băng rộng.

P.A.T (NASATI), theo Science & Technology Trends: 2020-2040. NATO Science & Technology Organization, 2022