Khi AI vẽ ảnh cho khoa học: Đẹp là chưa đủ, phải đúng
Cập nhật vào: Thứ tư - 18/03/2026 10:11
Cỡ chữ
Bất kỳ ai cũng có thể yêu cầu một công cụ AI phổ biến tạo ra hình ảnh một chú mèo trông như thật. Nhưng việc tạo ra một ảnh quét microCT có giá trị khoa học, ví dụ như cấu trúc trầm tích đá, sợi composite hay rễ cây, lại là một thách thức hoàn toàn khác. Trong khoa học, hình ảnh không được đánh giá dựa trên mức độ “thuyết phục” với mắt người, mà dựa trên việc chúng có phản ánh chính xác và định lượng được các quy luật vật lý và sinh học trong thế giới thực, ở cấp độ vi mô hoặc thậm chí nguyên tử hay không.

Trong bối cảnh đó, các nhà nghiên cứu tại Lawrence Berkeley National Laboratory (Berkeley Lab) vừa công bố một trong những nghiên cứu chuyên sâu đầu tiên về việc đánh giá các mô hình AI tạo sinh trong ảnh khoa học. Công trình này được kỳ vọng sẽ giúp các nhà khoa học lấp đầy những khoảng trống dữ liệu quan trọng, tăng tốc quá trình phân tích và phát hiện những quy luật hiếm gặp, vốn rất khó hoặc rất tốn kém để thu được chỉ bằng thí nghiệm truyền thống.
Nghiên cứu được công bố trên tạp chí Journal of Imaging, tập trung so sánh hiệu năng của các hướng tiếp cận AI tạo sinh hàng đầu hiện nay, bao gồm Variational Autoencoders (VAE), Generative Adversarial Networks (GAN) và Diffusion Models. Các mô hình này được đánh giá dựa trên khả năng tạo ra ảnh khoa học chính xác từ các bộ dữ liệu ảnh độ phân giải cao của trầm tích đá, sợi composite và rễ cây.
Daniela Ushizima, nhà khoa học cao cấp tại Bộ phận Nghiên cứu Toán ứng dụng và Tính toán (AMCR) của Berkeley Lab và là chủ nhiệm đề tài, nhấn mạnh: “Khi tạo ảnh cho khoa học, nhóm nghiên cứu không theo đuổi yếu tố thẩm mỹ, mà theo đuổi mức độ chân thật. Các công cụ AI dành cho người dùng có thể gây ấn tượng về mặt hình thức, nhưng mô hình khoa học phải mã hóa đúng các quy luật vật lý và sinh học. Khi khoa học được đảm bảo, những mô hình này có thể hé lộ các quy luật chưa từng được nhìn thấy và thúc đẩy khám phá theo cách mà thí nghiệm đơn thuần không thể làm được”.
Zineb Sordo, tác giả chính của bài báo và từng là nhà nghiên cứu tại AMCR của Berkeley Lab, cho biết nghiên cứu này nhằm mở rộng phạm vi ứng dụng của AI tạo sinh vượt ra ngoài những bộ dữ liệu đơn giản như ảnh chó, mèo hay chim, vốn không mang nhiều ý nghĩa khoa học. Mặc dù một số nghiên cứu đã áp dụng AI tạo sinh cho dữ liệu y sinh, nhưng việc đánh giá chúng với các ảnh khoa học trong những lĩnh vực khác vẫn còn rất hạn chế. Mục tiêu của nhóm là xem các mô hình này hoạt động ra sao với những bộ dữ liệu có ý nghĩa trực tiếp đối với các phòng thí nghiệm quốc gia của Bộ Năng lượng Mỹ.
Theo nhóm nghiên cứu, bằng cách tạo ra những hình ảnh vừa chân thực vừa phù hợp với vật lý, AI tạo sinh không chỉ giúp lấp khoảng trống dữ liệu và tăng tốc khám phá, mà còn cho phép các nhà khoa học đặt ra những câu hỏi hoàn toàn mới chẳng hạn như tìm ra các quy luật thiết kế vi cấu trúc, hay kiểm chứng các thuật toán trên quy mô lớn bằng những dữ liệu mô phỏng sát thực tế.
So sánh các mô hình AI tạo sinh trong ảnh khoa học
Trong bài báo, nhóm tác giả chỉ ra rằng mỗi loại mô hình AI tạo sinh có thế mạnh riêng. Các mô hình GAN, đặc biệt là StyleGAN của Nvidia, tỏ ra vượt trội trong việc tạo ra các hình ảnh có tính nhất quán cao về mặt thị giác, phù hợp với các đặc tính sinh học và vật lý. Trong khi đó, Diffusion Models, tiêu biểu là DALL-E 2 của OpenAI, có khả năng tạo ra hình ảnh rất sát với mô tả ban đầu, nhưng đôi khi gặp khó khăn trong việc duy trì độ chính xác khoa học cần thiết khi theo đuổi mức độ “giống thật” cao.
Nhóm nghiên cứu cũng đánh giá các nền tảng phổ biến như RunwayML và DeepAI, và nhận thấy rằng dù hữu ích cho sáng tạo hình ảnh, các công cụ này không phải lúc nào cũng đáp ứng được yêu cầu khắt khe của nghiên cứu khoa học.
Để đưa ra các kết luận này, nhóm đã tiến hành một quy trình đánh giá toàn diện, kết hợp cả chỉ số định lượng và đánh giá định tính. Các thước đo định lượng bao gồm SSIM (đánh giá độ tương đồng cấu trúc), LPIPS (đánh giá độ tương đồng cảm nhận dựa trên mạng học sâu), FID (so sánh phân bố ảnh sinh ra với ảnh thật) và CLIPScore (đánh giá mức độ phù hợp giữa ảnh và mô tả văn bản). Bên cạnh đó, các chuyên gia trong lĩnh vực khoa học vật liệu và sinh học cũng tham gia thẩm định trực tiếp.
Ushizima lưu ý: “Các chỉ số định lượng có thể cho biết ảnh AI trông giống thật đến mức nào, nhưng chúng không phải lúc nào cũng phát hiện được những sai lệch tinh vi khiến ảnh trở nên sai về mặt khoa học. Vì vậy, vai trò của chuyên gia lĩnh vực vẫn là không thể thay thế”.
Siêu máy tính và tính minh bạch khoa học
Để thực hiện các so sánh phức tạp này, nhóm nghiên cứu đã sử dụng siêu máy tính Perlmutter tại Trung tâm Tính toán Khoa học Năng lượng Quốc gia (NERSC), tận dụng sức mạnh GPU để xử lý các bộ dữ liệu lớn và huấn luyện mô hình từ đầu. Việc công bố chi tiết phương pháp, dữ liệu và quy trình đánh giá giúp đảm bảo tính minh bạch và khả năng tái lập, cho phép các nhóm nghiên cứu khác tiếp tục phát triển dựa trên nền tảng này.
Ngoài ra, nghiên cứu còn cho thấy tiềm năng của AI tạo sinh trong xử lý dữ liệu đa phương thức: kết hợp văn bản, hình ảnh và dữ liệu số. Trong khi AI y sinh chủ yếu tập trung vào ảnh y khoa, công trình này mở rộng sang các lĩnh vực như khoa học vật liệu, địa chất và sinh học thực vật, nhấn mạnh nhu cầu căn chỉnh mô hình theo từng miền khoa học cụ thể.
Peter Andeer, nhà khoa học tại Bộ phận Genomics Môi trường và Sinh học Hệ thống của Berkeley Lab, chia sẻ rằng độ chính xác của một số hình ảnh AI đã đạt mức đáng kinh ngạc: trong các thử nghiệm “nhận dạng ảnh thật”, nhiều nhà nghiên cứu đã không phân biệt được ảnh rễ cây thật với ảnh do AI tạo ra.
Trong bối cảnh AI tạo sinh phát triển nhanh chóng, nhóm Berkeley Lab kỳ vọng công trình này sẽ giúp cộng đồng khoa học toàn cầu khai thác hiệu quả hơn các công cụ mới, vượt qua các nút thắt thí nghiệm và đẩy nhanh tiến bộ trong những lĩnh vực như pin, lưu trữ năng lượng và vật liệu tiên tiến. Trong tương lai, họ dự định phát triển các mô hình AI được “đo ni đóng giày” cho ảnh khoa học, đồng thời xây dựng các quy trình kiểm chứng chặt chẽ để đảm bảo hình ảnh do AI tạo ra vừa chính xác, vừa đáng tin cậy cho nghiên cứu.
N.P.A (NASTIS), theo Hpcwire
Liên hệ
Tiếng Việt
Tiếng Anh











