AI có thể nâng cao độ tin cậy cho Wikipedia
Cập nhật vào: Thứ hai - 06/11/2023 12:06 Cỡ chữ
Có rất nhiều ý kiến khác nhau về sự hữu ích của Wikipedia trong việc cung cấp đầy đủ, toàn diện thông tin.
Tiểu thuyết gia Nicholson Baker gọi Wikipedia là “một bản tóm tắt dữ liệu mà các nhà phát triển của nó gọi là tập hợp tất cả kiến thức trên thế giới là một thứ thật đáng kinh ngạc. Nó có những đặc điểm như: có một phong cách riêng với cả sự cẩn thận lẫn lộn xộn, hài hước, gây sốc và đầy tranh cãi. Nó còn miễn phí và có thể tìm kiếm rất nhanh chóng”. Nhà văn đạt giải Oscar Auliq-Ice tuyên bố, Wikipedia là "một nguồn tài nguyên mang tính cách mạng đã thay đổi cách mọi người truy cập và chia sẻ thông tin".
Một số người có công nhận nguồn tài nguyên trực tuyến khổng lồ này, với hơn 6,7 triệu bài báo (bằng tiếng Anh), với hơn 4,3 tỷ từ, một công trình vĩ đại nhưng có sai sót. Chuyên gia môi trường Steven Magee cho biết: “Wikipedia giống như một luống hoa, hầu hết đều đẹp đẽ nhưng có một số loài cỏ dại xấu xí mọc trong vườn”.
Mặc dù thường được coi là một nguồn thông tin nhanh chóng, đáng khen ngợi nhưng người dùng luôn được khuyến cáo cần thẩm định lại nội dung và không nên chỉ dựa vào một nguồn thông tin. Thay vào đó, họ nên xem lại các website khác, khám phá các liên kết bài viết và có lẽ quan trọng nhất là kiểm tra các nguồn được liệt kê ở cuối mỗi mục Wikipedia.
Các chuyên gia từ khắp nơi trên thế giới là những người đóng góp thường xuyên cho Wikipedia và hầu hết đều tuân theo các nguyên tắc liên quan đến tính trung lập và việc sử dụng các nguồn có uy tín. Mặc dù hệ thống nhìn chung hoạt động tốt, những vẫn cần cải tiến.
Tuần này, tạp chí Nature Machine Intelligence đã xuất bản một bài báo có tiêu đề "Cải thiện khả năng xác minh Wikipedia bằng AI", về một công ty AI có trụ sở tại London đang tìm cách tăng cường độ tin cậy của hệ thống tham chiếu Wikipedia. Nó làm như vậy bằng cách kiểm tra các nguồn và xác định những nguồn chính xác và những nguồn có vấn đề, sau đó đưa ra các khuyến nghị của riêng mình.
Fabio Petroni, đồng sáng lập Samaya AI, một nền tảng khám phá kiến thức, cho biết: "Quá trình cải thiện tài liệu tham khảo có thể được giải quyết với sự trợ giúp của trí tuệ nhân tạo được hỗ trợ bởi hệ thống truy xuất thông tin và mô hình ngôn ngữ. Máy móc có thể giúp con người tìm những trích dẫn tốt hơn, một công việc đòi hỏi sự hiểu biết về ngôn ngữ và khả năng tìm kiếm trực tuyến thành thạo." Nhóm của ông đã đào tạo mô hình của họ trên một tập dữ liệu khổng lồ gồm các mục Wikipedia và sau đó sử dụng nó để xem xét các bài viết mà nó chưa quét trước đó. Nó phân tích các nguồn và đưa ra các trang tham khảo thay thế, và kết quả của nó sau đó được người dùng Wikipedia kiểm tra.
Các nhà nghiên cứu nhận thấy khi hệ thống AI, được gọi là SIDE, phân loại các nguồn Wikipedia là không thể xác minh được và đưa ra các lựa chọn thay thế của riêng nó, thì 70% người dùng ưa thích các đề xuất của SIDE hơn. Trong khoảng một nửa số trường hợp, SIDE đề xuất các nguồn giống hệt mà Wikipedia đã đưa ra làm tài liệu tham khảo đầu tiên.
Petroni cho biết: “Chúng tôi chứng minh rằng các công nghệ hiện có đã đạt đến giai đoạn mà chúng có thể hỗ trợ người dùng Wikipedia một cách hiệu quả và thực tế trong việc xác minh các khiếu nại”. Ông cho biết nghiên cứu trong tương lai sẽ tập trung vào các tài liệu tham khảo Wikipedia ngoài văn bản trên internet, chẳng hạn như hình ảnh, video và các ấn phẩm giấy. Petroni cho biết: “Chúng tôi hy vọng rằng công việc này có thể được sử dụng trong bối cảnh rộng hơn… giúp con người kiểm tra sự thật. Nói chung, chúng tôi tin rằng công việc này có thể dẫn đến thông tin trực tuyến đáng tin cậy hơn”.
P.T.T (NASATI), theo https://techxplore.com/news/2023-10-ai-boost-wikipedia-reliability.html, 24/10/2023