SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

AI “làm sạch” danh mục tài liệu tham khảo của các bài viết Wikipedia

[25/10/2023 09:39]

Một mô hình mới có thể xác định các đầu mục tài liệu tham khảo không bổ trợ hoặc không khớp với các bài viết Wikipedia và đưa ra danh mục chính xác hơn.

AI có thể hỗ trợ các biên tập viên và người kiểm duyệt trong việc rà soát danh mục tài liệu tham khảo.

Độ tin cậy của mỗi bài viết Wikipedia phụ thuộc vào các tài liệu tham khảo được lập danh mục dưới mỗi bài viết - các đường dẫn liên kết đến nguồn thông tin được nêu trong bài. Trong nhiều trường hợp, những tài liệu tham khảo đó có sai sót, liên kết đến các trang web không còn hoạt động, thông tin sai lệch hoặc các nguồn không uy tín.

Một nghiên cứu được công bố vào ngày 19/10 trên tạp chí Nature Machine Intelligence cho rằng trí tuệ nhân tạo (AI) có thể giúp điều chỉnh các danh mục tài liệu tham khảo trong mỗi bài viết Wikipedia, cải thiện chất lượng và độ tin cậy.

Fabio Petroni ở công ty Samaya AI, London và các đồng nghiệp của ông đã phát triển một hệ thống máy học dựa trên cấu trúc mạng thần kinh có tên là SIDE. Hệ thống này phân tích xem danh mục tài liệu tham khảo có khớp với các thông tin đưa ra trong bài viết hay không, và đề xuất các lựa chọn thay thế tốt hơn.

“Có vẻ thật mỉa mai khi sử dụng AI để hỗ trợ cải thiện trích dẫn, vì ChatGPT nổi tiếng là bịa đặt trích dẫn. Nhưng điều quan trọng cần nhớ là có nhiều loại mô hình ngôn ngữ hơn là các chatbot”, Noah Giansiracusa, nhà nghiên cứu AI tại Đại học Bentley (Mỹ), nói.

SIDE được đào tạo để đánh giá như thế nào là các danh mục tài liệu tham khảo chất lượng cao dựa trên dữ liệu là các bài viết Wikipedia nổi bật - các bài được treo đầu trang và đã được chỉnh sửa bởi đội ngũ biên tập viên và người kiểm duyệt. Dựa trên đánh giá này, nó có thể quét Internet để tìm ra các tài liệu tham khảo thay thế chất lượng cao hơn.

Để thử nghiệm hệ thống, nhóm Petroni cho SIDE đề xuất tài liệu tham khảo cho các bài viết nổi bật trên Wikipedia, nhưng là các bài nằm ngoài tập dữ liệu đào tạo và mô hình chưa từng thấy trước đây. Trong gần 50% số trường hợp, tài liệu mà SIDE chọn ra cũng là tài liệu đã được trích dẫn trong bài viết bởi các biên tập viên. Trong những trường hợp còn lại, nó tìm thấy tài liệu tham khảo thay thế.

Khi các bài viết và danh mục tài liệu của SIDE được đưa cho một nhóm người dùng Wikipedia, 21% người dùng thích các danh mục do AI lập, 10% thích các danh mục gốc của bài viết và 39% không thích bên nào hơn.

Theo Aleksandra Urman, nhà khoa học máy tính tại Đại học Zurich (Thụy Sĩ), công cụ AI này có thể tiết kiệm thời gian cho các biên tập viên và người kiểm duyệt làm nhiệm vụ kiểm tra tính chính xác của các bài viết Wikipedia do người dùng đóng góp, nhưng chỉ khi nó được triển khai đúng cách. “SIDE có thể hữu ích trong việc gắn cờ những trích dẫn có dấu hiệu không chính xác, nhưng câu hỏi thực sự là cộng đồng Wikipedia có thấy hữu ích không", Urman nói.

Urman chỉ ra rằng trong thử nghiệm, giữa danh mục tài liệu tham khảo do SIDE lập và danh mục tham khảo ban đầu, phần lớn người dùng Wikipedia không cảm thấy thích bản nào hơn.

https://khoahocphattrien.vn (nnttien)
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ