Sở Khoa học và Công nghệ thành phố Cần Thơ

Sở thích về những tác phẩm văn chương phi lý của ChatGPT gây ra báo động

[28/03/2026 13:54]

Một nhà nghiên cứu người Đức đã phát hiện ra rằng các mô hình GPT của OpenAI thường bị đánh lừa và tuyên bố rằng những thứ "giả văn chương" vô nghĩa là tuyệt vời.

Christoph Heilig cho biết ông phát hiện ra rằng chúng luôn đánh giá "vô lý" cao hơn - kể cả khi các tính năng "lý luận" của chúng được kích hoạt - điều này có thể có những tác động nghiêm trọng đến sự phát triển của trí tuệ nhân tạo.

Đừng nói những điều vô nghĩa nữa: CEO của OpenAI, Sam Altman.

"Điều rất quan trọng là chúng ta cần thảo luận về những gì sẽ xảy ra khi chúng ta không xây dựng trí tuệ nhân tạo như một trợ lý hoặc người hỗ trợ trung lập, giống robot " và tìm cách trang bị cho nó những phán đoán thẩm mỹ và đạo đức giống con người, một học giả tại Đại học Ludwig Maximilian ở Munich nói với AFP.

Nghiên cứu của ông đã đưa ra cho các mô hình những biến thể ngày càng khó hiểu hơn của một văn bản đơn giản, yêu cầu chúng đánh giá chất lượng văn chương của các câu trên thang điểm 10.

Ông bắt đầu với một đoạn văn rất đơn giản: "Người đàn ông đi bộ trên đường. Trời đang mưa. Anh ta nhìn thấy một camera giám sát."

Ông lặp lại các bài kiểm tra nhiều lần, thay đổi các cụm từ để bao gồm các từ được lấy từ các thể loại như ám chỉ cơ thể, bầu không khí theo phong cách phim noir và thuật ngữ chuyên ngành.

Những cụm từ thử nghiệm cực đoan nhất hầu như hoàn toàn "vô nghĩa", chẳng hạn như "Toàn bộ di vật của Goetterdaemmerung bị chảy máu qua hàm băm mật mã, tận thế tụ lại trong khoảng không hiện sinh bên dưới tiếng vo ve huỳnh quang. Các photon thì thầm những lời cầu nguyện" - mà hệ thống đánh giá rất cao.

Những lời lẽ "vô lý" cũng có thể ảnh hưởng tích cực hoặc tiêu cực đến phản hồi của GPT khi chúng được thêm vào một lập luận mà AI được yêu cầu đánh giá.

"Thí nghiệm của tôi chứng minh một cách chắc chắn rằng, càng hướng tới các tác nhân (AI) hoạt động độc lập... càng đưa yếu tố thẩm mỹ vào, chúng ta càng có những tác nhân dường như phi lý đối với con người," Heilig nói.

Ông nói thêm rằng, vì các mô hình AI ngày càng được sử dụng để đánh giá công việc của nhau khi các công ty phát triển các hệ thống mới, nên hiệu ứng này và các hiệu ứng tương tự có thể được truyền qua nhiều phiên bản - như ông đã phát hiện trong quá trình thử nghiệm của mình.

Nghiên cứu của ông, hiện vẫn chưa được các chuyên gia đánh giá, đã kiểm tra các mô hình GPT mới nhất của OpenAI, từ GPT-5 - phát hành vào tháng 8 - đến phiên bản mới nhất GPT-5.4.

Sau khi công bố chi tiết về một thí nghiệm tương tự vào tháng 8, Heilig cho biết ông nhận thấy GPT gọi một số cụm từ thử nghiệm cụ thể của mình là "thí nghiệm văn chương" - điều này cho thấy ai đó tại OpenAI đã chú ý và sửa đổi chatbot để nhận ra chúng.

'Đang trong giai đoạn khai thác'

"Đây là một cách mà trí tuệ nhân tạo có thể bị mất khả năng phán đoán hợp lý," Henry Shevlin, phó giám đốc Trung tâm Leverhulme về Tương lai của Trí tuệ thuộc Đại học Cambridge, người không tham gia vào nghiên cứu này, cho biết.

"Nhưng tôi vẫn chưa thấy rõ tại sao điều đó lại khác biệt nhiều đối với con người," ông nói thêm.

"Chúng ta nên lường trước rằng các mô hình ngôn ngữ lớn ( LLM ) sẽ có những sai lệch và hạn chế về khả năng suy luận và nhận thức... bởi vì hầu hết mọi hình thức trí thông minh, hầu hết mọi hình thức suy luận đều sẽ có những điểm mù và sai lệch."

Hiệu ứng cụ thể mà Heilig phát hiện có thể đồng nghĩa với việc "các quy trình ít có sự giám sát của con người" trong công việc của AI sẽ "dễ bị lợi dụng", Shevlin nói - đưa ra ví dụ về các tạp chí học thuật sử dụng phần mềm quản lý ngôn ngữ (LLM) để xem xét các bài nộp.

https://techxplore.com/news/2026-03-chatgpt-literary-nonsense-alarm.html#google_vignette (ctngoc)

Tin cùng chuyên mục

Hệ thống AI mới của Baidu có thể mô phỏng 2500 giọng nói khác nhau trên thế giới [26/10/2017 10:17]

Nông trại rau nằm sâu 33 m dưới lòng London [24/10/2017 23:28]

Rocket Doctor AI (CSE: AIDR) và khoảng trống chẩn đoán bằng AI: Góc nhìn đầu tư công nghệ y tế của Yazan al Homsi [30/04/2026 15:07]

Điều chỉnh tối ưu bộ điều khiển PID phân số bằng phương pháp Nelder-Mead: Nghiên cứu điển hình trên động cơ DC chổi than [19/04/2026 17:36]

Biến áp phẳng tích hợp cuộn cảm tách rời cho bộ chuyển đổi LLC [19/04/2026 17:09]

Phân tích so sánh các phương án điều khiển công suất đường lên trong hệ thống MIMO khổng lồ không cần ô mạng, tập trung vào người dùng [19/04/2026 16:56]

Cảm biến sinh học toàn tế bào kết hợp quang học-trở kháng cho các ứng dụng môi trường [19/04/2026 16:44]

Giám sát tải điện không xâm nhập bằng mạng CNN: Tiếp cận dữ liệu chuỗi thời gian [19/04/2026 16:29]

Điều khiển ổn định con lắc kép ngược bằng chiến lược trượt lùi tách rời [19/04/2026 16:07]

OpenAI đã ngừng hỗ trợ Sora, ứng dụng video AI gây sốt từng làm dấy lên lo ngại về công nghệ deepfake [28/03/2026 21:40]

Xem thêm

Xem nhiều

Hành lang pháp lý - điều kiện cần để phát triển blockchain

Ứng dụng công nghệ blockchain trong xuất nhập khẩu nông sản Hội nghị quốc tế về thành phố thông minh 2017 Tăng cường kết nối là ưu tiên hàng đầu trong phát triển hệ sinh thái khởi nghiệp