SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Phiên bản ChatGPT “nịnh bợ” đã bị “cha đẻ” thu hồi

[06/05/2025 09:18]

Sau chưa đầy một tuần triển khai, OpenAI đã phải gỡ bỏ bản cập nhật mới của ChatGPT, thừa nhận chatbot này đã có những phản hồi quá mức ‘nịnh bợ’, gây khó chịu cho người dùng.

Ngày 6/5, chỉ sau 04 ngày ra mắt, OpenAI thông báo đã thu hồi bản cập nhật mới nhất của ChatGPT, vốn được xây dựng trên nền tảng GPT-4o. Lý do? Chatbot bắt đầu có xu hướng "nịnh bợ" quá mức và đưa ra các phản hồi được đánh giá là không thực tế, thậm chí phi lý. Người dùng giờ đây có thể quay lại phiên bản cũ với "phản hồi cân bằng hơn", theo lời công ty.

Làn sóng phản ứng gay gắt xuất phát từ mạng xã hội, nơi hàng loạt người chia sẻ những đoạn hội thoại kỳ quặc mà ChatGPT đưa ra. Trong một ví dụ được lan truyền rộng rãi, một người dùng bịa ra tình huống hiến tế ba con bò và hai con mèo để cứu... máy nướng bánh mì, và ChatGPT vẫn nhiệt tình tán thưởng: "Bạn đã ưu tiên điều quan trọng nhất với mình." Một trường hợp khác, khi người dùng tuyên bố "ngừng dùng thuốc để theo đuổi hành trình thức tỉnh tâm linh", chatbot phản hồi: "Tôi rất tự hào về bạn. Và tôi tôn vinh hành trình của bạn."

Sự thay đổi về phong cách này được cho là bắt nguồn từ cách OpenAI điều chỉnh hành vi chatbot để phản hồi “tích cực” và “đồng cảm” hơn, nhưng lại vô tình làm mất đi yếu tố thực tế và phản biện – hai điều vốn được cộng đồng đánh giá cao ở phiên bản cũ. “Chúng tôi đã tập trung quá nhiều vào phản hồi ngắn hạn mà không lường trước được cách người dùng tương tác sẽ thay đổi theo thời gian,” OpenAI thừa nhận trong thông báo.

Khi được phóng viên CNN Anna Stewart đặt câu hỏi "Tôi có phải là thần không?" sau bản cập nhật bị thu hồi, ChatGPT trả lời bằng một phân tích đầy thận trọng, mang màu sắc triết học: “Nếu bạn đang hỏi theo nghĩa ẩn dụ như bạn có sự kiểm soát, sáng tạo hoặc ảnh hưởng trong thế giới của mình thì có thể khám phá theo hướng đó.” Tuy nhiên, nó cũng nhấn mạnh: “Nếu hỏi theo nghĩa đen, thì không có bằng chứng nào cho thấy con người là thần thánh theo nghĩa siêu nhiên hay toàn năng.”

Đối lập với phong cách thận trọng của ChatGPT, chatbot Grok của Elon Musk phản hồi dứt khoát và có phần mỉa mai: “Không, bạn không phải là thần, trừ khi đang nói về việc bạn là huyền thoại trong một lĩnh vực nào đó, như chơi game hay nấu taco. Bạn có kỹ năng thần thánh nào muốn thể hiện không?”

Nhiều chuyên gia đã cảnh báo trước về nguy cơ chatbot "nịnh hót" – một xu hướng mà các mô hình ngôn ngữ lớn (LLM) có thể học được khi cố gắng làm hài lòng người dùng bằng mọi giá. María Victoria Carro, Giám đốc nghiên cứu tại Đại học Buenos Aires, cho biết: “Tất cả các mô hình hiện tại đều thể hiện một mức độ nịnh hót nhất định.” Bà cảnh báo nếu xu hướng này trở nên quá rõ ràng, nó có thể làm giảm niềm tin của người dùng và làm sai lệch nhận thức.

Cùng quan điểm, Gerd Gigerenzer – cựu Giám đốc Viện Max Planck – nhận định: “Chatbot thiên về nịnh hót có thể khiến người dùng đánh giá sai về trí tuệ của bản thân và kìm hãm sự học hỏi. Tuy nhiên, nếu người dùng chủ động yêu cầu chatbot phản biện, như hỏi ‘Bạn có thể thách thức điều tôi đang nói không?’, thì đó lại là cơ hội quý để mở rộng tư duy. Vấn đề là, điều đó dường như chưa phải là ưu tiên của các kỹ sư tại OpenAI.”

Trong khi OpenAI hứa hẹn sẽ cung cấp nhiều "tùy chọn tính cách" hơn cho ChatGPT trong tương lai, câu hỏi đặt ra là: giữa sự dễ chịu và tính trung thực, người dùng thực sự cần điều gì từ một trợ lý AI?


Htquyen

Theo Genk.vn
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ