Càng thông minh, trí tuệ nhân tạo càng thích giấu dốt?

Một nhóm nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Bách khoa Valencia, Tây Ban Nha, phát hiện rằng khi các mô hình ngôn ngữ lớn (LLM) trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot trí tuệ nhân tạo AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.


Khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn. (Ảnh minh họa).

Để kiểm tra độ chính xác của ba LLM phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi.

Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy một số xu hướng đáng chú ý.

Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới, nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn.

Điều đáng ngạc nhiên là khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết LLM sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin.

Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai.

Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các LLM đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình.

Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.

TIN CŨ HƠN
Trí tuệ nhân tạo vẽ Mona Lisa của thế kỷ 21

Trí tuệ nhân tạo vẽ Mona Lisa của thế kỷ 21

Mona Lisa sẽ trông như thế nào nếu được vẽ bởi Leonardo Da Vinci trong thế kỷ 21? Công nghệ trí tuệ nhân tạo (AI) vừa trả lời câu hỏi này.

Đăng ngày: 21/09/2025
Trí tuệ nhân tạo AGI là gì, mà khiến các nhà khoa học phải kinh sợ, làm hỗn loạn nội bộ OpenAI

Trí tuệ nhân tạo AGI là gì, mà khiến các nhà khoa học phải kinh sợ, làm hỗn loạn nội bộ OpenAI

Nhiều nguồn tin cho rằng, việc các nhà nghiên cứu của OpenAI tiệm cận đến việc có thể tạo ra AGI là nguyên nhân khiến CEO Sam Altman đột ngột bị sa thải.

Đăng ngày: 09/09/2025
Dùng AI vẽ chân dung của Leonardo da Vinci, Alexander Đại đế ở thế kỷ 21 và cái kết cực chất

Dùng AI vẽ chân dung của Leonardo da Vinci, Alexander Đại đế ở thế kỷ 21 và cái kết cực chất

Ở thế kỷ 21, Leonardo da Vinci, Alexander Đại đế hay Van Gogh có vẻ ngoài thế nào?

Đăng ngày: 28/08/2025
AI phục chế màn biểu diễn đỉnh cao của ảo thuật gia nhà Thanh: David Copperfield cũng phải nể!

AI phục chế màn biểu diễn đỉnh cao của ảo thuật gia nhà Thanh: David Copperfield cũng phải nể!

Ở thời điểm công nghệ chưa phát triển, màn biểu diễn của ảo thuật gia thời nhà Thanh quả thực vô cùng mãn nhãn.

Đăng ngày: 16/08/2025
Trí tuệ nhân tạo hàng đầu thế giới bị qua mặt trong môn cờ vây chỉ bằng một

Trí tuệ nhân tạo hàng đầu thế giới bị qua mặt trong môn cờ vây chỉ bằng một "thủ thuật cỏn con"

"Vô chiêu thắng hữu chiêu", thủ thuật đánh bại AI cờ vây hàng đầu thế giới hóa ra đơn giản không ngờ.

Đăng ngày: 12/08/2025
Chatbot ChatGPT

Chatbot ChatGPT "hot" nhất hiện nay có gì đặc biệt?

ChatGPT đã có hơn 1 triệu người dùng thử chỉ trong vòng một tuần ra mắt. Đây là sản phẩm của một công ty trí tuệ nhân tạo do tỷ phú Elon Musk đồng sáng lập.

Đăng ngày: 03/08/2025
Deepfake là gì? Làm sao để phát hiện video làm từ deepfake?

Deepfake là gì? Làm sao để phát hiện video làm từ deepfake?

Hình ảnh, video deepfake đang trở thành một trào lưu hết sức nguy hiểm và xuất hiện ngày càng nhiều trên mạng hay các phương tiện truyền thông.

Đăng ngày: 02/08/2025
Khoa Học News