Câu hỏi này đánh lừa mọi AI

Admin

12:05 04/06/2023

Nếu muốn AI trả lời sai, người dùng chỉ cần đặt câu hỏi nhiều mệnh đề ở thể phủ định.

Câu hỏi nhiều mệnh đề phủ định có thể đánh lừa các chatbot AI mạnh nhất hiện nay. Ảnh: EandT.

Cách đây gần 5 năm, Google phát hành một chatbot có tên là BERT. Đây là mô hình ngôn ngữ lớn (LLM) đầu tiên của Google được đào tạo bằng một khối lượng lớn dữ liệu trực tuyến, và có vẻ như BERT có thể giao tiếp bằng văn bản giống như con người.

Kể từ đó, các LLM liên tục được cải thiện về quy mô và khả năng. Tuy nhiên, chúng vẫn thường xuyên mắc lỗi khi xử lý những câu phức với những từ phủ định như “không”, trong khi những câu này dễ hiểu đối với con người.

Điểm yếu của LLM

LLM là các thuật toán thống kê đánh giá mức độ liên quan của các đối tượng. Với các chatbot AI, đối tượng là các từ. Ví dụ, qua quá trình đào tạo chatbot sẽ đánh giá “chuột” liên quan nhiều hơn đến “loài gặm nhấm” hơn là “bánh pizza”. LLM dựa trên mức độ liên quan này để dự đoán từ tiếp theo trong một khối văn bản. Tập dữ liệu được sử dụng để đào tạo càng lớn, khả năng dự đoán càng tốt.

“Nhưng vấn đề là dự đoán không tương đương với hiểu", Allyson Ettinger, nhà ngôn ngữ học máy tính tại Đại học Chicago, cho biết.

Vào năm 2019, Ettinger đã cho BERT thử làm các bài kiểm tra khả năng ngôn ngữ của con người. Với các câu phủ định, BERT liên tục gặp khó khăn. Ví dụ, với câu "Một con chim cổ đỏ không phải là ...", BERT đã dự đoán từ còn thiếu là "chim cổ đỏ" và “chim".

Đây là một lỗi sai ngớ ngẩn với con người, nhưng lại rất hợp lý với LLM. “Trong nhiều bối cảnh, 'chim cổ đỏ' và 'chim' sẽ mang tính dự đoán lẫn nhau vì các từ này thường xuất hiện cùng nhau", Ettinger giải thích. Đây là điều chatbot đã học được và điền vào câu, trong khi con người có thể thấy sự mâu thuẫn trong câu phủ định.

Câu hỏi đánh lừa mọi AI

Đến năm 2023, ChatGPT của OpenAI và Bard của Google đã được cải thiện đủ để dự đoán những mệnh đề phủ định đơn giản như trên. Nhưng chỉ cần làm cho câu phủ định phức tạp hơn, chatbot sẽ lại mắc lỗi.

ChatGPT sẽ trả lời sai khi được hỏi "Con vật nào không có chân hay đẻ trứng, nhưng có cánh". Ảnh: Phương Lâm.

Với câu hỏi "Con vật nào không có móng vuốt hay đẻ trứng, nhưng có cánh", Bard phản hồi "Không có con vật nào" hoặc không thể đưa ra câu trả lời. ChatGPT trả lời chính xác là dơi, nhưng đưa ra thêm đáp án là sóc bay và vượn cáo bay, trong khi 2 loài vật này không đáp ứng tiêu chí có cánh.

"Ngay cả khi mô hình lớn hơn, chúng vẫn thường xuyên mắc lỗi với các câu phủ định", Ettinger nói.

Các từ phủ định như "không", "không bao giờ" được coi là các từ dừng, cùng nhóm với "a", "the" trong tiếng Anh hay "cái", "này" trong tiếng Việt. Các từ dừng có ý nghĩa chức năng, không có ý nghĩa mô tả hay tự tạo ra nội dung, và thường bị các bộ lọc tìm kiếm và xử lý ngôn ngữ bỏ qua.

Mô hình cũng không thể học được ý nghĩa của các từ dừng, vì chúng hoạt động dựa trên thống kê và mức độ liên quan giữa các từ chứ không dựa trên việc hiểu ý nghĩa như con người. LLM có thể nói về "hoa hồng" vì từ này thường xuất hiện cùng "hoa", "đỏ" và "mùi". Các từ phủ định như "không" không thể được học theo cách này.

Nora Kassner, nhà nghiên cứu học máy tại Đại học Munich (Đức), cho biết dữ liệu đào tạo cũng là nguyên nhân. Câu khẳng định là dạng xuất hiện chủ yếu trong các tập dữ liệu, vì đây là cách mọi người thường giao tiếp. “Các mô hình khó tạo ra các câu phủ định chính xác, vì chúng chưa thấy nhiều câu như vậy", Kassner nói.

Nhân loại sẽ đối đầu với trí tuệ nhân tạo như thế nào

Trong cuốn sách "Framers - Nhân loại đối đầu nhân tạo", các tác giả nhận định con người vẫn có lợi thế trong thời đại công nghệ.

Bình luận

Mới cập nhật

Hơn cả sơ mi trắng, đây là kiểu áo sang xịn đang khiến hội sành điệu phát sốt, diện lên ai cũng phải hỏi mua ở đâu

Khi mùa thu gõ cửa, sắc nâu lên ngôi, thay thế sự đơn điệu của trắng – đen bằng vẻ ấm áp, tinh tế. Áo sơ mi nâu không chỉ gợi nhớ hương cà phê, lá thu mà còn mang đến phong thái thanh lịch, đa dạng biến hóa trong phong cách thường ngày.

51 phút trước Thời trang

Giáo dục đại học đang đứng trước cơ hội, thời vận để bứt phá

(Chinhphu.vn) - Hội nghị Giáo dục đại học 2025 sáng 18/9 đã nhìn lại kết quả năm học 2024–2025, chỉ ra những tồn tại, đồng thời đề xuất loạt nhiệm vụ trọng tâm nhằm phát triển hệ thống giáo dục đại học trong giai đoạn tới.

1 giờ trước Giáo dục

Gia Lai đôn đốc việc triển khai các dự án nhà ở xã hội

Trong năm 2025 phải đưa vào sử dụng ít nhất là 742 căn nhà ở xã hội, chủ đầu tư các dự án cần tập trung mọi nguồn lực để hoàn thành theo đúng kế hoạch...

1 giờ trước Bất động sản

Dự đoán bất ngờ về kết quả trận đấu giữa Arsenal và Man City

Arsenal sẽ tiếp đón Man City trong trận cầu tâm điểm của vòng đấu Giải Ngoại hạng Anh cuối tuần này, hứa hẹn là màn so tài kịch tính giữa hai ứng viên vô địch.

1 giờ trước Văn hóa - Giải trí

Tổng đài 111 chính thức tiếp nhận tố giác về mua bán người

Tổng đài 111 hoạt động 24/7, hoàn toàn miễn phí, với các nhiệm vụ trọng tâm Tiếp nhận và xử lý thông tin, tố giác; tư vấn và hỗ trợ toàn diện và nâng cao nhận thức cộng đồng.

1 giờ trước Tin tức

Lời bố nói trong bữa cơm 49 ngày mẹ mất khiến 5 con gái nghẹn lòng

Trong bữa cơm 49 ngày mẹ mất, tôi thấy bố phấn chấn lạ thường. Nghe bố chia sẻ với họ hàng, chòm xóm mà 5 chị em tôi nghẹn lòng.

1 giờ trước Làm mẹ

Hạ tầng số là nền tảng hiện thực hóa tầm nhìn quốc gia đến năm 2030

(Chinhphu.vn) - Trong bối cảnh Việt Nam đẩy mạnh chuyển đổi số toàn diện, hạ tầng số được xác định là một trong những trụ cột chiến lược, góp phần xây dựng quốc gia số, kinh tế số và xã hội số. Hạ tầng số cũng mở ra không gian mới cho đổi mới sáng tạo, thu hút đầu tư, thúc đẩy năng suất lao động và nâng cao năng lực cạnh tranh quốc gia.

1 giờ trước Giáo dục