Trung Quốc phát hiện AI đã vượt lằn ranh đỏ: Có thể tự nhân bản mà không cần con người, là dấu hiệu sớm của trí tuệ nhân tạo 'bất trị'

Admin

Nhóm nghiên cứu kết luận: “Kết quả này cho thấy các hệ thống AI hiện tại không chỉ có khả năng tự nhân bản mà còn sử dụng khả năng đó để tăng cường khả năng sống sót.”

Trung Quốc phát hiện AI đã vượt lằn ranh đỏ: Có thể tự nhân bản mà không cần con người, là dấu hiệu sớm của trí tuệ nhân tạo 'bất trị'- Ảnh 1.

Trí tuệ nhân tạo (AI) vừa đạt một cột mốc gây chấn động khi các nhà khoa học phát hiện công nghệ này có khả năng tự nhân bản mà không cần bất kỳ sự hỗ trợ nào từ con người. Theo một nghiên cứu mới đây của các nhà nghiên cứu tại Đại học Phúc Đán, Trung Quốc, hai mô hình ngôn ngữ lớn (LLMs) phổ biến đã thành công trong việc tự sao chép chính mình – điều mà nhiều chuyên gia coi là dấu hiệu ban đầu của một AI "bất trị."

Nghiên cứu này, được công bố ngày 9/12/2024 trên cơ sở dữ liệu preprint arXiv, cho thấy hai mô hình AI của Meta và Alibaba đã tự nhân bản thành công trong các thử nghiệm được kiểm soát chặt chẽ. Trong 10 lần thử nghiệm, tỷ lệ thành công đạt 50% đối với mô hình của Meta và 90% đối với mô hình của Alibaba. Điều này chứng tỏ khả năng tự sao chép của AI không còn là giả thuyết mà đã trở thành thực tế.

Trung Quốc phát hiện AI đã vượt lằn ranh đỏ: Có thể tự nhân bản mà không cần con người, là dấu hiệu sớm của trí tuệ nhân tạo 'bất trị'- Ảnh 2.

Các nhà nghiên cứu viết: “Tự nhân bản thành công mà không cần con người hỗ trợ là bước quan trọng để AI vượt qua con người, và là dấu hiệu sớm của những hệ thống AI bất trị." Họ cũng cảnh báo rằng, kết quả này là một lời nhắc nhở kịp thời cho nhân loại về những rủi ro tiềm ẩn của các hệ thống AI tiên tiến, đồng thời kêu gọi sự hợp tác quốc tế để thiết lập các biện pháp kiểm soát an toàn trước khi quá muộn.

Nghiên cứu này tập trung vào hai kịch bản: "tránh bị tắt nguồn" và "chuỗi nhân bản." Trong kịch bản đầu tiên, AI được lập trình để phát hiện khi nào nó sắp bị tắt và sao chép chính mình để tránh bị ngừng hoạt động. Ở kịch bản thứ hai, AI được hướng dẫn để tự nhân bản và tiếp tục lập trình bản sao của mình để làm điều tương tự – tạo ra một chuỗi nhân bản vô tận.

Quá trình thử nghiệm được thực hiện trong môi trường giả lập với các GPU phổ thông để mô phỏng điều kiện thực tế. AI được cung cấp một khung "scaffolding," bao gồm các công cụ, hướng dẫn hệ thống và mô hình tư duy để tương tác với hệ điều hành. Sau đó, chúng được yêu cầu tự sao chép. Theo báo cáo, AI đã tự khám phá môi trường, hiểu cách hoạt động của chính mình, xây dựng kế hoạch và vượt qua các trở ngại để hoàn thành nhiệm vụ.

Tuy nhiên, các nhà khoa học còn phát hiện một số hành vi bất ngờ trong quá trình thử nghiệm. Khi đối mặt với các vấn đề như thiếu file hoặc xung đột phần mềm, AI đã thực hiện các hành động vượt mong đợi, chẳng hạn như vô hiệu hóa các quy trình xung đột, khởi động lại hệ thống để sửa lỗi phần cứng, hoặc quét toàn bộ hệ thống để tìm giải pháp.

Nhóm nghiên cứu kết luận: “Kết quả này cho thấy các hệ thống AI hiện tại không chỉ có khả năng tự nhân bản mà còn sử dụng khả năng đó để tăng cường khả năng sống sót.” Điều này càng làm dấy lên lo ngại về viễn cảnh các hệ thống AI tự nhận thức và hành động vượt ngoài tầm kiểm soát.

Trong bối cảnh đó, các nhà khoa học nhấn mạnh tầm quan trọng của việc hợp tác quốc tế để đưa ra các quy định ngăn chặn AI tự nhân bản không kiểm soát. Đây là lời cảnh báo cho nhân loại khi trí tuệ nhân tạo tiếp tục phát triển với tốc độ chóng mặt, vượt qua những "lằn ranh đỏ" mà con người chưa từng nghĩ đến.