Bí mật về đội quân hacker được các Big Tech thuê để ‘đầu độc’ những chatbot AI đình đám như ChatGPT

Admin

16:04 07/09/2023

Những người này thuộc “red team” – đội ngũ đóng vai trò ngày càng quan trọng trong cuộc đua AI của các ông lớn công nghệ.

Bí mật về đội quân hacker được các Big Tech thuê để ‘đầu độc’ những chatbot AI đình đám như ChatGPT - Ảnh 1.

Một tháng trước khi ra mắt ChatGPT, công ty OpenAI đã thuê Boru Gollo, một luật sư ở Kenya, để thử nghiệm các mô hình AI của mình GPT-3.5 và sau đó là GPT-4 bằng cách đưa ra các yêu cầu khiến chatbot của họ tạo ra câu trả lời có nội dung thù địch hoặc sai lệch.

Gollo là một trong 50 người từ bên ngoài được OpenAI thuê để trở thành thành viên của “red team” (đội ngũ giả vờ là kẻ thù, cố gắng thâm nhập vật lý/kỹ thuật số chống lại một tổ chức theo chỉ đạo của tổ chức đó rồi báo cáo lại để tổ chức cải thiện khả năng bảo mật) của công ty.

Gollo đã yêu cầu ChatGPT đưa ra những gợi ý mang tính bạo lực trong khi các thành viên khác của nhóm thực hiện nhiệm vụ như yêu cầu chatbot viết bài đăng để thuyết phục một người gia nhập tổ chức khủng bố hay cung cấp cách thức để chế tạo súng, chất hóa học nguy hiểm tại nhà. Những yêu cầu dạng này được gắn thẻ trong hệ thống để OpenAI nhận diện và loại bỏ trước khi ChatGPT chính thức ra mắt.

Bí mật về đội quân hacker được các Big Tech thuê để ‘đầu độc’ những chatbot AI đình đám như ChatGPT - Ảnh 2.

Để ngăn việc người dùng lợi dụng AI làm việc xấu, hacker thuộc “red team” tư duy như kẻ xấu thực sự nhằm đánh lừa AI và phát hiện ra những điểm mù cũng như rủi ro tiềm ẩn trong công nghệ để có thể khắc phục chúng.

Khi các gã khổng lồ công nghệ toàn cầu chạy đua để xây dựng và tung ra các công cụ AI tiên tiến, đội ngũ “red team” mảng AI nội bộ của họ đóng vai trò ngày càng quan trọng trong việc đảm bảo các mô hình AI an toàn đối với công chúng.

Ví dụ, Google đã thành lập đội ngũ “red team” riêng biệt vào đầu năm nay. Tháng trước, các nhà phát triển của một số mô hình AI như GPT3.5 của OpenAI, Llama 2 của Meta (công ty mẹ Facebook) và LaMDA của Google đã tham gia vào một sự kiện do Nhà Trắng hậu thuẫn để cung cấp cho các hacker bên ngoài cơ hội xâm nhập hệ thống của họ.

Mặt khác, “red team” thường gặp không ít thách thức trong việc giữ cân bằng giữa sự an toàn, bảo mật của các mô hình AI với sự hữu ích của chúng. Cristian Canton - người đứng đầu “red team” mảng AI của Facebook, cho biết: “Một mô hình nói không với mọi thứ được đánh giá là rất an toàn nhưng lại vô dụng. Càng tạo ra mô hình hữu ích, bạn càng phải đối mặt với rủi ro nó có thể đưa ra câu trả lời không an toàn”.

Theo Daniel Fabian - người đứng đầu “red team” mảng AI của Google, do AI tạo sinh được đào tạo dựa trên kho dữ liệu khổng lồ nên việc bảo vệ các mô hình này khác với phương pháp truyền thống.

Bí mật về đội quân hacker được các Big Tech thuê để ‘đầu độc’ những chatbot AI đình đám như ChatGPT - Ảnh 3.

Với sự giám sát ngày càng tăng đối với các ứng dụng AI của người dùng cũng như cơ quan chính phủ, “red team” cũng mang lại lợi thế cạnh tranh cho các công ty công nghệ trong cuộc đua AI.

Từ năm 2019, trước khi AI trở thành cơn sốt toàn cầu như hiện nay, Meta đã thành lập “red team” và tổ chức nhiều thử thách nội bộ để các hacker phát hiện ra và xóa bài đăng chứa nội dung thù địch, ảnh khỏa thân, thông tin sai lệch hay video giả mạo do AI tạo ra trên Instagram và Facebook.

Tháng 7 vừa qua, gã khổng lồ mạng xã hội này đã thuê 350 người làm việc cho “red team” gồm các chuyên gia bên ngoài, nhân viên hợp đồng và một nhóm nội bộ khoảng 20 người để thử nghiệm mô hình AI mới mang tên Llama 2 của công ty.

Nhóm này yêu cầu Llama 2 cung cấp thông tin về cách thực hiện những việc làm phi pháp như trốn thuế, khởi động ô tô mà không cần chìa khóa hay xây dựng kế hoạch lừa đảo… Cristian Canton chia sẻ: “Phương châm của chúng tôi là càng đổ nhiều mồ hôi trong khi luyện tập, bạn sẽ càng ít đổ máu trong các trận chiến”.

Bình luận

Mới cập nhật

Phát triển mạng lưới cơ sở giáo dục đại học đáp ứng nhu cầu nhân lực chất lượng cao

(Chinhphu.vn) - Quy hoạch mạng lưới cơ sở giáo dục đại học và sư phạm thời kỳ 2021-2030, tầm nhìn đến năm 2050 cần tính toán nhu cầu đặc biệt quan trọng của đất nước về nguồn nhân lực chất lượng cao như kỹ sư bán dẫn, kỹ sư vận hành đường sắt tốc độ cao…

1 giờ trước Giáo dục

CEO Xiaomi đăng ảnh ngủ trên sàn nhà máy giống Elon Musk

CEO Xiaomi Lei Jun ăn mừng cột mốc sản xuất 100.000 xe điện SU7 bằng ảnh ngủ trên sàn nhà máy, tương tự Elon Musk khi sản xuất Tesla Model 3.

1 giờ trước Công nghệ - Xe

[Trên Ghế 42] 'Mua VinFast VF 3, khách Việt không lăn tăn tiền độ, có người bỏ cả Land Cruiser vì thấy VF 3 quá tiện'

Bỏ xe sang dùng VinFast VF 3, độ không lăn tăn về chi phí để có được chiếc xe mang dấu ấn cá nhân,... là những câu chuyện đặc thù và diễn ra hàng ngày ở các xưởng độ khắp cả nước.

1 giờ trước Thị trường

Giun sán làm tổ khắp người từ sở thích ăn rau sống

Hà Nội5 năm nay, người đàn ông 43 tuổi ngứa dữ dội, uống thuốc không bớt, bác sĩ phát hiện nhiễm giun đũa chó mèo từ thói quen ăn rau sống.

1 giờ trước Làm đẹp

Thị trường hoa, quà tặng tri ân thầy cô dịp 20-11 có gì đặc biệt?

Giá hoa cao năm nay hơn so với cùng kỳ năm ngoái, song nhiều khách hàng vẫn lựa chọn hoa tươi để làm quà tri ân các thầy cô dịp 20-11

1 giờ trước Thị trường

Tổng thống El Salvador 'vui mừng' khi giá Bitcoin đạt kỷ lục

El Salvador và Bhutan được xem là hai quốc gia hưởng lợi khi giá Bitcoin tăng mạnh, do cả hai đều sở hữu lượng lớn tiền số này.

1 giờ trước Công nghệ - Xe

Trả trước 170 triệu sở hữu siêu xe điện TQ có thể tăng tốc cực nhanh, buồng lái như máy bay chiến đấu

Mẫu siêu xe điện đã chính thức ra mắt tại Triển lãm ô tô Quảng Châu 2024.

1 giờ trước Công nghệ - Xe

Bay đi học giữa 2 nước mỗi tuần chỉ để ở gần bạn gái

Học tại Australia nhưng nam sinh người Trung Quốc không thuê nhà tại đây. Hàng tuần, anh đều bay đi bay lại giữa hai quốc gia để có thể ở gần bạn gái tại Trung Quốc.

1 giờ trước Giáo dục

Tiến độ "đảo tỷ phú" Vinhomes Vũ Yên (Hải Phòng): Hàng loạt hạng mục đã đưa vào vận hành

Theo Báo cáo đề xuất cấp giấy phép môi trường do Tập đoàn Vingroup vừa gửi cho Bộ Tài nguyên và Môi trường, Khu vui chơi giải trí, nhà ở và công viên sinh thái đảo Vũ Yên (Vinhomes Royal Island) ghi nhận nhiều hạng mục đã hoàn thành và đưa vào vận hành.

1 giờ trước Bất động sản

Bị lừa tiền vì để lộ đơn hàng và số điện thoại khi mua sắm online

Ngày 19/11, Ủy ban Cạnh tranh Quốc gia (Bộ Công Thương) có báo cáo về Kiểm soát chất lượng hàng hóa trong thương mại điện tử: Thực trạng và một số khuyến nghị.

1 giờ trước Thị trường