OpenAI vừa có bước tiến mới trong cuộc đua AI với ChatGPT Agent. Công cụ này không chỉ trò chuyện mà còn tự mình hoàn tất những công việc phức tạp như một trợ lý số toàn năng. Với khả năng sử dụng máy tính ảo, công cụ mới này được thiết kế để thay bạn làm những việc nhiều bước như lên kế hoạch, phân tích dữ liệu hay đặt lịch hẹn.
Trong buổi giới thiệu, OpenAI tiết lộ Agent được huấn luyện bằng một mô hình hoàn toàn mới, kết hợp tinh hoa từ hai công cụ trước đó là Operator và Deep Research.
ChatGPT Agent có thể làm được những gì? Rất nhiều. Từ việc truy cập Google Calendar để kiểm tra thời gian rảnh của bạn, tra nhà hàng trên OpenTable để lên kế hoạch hẹn hò, cho đến tự tạo slide thuyết trình dựa trên phân tích đối thủ cạnh tranh. Bạn có thể chen ngang bất kỳ lúc nào để thay đổi tiêu chí tìm kiếm, giống như đang cộng tác với một trợ lý con người thực thụ.
Một ví dụ đời thường đến từ chính đội ngũ phát triển: mỗi tuần, một nhân viên đã để Agent tự động gửi yêu cầu đặt chỗ đậu xe tại văn phòng OpenAI ở San Francisco. Anh không cần nhớ hay thao tác gì thêm, đúng thứ 5 hàng tuần, yêu cầu được gửi đi.

ChatGPT Agent có thể truy cập và gửi email thay cho người dùng. Ảnh: OpenAI
Sức mạnh của ChatGPT Agent nằm ở khả năng truy cập "một chiếc máy tính đầy đủ", chứ không chỉ dừng ở trình duyệt web như trước đây. Nhờ đó, nó có thể sử dụng trình duyệt văn bản, trình duyệt hình ảnh và cả terminal, giúp xử lý các yêu cầu phức tạp hơn.
Dù vậy, tốc độ xử lý vẫn là điều khiến người dùng phải kiên nhẫn. Fulford cho biết họ ưu tiên tối ưu cho các tác vụ nặng, hơn là phản hồi tức thì. “Ngay cả khi mất 15 hay 30 phút thì cũng vẫn nhanh hơn nhiều so với việc bạn tự làm,” cô nói. Quan trọng là, bạn có thể giao việc rồi quay lại sau, như cách làm việc với một cộng sự thầm lặng.
ChatGPT Agent cũng được thiết kế với các lớp bảo vệ chặt chẽ. Trước khi gửi email hay đặt chỗ, nó sẽ yêu cầu xác nhận. Với các trang tài chính, chế độ Watch Mode sẽ được kích hoạt, đảm bảo người dùng không can thiệp vào tab Agent đang hoạt động. Những tác vụ liên quan đến tài chính hiện vẫn bị giới hạn.

Với một số tác vụ, người dùng vẫn phải tự điền thông tin cho ChatGPT. Ảnh: OpenAI
Về mặt an toàn, OpenAI đã bật các biện pháp phòng ngừa dù chưa có bằng chứng rằng mô hình có thể bị lợi dụng để tạo vũ khí. Điều này tương tự như bước đi của Anthropic khi ra mắt Claude Opus 4 hồi tháng 5.
Từ hôm nay, người dùng ChatGPT gói Pro, Plus và Team có thể kích hoạt Agent bằng lệnh “/agent” hoặc chọn trong menu. Bản cho doanh nghiệp và giáo dục sẽ ra mắt vào cuối mùa hè, còn người dùng châu Âu sẽ phải chờ thêm.

Người dùng ChatGPT Pro, Plus và Team có thể sử dụng ChatGPT Agent bắt đầu từ hôm nay. Ảnh: OpenAI
Khái niệm “AI agent” từng là giấc mơ viễn tưởng như trong phim Iron Man, nhưng giờ đang dần trở thành thực tế. Hồi đầu năm 2024, Klarna từng gây chấn động khi tiết lộ AI agent của họ xử lý được hai phần ba số lượng hội thoại chăm sóc khách hàng chỉ trong một tháng, tương đương 700 nhân viên.
Từ đó, Amazon, Google, Meta… đều liên tục nhắc đến “agent” trong các cuộc họp cổ đông. Google thậm chí tuyển nguyên CEO và đội ngũ của Windsurf về để tăng tốc dự án này. OpenAI thì ra mắt Operator vào tháng 1, và giờ là Agent, bước đi mới nhất trong cuộc đua AI đầy gay cấn.
Tất cả đều chung mục tiêu: tạo ra một trợ lý AI không chỉ giúp đỡ mà còn làm việc thay bạn, để rồi một ngày không xa, bạn có thể yên tâm “đặt lịch”, “đặt hàng” hay “lên kế hoạch chiến lược” chỉ bằng một câu lệnh.