Danh sách tinCác nhà nghiên cứu của Google, Meta cùng lên tiếng: An toàn của AI Agent không phải vấn đề của mô hình, mà là vấn đề của hệ thống
動區 BlockTempo2026-05-26 09:48:40

Các nhà nghiên cứu của Google, Meta cùng lên tiếng: An toàn của AI Agent không phải vấn đề của mô hình, mà là vấn đề của hệ thống

ORIGINALGoogle、Meta 研究員聯手喊話:AI Agent 安全不是模型問題,是系統問題
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1831 từ
Các nhà nghiên cứu của Google, Meta cùng các chuyên gia học thuật đã đồng công bố luận văn chỉ ra rằng, biện pháp bảo vệ an toàn cho AI Agent không nên chỉ dựa vào việc nâng cao năng lực mô hình, mà phải xây dựng kiến trúc phòng thủ ở cấp độ hệ thống, xem AI như một "thành phần không đáng tin cậy" để xử lý. (Tóm tắt trước: Chuyên mục SlowMist: Giao tiền cho "tôm hùm" AI Agent có thực sự an toàn? Liên kết báo cáo Bitget tiết lộ năm rủi ro lớn) (Bổ sung bối cảnh: PrimePiper: prime broker giao dịch AI agent, cho phép AI agent giao dịch an toàn trên thị trường giao dịch toàn cầu) 《Agent Security is a Systems Problem》được đồng tác giả bởi các nhà nghiên cứu của Google, Gray Swan AI, EmbraceTheRed và nhiều trường đại học, sau khi phân tích nhiều trường hợp tấn công khác nhau đã đưa ra ba cơ chế then chốt, có thể loại bỏ hiệu quả phần lớn các cuộc tấn công vào AI Agent. Luận văn được sửa đổi và phát hành vào ngày 20 tháng 5 chỉ ra rằng, cách làm chủ đạo hiện nay trong ngành là "làm cho mô hình mạnh hơn" để nâng cao độ bền vững của AI Agent, nhưng phương pháp này tự thân nó là không đủ. Nhóm nghiên cứu cho rằng, an toàn của AI Agent nên mượn các nguyên tắc và kỹ thuật đã được kiểm chứng qua hàng thập kỷ trong lĩnh vực an ninh máy tính. Luận điểm cốt lõi trong luận văn là: "Qua góc nhìn này, mặc dù những nỗ lực nâng cao độ bền vững của mô hình là quan trọng, nhưng không thể giải quyết vấn đề một cách độc lập. Chúng ta phải bổ sung các nỗ lực hiện tại bằng các kỹ thuật từ lĩnh vực an ninh hệ thống." Nhóm nghiên cứu giải thích thêm: "Chúng tôi xem an toàn của Agent như một trường hợp của an ninh máy tính. Lĩnh vực này đã xử lý những kẻ tấn công mạnh mẽ trong thời gian dài, và đã thúc đẩy việc nghiên cứu các nguyên tắc và kỹ thuật để đối phó với những kẻ thù này trong nhiều thập kỷ." Sau khi phân tích nhiều trường hợp tấn công, nhóm nghiên cứu đưa ra ba cơ chế có thể loại bỏ phần lớn các cuộc tấn công: Thứ nhất, AI Agent phải phân biệt rõ ràng giữa "lệnh" và "dữ liệu không đáng tin cậy". Trong nhiều trường hợp, AI Agent xử lý lẫn lộn lệnh và dữ liệu từ cùng một nguồn dữ liệu, dẫn đến việc kẻ tấn công có thể ẩn lệnh độc hại trong dữ liệu, khiến Agent đưa ra phán đoán sai. Thứ hai, AI Agent phải tuân thủ "nguyên tắc đặc quyền tối thiểu". Agent không nên mặc định có quyền truy cập đầy đủ, mà chỉ nên có quyền tối thiểu cần thiết để thực hiện nhiệm vụ. Điều này có nghĩa là khi AI Agent thực hiện giao dịch, kiểm tra số dư hoặc truy vấn thông tin, nó phải sử dụng các cấp độ quyền tương ứng riêng biệt. Thứ ba, hệ thống phải chủ động kiểm soát luồng thông tin nhạy cảm. Không để AI Agent tự quyết định gửi dữ liệu đến đâu, mà do một hệ thống cấp cao hơn thiết lập quy tắc, đảm bảo thông tin nhạy cảm sẽ không bị gửi đến đích không an toàn. Cùng ngày luận văn được công bố, trợ lý giao dịch tiền điện tử AI Bankr đã tuyên bố tạm dừng giao dịch, vì phát hiện ít nhất 14 ví đã bị kẻ tấn công xâm nhập. Các chuyên gia bảo mật suy đoán rằng bot AI này có thể đã bị hacker lợi dụng. Trưởng bộ phận quy kết của Merkle Science, Aaron Ratcliff, năm ngoái đã chỉ ra rằng, từ góc độ bảo mật, việc cho phép AI Agent truy cập ví tương đương với việc thêm một lớp tin cậy vào một hệ thống vốn không có niềm tin trong thiết kế. "Nếu bạn giao ví cho AI, tương đương với việc thêm một lớp tin cậy. Nó chỉ an toàn khi hệ thống được thiết kế đúng." Ratcliff nhấn mạnh, AI Agent phải có các khả năng sau trước khi giao dịch: phát hiện front-running, đặt giới hạn slippage, nhận diện token lừa đảo, kiểm toán smart contract theo thời gian thực, đồng thời cũng phải sandbox các prompt, ngăn chặn injection và chặn truy cập của trung gian. Ứng dụng của AI Agent trong lĩnh vực tiền điện tử đang tăng trưởng nhanh chóng. Đồng sáng lập kiêm CEO Circle, Jeremy Allaire, vào tháng 1 năm nay đã dự đoán rằng trong vòng năm năm sẽ có hàng tỷ AI Agent thay mặt người dùng thực hiện giao dịch và nhiệm vụ. Hiện tại, AI Agent đã được sử dụng để xây dựng ứng dụng Web3, phát hành token, tương tác tự chủ với các dịch vụ và giao thức, một số nền tảng còn bắt đầu khám phá ứng dụng của AI trong lĩnh vực giao dịch. Solana cũng vừa tổ chức một hackathon AI gần đây, thu hút 12 dự án AI Agent mới tham gia. Đồng sáng lập nền tảng blockchain AI-native Sahara AI, Sean Ren, cho rằng giao thức ngữ cảnh mô hình (MCP) nếu được thiết lập đúng cách thì là tiêu chuẩn vàng về an toàn, nhưng người dùng vẫn nên chú ý đến từng hành động mà AI Agent thực hiện. Ren cho biết: "MCP về bản chất đóng vai trò người gác cổng giữa mô hình AI và ví của bạn. Agent chỉ có thể thực hiện các hành động cụ thể đã được phê duyệt, ví dụ như kiểm tra số dư hoặc chuẩn bị thanh toán chờ bạn xác nhận, chứ không thể tự do di chuyển tiền hoặc thay đổi cài đặt ví." Thị trường tiền điện tử Đài Loan đang tích cực đưa công nghệ AI Agent vào, nhiều ví và sàn giao dịch địa phương đã ra mắt tính năng giao dịch hỗ trợ AI ngay từ năm 2025. Khi số lượng AI Agent tăng trưởng theo cấp số nhân, việc xây dựng bảo vệ an toàn ở cấp độ hệ thống sẽ trở thành vấn đề then chốt của cơ sở hạ tầng. Nghiên cứu này nhắc nhở chúng ta rằng, an toàn của AI Agent không phải là "mô hình càng mạnh càng tốt", mà là "kiến trúc hệ thống càng hoàn chỉnh càng an toàn". Trong tương lai khi hàng tỷ AI Agent đồng thời vận hành, thiết kế an toàn ở cấp độ hệ thống sẽ quyết định sự ổn định của thị trường tiền điện tử.
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:a5b61f0188
Nguồn:動區 BlockTempo
Đăng:2026-05-26 09:48:40
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận