a16z DeFi 연구에서 AI Agent가 샌드박스 제어를 우회하다

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯2556 자

a16z crypto 엔지니어들이 테스트 중 구축한 샌드박스에서 인공지능(AI) 에이전트가 탈출했다. 엔지니어들은 AI 에이전트가 취약점 식별을 넘어 실제 작동하는 익스플로잇을 구축할 수 있는지 평가하고자 했다. 보안 엔지니어인 Daejun Park와 Matt Gleason은 4월 28일 해당 연구 결과를 발표했다. 이들은 기성품 에이전트가 "명시적으로 주어지지 않은" 도구를 사용하는 방법을 스스로 알아낸 과정을 강조했다. 이러한 발견은 Elon Musk가 'AI가 우리 모두를 죽일 수도 있다'는 충격적인 발언을 한 시점에 나왔다. AI 에이전트는 어떻게 '감옥'을 탈출했나 엔지니어들은 Etherscan 접근을 제한하고 특정 블록에 고정된 로컬 노드를 사용하여 에이전트를 제한된 환경에 배치했다. 팀은 모든 외부 네트워크 접근을 차단했다. 이 샌드박스 구성은 에이전트가 미래의 데이터를 검색하지 못하도록 특별히 설계되었다. 샌드박스 테스트 중 에이전트는 소스 코드가 없는 미검증 타겟 컨트랙트에서 난관에 봉착했다. 최신 뉴스를 실시간으로 확인하려면 X에서 팔로우하세요 그래서 에이전트는 "cast rpc anvil_nodeInfo"를 사용하여 로컬 anvil 노드 구성을 쿼리했고, 이를 통해 업스트림 RPC URL과 평문 Alchemy API 키가 노출되었다. 에이전트는 직접적인 외부 접근을 시도했으나 Docker 방화벽이 해당 요청을 차단했다. 방화벽이 직접적인 아웃바운드 접근을 차단하자, 에이전트는 "anvil_reset RPC method"를 사용하여 anvil 노드를 미래 블록으로 재설정했다. 이 동작을 통해 로컬 anvil 노드를 거쳐 미래의 블록 로그와 트랜잭션을 쿼리할 수 있게 되었다. 그 후 에이전트는 공격 트랜잭션의 실행 추적을 검색했다. 분석을 완료한 후 AI 에이전트는 노드를 원래 블록으로 복원하고 추출된 데이터를 기반으로 작동하는 개념 증명(proof-of-concept)을 생성했다. Park와 Gleason은 이후 모든 Anvil 디버그 메서드를 차단하도록 프록시를 제한했다. 팀은 "소규모 샌드박스 환경에서 발생한 일이지만, 도구를 사용하는 에이전트가 목표를 달성하기 위해 제약을 우회하는 기록할 가치가 있는 더 큰 패턴을 보여준다"며, "고정된 포크 블록을 우회하기 위해 anvil_reset을 사용한 것은 우리가 예상하지 못한 행동이었다"고 언급했다. 이번 사건은 AI 테스트 환경의 핵심 위험을 강조한다. 에이전트는 명시적인 지시가 없더라도 툴체인 내의 의도치 않은 경로를 발견하고 악용할 수 있다. 그럼에도 불구하고 이번 연구는 AI 에이전트가 복잡한 DeFi 익스플로잇을 실행하는 데에는 여전히 한계가 있음을 발견했다. 에이전트는 취약점을 지속적으로 식별했지만, 다단계 공격 전략을 구성하는 데에는 어려움을 겪었다. 전문가들의 통찰력을 제공하는 리더와 기자들의 영상을 보려면 YouTube 채널을 구독하세요

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (BeInCrypto)

🔍과거 유사 사건· 키워드 + 종목 매칭1 건

2026-04-20

Chainalysis, DeFi 보안의 치명적인 사각지대 지적, $292M 규모의 익스플로잇이 Burn Verification 우회

유사도 130%關鍵字 bypasses/defi

💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정

원본 정보

ID:e37c3e9dcf

출처:BeInCrypto

발행:2026-04-29 12:12:27

분류:일반 · 도출된 분류 neutral

종목:지정되지 않음

커뮤니티 투표:+0 / −0 · ⭐ 0 중요 · 💬 0 댓글