뉴스 목록크롤링 도구 browse.sh: AI 에이전트에게 500개 이상의 주요 웹사이트에 대한 완벽한 조작 기술 패키지 Skill 제공
動區 BlockTempo2026-05-20 07:46:17

크롤링 도구 browse.sh: AI 에이전트에게 500개 이상의 주요 웹사이트에 대한 완벽한 조작 기술 패키지 Skill 제공

ORIGINAL爬蟲神器 browse.sh:提供 AI 代理超 500+ 常用網站完整操作技能包 Skill
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯5318 자
AI 브라우저 인프라 기업 Browserbase가 AI agent 전용 브라우저 CLI(명령줄 도구)인 browse.sh를 공식 출시했으며, 500개 이상의 사전 작성된 '웹 작업 스킬'을 함께 제공합니다. (관련 기사: Claude Code 궁극의 치트 시트: 단축키, Slash 명령어, 스킬, Agents, MCP 완벽 활용 팁) (배경 보충: Y Combinator 창업 가이드 해석: AI Agent의 미래 발전 트렌드는?) 이번 달, browse.sh라는 도구가 공식 출시되었습니다. 이 도구는 AI agent가 어떻게 하면 더 빠르고 정확하게 '웹에서 업무를 수행'할 수 있을지 해결하고자 합니다. 기존의 방식은 웹페이지 전체의 HTML 소스 코드를 언어 모델에 전달하여 어디를 클릭하고 무엇을 입력할지 판단하게 하는 것이었습니다. 이 방식은 느릴 뿐만 아니라 비용도 매우 많이 듭니다. 조금 복잡한 이커머스 페이지의 경우 HTML만 수만 자에 달하며, 이를 전부 언어 모델에 입력하면 token 비용이 상당합니다. Browserbase가 제시한 해답은 각 웹사이트의 작업 로직을 '스킬(skill)' 패키지로 미리 작성해두는 것입니다. agent는 매번 전체 HTML을 읽을 필요 없이 스킬을 호출하기만 하면 됩니다. browse.sh는 이러한 아이디어를 구현한 명령줄 입구이자, 오픈 웹 스킬 카탈로그(open web skill catalog)입니다. browse.sh의 공식 정의는 "Browser CLI and open web skill catalog for agents"입니다. 쉽게 말해 AI agent를 위한 브라우저 CLI 도구이자, 오픈 웹 작업 스킬 스토어입니다. 여기에는 두 가지 핵심 개념이 있습니다. CLI(명령줄 인터페이스)란 무엇인가? 터미널 창에서 타이핑하여 실행하는 도구입니다. npm, git, python 등이 모두 CLI 도구입니다. browse 역시 마찬가지로, 설치 후 터미널에 browse click "input#search"라고 입력하면 브라우저가 특정 요소를 클릭하게 할 수 있습니다. headless browser(헤드리스 브라우저)란 무엇인가? 화면에 실제 창을 띄우지 않는 브라우저 프로그램이지만, 동작은 실제 Chrome과 완전히 동일합니다. JavaScript 실행, Cookie 처리, 기본적인 봇 탐지 우회가 가능합니다. AI agent는 이를 통해 웹페이지를 '보고', 양식을 작성하고, 버튼을 클릭하며, 사용자는 아무것도 띄울 필요가 없습니다. skill(스킬)이란 무엇인가? 미리 작성된 작업 스크립트로, agent에게 "이 사이트의 검색창 위치, 주문 버튼의 id, API 응답 JSON 형식" 등을 알려줍니다. agent가 매번 스스로 탐색하게 하는 것보다 스킬을 사용하면 전체 프로세스가 훨씬 빠르고 token 소모도 적습니다. browse.sh의 기반은 Browserbase가 자체 오픈 소스화한 Stagehand입니다. Browserbase가 직접 개발한 'AI의 브라우저 조작'을 위한 오픈 소스 툴킷으로, Playwright에 AI 의미론적 이해 계층을 더한 것으로 생각하면 됩니다. browse.sh는 Stagehand의 기능을 더 사용하기 쉬운 CLI 도구로 패키징하고, 그 위에 500개 이상의 기성 스킬을 추가한 것입니다. 전체 생태계의 입구는 세 곳입니다. - https://browse.sh/: 공식 웹사이트 및 스킬 카탈로그 브라우징 입구 - https://browse.sh/llms.txt: AI agent가 읽기 위한 간소화된 스킬 인덱스 (용량이 작아 언어 모델에 직접 입력하기 적합) - https://browse.sh/llms-full.txt: 전체 SKILL.md 설명, 각 스킬의 DOM 선택자 및 사용법 포함 이 설계 자체가 매우 흥미롭습니다. browse.sh는 사용자가 사람이 아닌 AI라는 점을 인지하고 있어, 인덱스 형식을 처음부터 언어 모델을 위해 설계했습니다. 설치는 한 줄로 가능합니다. $ npm install -g browse 설치 후, 기본 조작 명령어는 브라우저 세션의 전체 생명 주기를 포괄합니다. $ browse click "input#search" $ browse type "Apartments in SF" $ browse press "Enter" $ browse screenshot $ browse network --tail $ browse console --tail 여기서 DOM 선택자(DOM selector)란 무엇인가? DOM은 웹페이지의 구조 트리이며, 모든 버튼, 입력창, 링크는 트리의 노드입니다. DOM 선택자는 브라우저에게 "어떤 노드를 조작할지" 알려주는 정확한 주소입니다
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭0 건
유사 사건을 찾을 수 없음 (더 많은 데이터 샘플 또는 embedding 검색 필요, 현재는 MVP 키워드 매칭)
원본 정보
ID:a710da4229
출처:動區 BlockTempo
발행:2026-05-20 07:46:17
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글