ニュース一覧スクレイピングツール browse.sh:AIエージェント向けに500以上の主要サイトの完全操作スキルパックを提供
動區 BlockTempo2026-05-20 07:46:17

スクレイピングツール browse.sh:AIエージェント向けに500以上の主要サイトの完全操作スキルパックを提供

ORIGINAL爬蟲神器 browse.sh:提供 AI 代理超 500+ 常用網站完整操作技能包 Skill
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯5318 文字
AI ブラウザインフラ企業 Browserbase は、AI エージェント専用のブラウザコマンドラインツール(CLI)である browse.sh を正式にリリースしました。これには 500 以上の事前定義された「Web 操作スキル」が付属しています。 (前回の要約:Claude Code 究極チートシート:ショートカット、Slash コマンド、スキル、Agents エージェント、MCP 完全操作テクニック) (背景補足:Y Combinator 創業ガイドの解読:AI Agent の将来的な発展トレンドとは?) 今月、browse.sh というツールが正式に公開されました。これは、AI エージェントがより速く、より正確に「Web 上でタスクをこなす」にはどうすればよいかという課題を解決するものです。 これまでの回答は、Web ページの HTML ソースコード全体を言語モデルに渡し、どこをクリックし、どのフィールドに入力すべきかを判断させるというものでした。この方法は遅いだけでなく、非常にコストがかかります。少し複雑な EC サイトであれば、HTML だけで数万文字に達することもあり、すべてを言語モデルに投入すると token の費用負担が小さくありません。 Browserbase が提示する回答は、各サイトの操作ロジックをあらかじめ「スキルパッケージ(skill)」として記述しておくことです。エージェントはスキルを呼び出すだけでよく、毎回 HTML 全体を読み込む必要はありません。browse.sh はこの考え方のコマンドライン入口であり、オープンなスキルカタログ(open web skill catalog)でもあります。 browse.sh の公式定義は「Browser CLI and open web skill catalog for agents」です。平たく言えば、AI エージェント用のブラウザコマンドラインツールであり、オープンな Web 操作スキルストアです。 ここには、明確にしておくべき 2 つのコアコンセプトがあります。 CLI(コマンドラインインターフェース)とは何か?ターミナルウィンドウで文字を入力して実行するツールのことです。npm、git、python はすべて CLI ツールです。browse も同様で、インストール後はターミナルで browse click "input#search" と入力するだけで、ブラウザに特定の要素をクリックさせることができます。 headless browser(ヘッドレスブラウザ)とは何か?画面上にウィンドウを実際に開かないブラウザプログラムですが、動作は本物の Chrome と全く同じです。JavaScript の実行、Cookie の処理、基本的なアンチボット検知の回避が可能です。AI agent はこれを通じて Web ページを「見」たり、フォームに入力したり、ボタンをクリックしたりします。ユーザーは何も開く必要がありません。 skill(スキル)とは何か?あらかじめ記述された操作スクリプトであり、エージェントに対して「このサイトの検索バーはどこにあるか、注文ボタンの ID は何か、API が返す JSON 形式はどうなっているか」を教えるものです。エージェントが毎回手探りで操作するのに比べ、skill を使うことでプロセス全体が高速化し、token も節約できます。 browse.sh の基盤は、Browserbase が自社でオープンソース化した Stagehand です。これは Browserbase が開発した「AI にブラウザを操作させる」ためのオープンソースツールキットで、Playwright に AI の意味理解層を加えたものと考えると分かりやすいでしょう。browse.sh は Stagehand の機能をより使いやすいコマンドラインツールとしてパッケージ化し、そこに 500 以上の既製スキルを追加したものです。 エコシステムへの入り口は 3 つあります。 - https://browse.sh/:公式サイトおよびスキルカタログの閲覧入口 - https://browse.sh/llms.txt:AI agent が読み込むための簡潔なスキルインデックス(軽量で、言語モデルへの直接入力に適している) - https://browse.sh/llms-full.txt:完全な SKILL.md 説明書。各スキルの DOM セレクタと使用方法を含む この設計自体が非常に興味深いものです。browse.sh はユーザーが人間ではなく AI であることを理解しているため、インデックス形式は最初から言語モデルのために設計されています。 インストールは一行で完了します。 $ npm install -g browse インストール後、基本的な操作コマンドはブラウザセッションのライフサイクル全体をカバーしています。 $ browse click "input#search" $ browse type "Apartments in SF" $ browse press "Enter" $ browse screenshot $ browse network --tail $ browse console --tail ここで言う DOM セレクタ(DOM selector)とは何か?DOM は Web ページの構造ツリーであり、すべてのボタン、入力ボックス、リンクはツリー上のノードです。DOM セレクタは、ブラウザに対して「どのノードを操作するか」という正確な住所を伝えるものです。例えば input#search は「ID が search である入力ボックス」、button.submit-btn は「
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合0 件
類似イベントが見つかりません(より多くのデータサンプルまたは embedding 検索が必要です。現在は MVP キーワード照合を使用しています)
原始情報
ID:a710da4229
ソース:動區 BlockTempo
公開:2026-05-20 07:46:17
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント