ニュース一覧Microsoftの無料AIがWebブラウジングでOpenAIとGoogleを上回った
Decrypt2026-05-22 19:31:03

Microsoftの無料AIがWebブラウジングでOpenAIとGoogleを上回った

ORIGINALMicrosoft's Free AI Just Beat OpenAI and Google at Browsing the Web
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯4896 文字
要約 - Fara1.5-27BはOnline-Mind2Webで72%のスコアを記録し、OpenAI Operator(58.3%)やGemini 2.5 Computer Use(57.3%)を上回りました。 - このモデルはオープンウェイトで、40億、90億、270億のパラメータサイズがあり、Qwen 3.5をファインチューニングして構築されています。 - Fara1.5-9Bは現在Azure AI Foundryで利用可能で、4Bと27Bも間もなくリリースされます。 コンピュータに「バケーション用のレンタル物件を探して、5つのサイトを比較し、予約フォームに記入して、ビーチに最も近いものを確定して」と指示することを想像してみてください。あなたがコーヒーを淹れている間に、戻ってきたときにはすべて完了しています。これが「computer use agents」の約束です。AIがブラウザの画面を読み取り、人間と全く同じようにクリック、スクロール、タイピングを行うもので、特別なプラグインは不要です。 OpenAIは2025年1月に月額200ドルでOperatorをリリースし、その後ChatGPT Agentに統合して8月に終了させました。GoogleにはGemini 2.5 Computer Useがあります。どちらもプロプライエタリ(独自仕様)でクラウドベースであり、運用コストが高額です。 今週、Microsoft ResearchはFara1.5という小型モデルをリリースしました。重要なベンチマークにおいて、このモデルは両者を凌駕しています。 このファミリーは40億、90億、270億パラメータの3サイズ展開で、すべてAlibabaのベースモデルであるQwen3.5を基盤としています。Microsoftはこれをブラウザ作業用にファインチューニングし、すべてのウェイトを公開しました。(パラメータはAIモデルの知識の幅を決定するもので、一般的に多いほど能力が高いことを意味します。) これを実現するには、開発プロセス全体をゼロから考え直す必要がありました。「私たちは『小型モデルをエージェントタスクで真に優れたものにするには何が必要か?』という単純な問いから始めました」とAI Frontiersチームは述べています。「答えはライフサイクル全体に及びました。データ生成、学習目標、モデル設計、オーケストレーションを、個別にではなく統合して再設計しなければなりませんでした。」 ベンチマーク Online-Mind2Webは、Microsoftが卓越を目指したタスクにおいて重要なベンチマークです。これは、AIエージェントが136の一般的なライブウェブサイトで、製品比較、フォーム入力、サービス予約といった300の多様な実世界のタスクをどれだけ正確に完了できるかをテストするもので、実際の変化し続けるインターネット上で正しく完了したタスクの割合としてスコア化されます。 Fara1.5-27Bは72%を記録しました。OpenAI Operatorは58.3%、GoogleのGemini 2.5 Computer Useは57.3%でした。主要なプロプライエタリな代替品であるYutoriのNavigator n1は64.7%に達しました。中型モデルであるFara1.5-9Bでさえ63.4%を記録し、OpenAIとGoogleの両方を上回りました。 オープンソースのライバルも及びませんでした。AlibabaのGUI-Owl-1.5(80億パラメータ)は48.6%、AI2のMolmoWebは35.3%でした。Microsoft自身の以前のモデルであるFara-7Bは34.1%であり、今回のリリースは同等のサイズで前モデルの約2倍の性能を達成しました。 ライブウェブでのタスク成功率を測定するもう一つのベンチマークであるWebVoyagerでも、Fara1.5-27Bは88.6%を記録し、OpenAI Operatorの87.0%を僅差で上回り、H Companyの300億パラメータモデルHolo2の83.0%を打ち負かしました。 学習方法 秘訣は学習パイプラインにあります。MicrosoftはFaraGen1.5というシステムを使用して学習データを生成しました。ここが巧妙な点です。彼らはOpenAIのモデルであるGPT-5.4を「ティーチャーエージェント」として使い、ブラウザタスクの完了方法を実演させました。その実演がFara1.5の学習データとなります。本質的に、OpenAIの最も有能なモデルを使って、ライバルのオープンソースモデルを訓練しているのです。 また、彼らはメールクライアント、カレンダー、マーケットプレイスなど、実際のウェブサイトの完全に機能する6つの偽レプリカを作成しました。これにより、モデル
データステータス✓ 全文抽出済み原文を読む(Decrypt)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:d16c5120ef
ソース:Decrypt
公開:2026-05-22 19:31:03
カテゴリ:一般 · エクスポートカテゴリ neutral
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント