Microsoftの無料AIがWebブラウジングでOpenAIとGoogleを上回った

📄原文全文· trafilatura により自動抽出Gemini 翻譯4896 文字

要約 - Fara1.5-27BはOnline-Mind2Webで72%のスコアを記録し、OpenAI Operator（58.3%）やGemini 2.5 Computer Use（57.3%）を上回りました。 - このモデルはオープンウェイトで、40億、90億、270億のパラメータサイズがあり、Qwen 3.5をファインチューニングして構築されています。 - Fara1.5-9Bは現在Azure AI Foundryで利用可能で、4Bと27Bも間もなくリリースされます。コンピュータに「バケーション用のレンタル物件を探して、5つのサイトを比較し、予約フォームに記入して、ビーチに最も近いものを確定して」と指示することを想像してみてください。あなたがコーヒーを淹れている間に、戻ってきたときにはすべて完了しています。これが「computer use agents」の約束です。AIがブラウザの画面を読み取り、人間と全く同じようにクリック、スクロール、タイピングを行うもので、特別なプラグインは不要です。 OpenAIは2025年1月に月額200ドルでOperatorをリリースし、その後ChatGPT Agentに統合して8月に終了させました。GoogleにはGemini 2.5 Computer Useがあります。どちらもプロプライエタリ（独自仕様）でクラウドベースであり、運用コストが高額です。今週、Microsoft ResearchはFara1.5という小型モデルをリリースしました。重要なベンチマークにおいて、このモデルは両者を凌駕しています。このファミリーは40億、90億、270億パラメータの3サイズ展開で、すべてAlibabaのベースモデルであるQwen3.5を基盤としています。Microsoftはこれをブラウザ作業用にファインチューニングし、すべてのウェイトを公開しました。（パラメータはAIモデルの知識の幅を決定するもので、一般的に多いほど能力が高いことを意味します。）これを実現するには、開発プロセス全体をゼロから考え直す必要がありました。「私たちは『小型モデルをエージェントタスクで真に優れたものにするには何が必要か？』という単純な問いから始めました」とAI Frontiersチームは述べています。「答えはライフサイクル全体に及びました。データ生成、学習目標、モデル設計、オーケストレーションを、個別にではなく統合して再設計しなければなりませんでした。」ベンチマーク Online-Mind2Webは、Microsoftが卓越を目指したタスクにおいて重要なベンチマークです。これは、AIエージェントが136の一般的なライブウェブサイトで、製品比較、フォーム入力、サービス予約といった300の多様な実世界のタスクをどれだけ正確に完了できるかをテストするもので、実際の変化し続けるインターネット上で正しく完了したタスクの割合としてスコア化されます。 Fara1.5-27Bは72%を記録しました。OpenAI Operatorは58.3%、GoogleのGemini 2.5 Computer Useは57.3%でした。主要なプロプライエタリな代替品であるYutoriのNavigator n1は64.7%に達しました。中型モデルであるFara1.5-9Bでさえ63.4%を記録し、OpenAIとGoogleの両方を上回りました。オープンソースのライバルも及びませんでした。AlibabaのGUI-Owl-1.5（80億パラメータ）は48.6%、AI2のMolmoWebは35.3%でした。Microsoft自身の以前のモデルであるFara-7Bは34.1%であり、今回のリリースは同等のサイズで前モデルの約2倍の性能を達成しました。ライブウェブでのタスク成功率を測定するもう一つのベンチマークであるWebVoyagerでも、Fara1.5-27Bは88.6%を記録し、OpenAI Operatorの87.0%を僅差で上回り、H Companyの300億パラメータモデルHolo2の83.0%を打ち負かしました。学習方法秘訣は学習パイプラインにあります。MicrosoftはFaraGen1.5というシステムを使用して学習データを生成しました。ここが巧妙な点です。彼らはOpenAIのモデルであるGPT-5.4を「ティーチャーエージェント」として使い、ブラウザタスクの完了方法を実演させました。その実演がFara1.5の学習データとなります。本質的に、OpenAIの最も有能なモデルを使って、ライバルのオープンソースモデルを訓練しているのです。また、彼らはメールクライアント、カレンダー、マーケットプレイスなど、実際のウェブサイトの完全に機能する6つの偽レプリカを作成しました。これにより、モデル

データステータス✓ 全文抽出済み原文を読む（Decrypt）

🔍過去の類似イベント· キーワード + 銘柄照合6 件

2026-04-29

Google と Microsoft が AI トレードの健在を証明した一方で、OpenAI は冷や汗をかいている

類似度 200%關鍵字 google/just/microsoft

2026-05-01

Pentagon、Google、OpenAI、Nvidia、Microsoft、Amazon および SpaceX と AI 契約を締結

類似度 180%關鍵字 google/microsoft/openai

2026-05-20

Solanaは$83のトラップドアがフリーフォールを引き起こす恐れがある中、入札の半分を失う

類似度 130%關鍵字 just/free

2026-05-16