掲載済み (2026-01-20号)
#199 549文字 • 3分

## Seleniumの作者によるAIと人間のためのブラウザ自動化「Vibium」

日本語

掲載情報

概要

https://gigazine.net/news/20260111-vibium/

詳細内容

## Seleniumの作者によるAIと人間のためのブラウザ自動化「Vibium」 https://gigazine.net/news/20260111-vibium/ ブラウザ自動化の始祖ジェイソン・ハギンズ氏が、AIエージェントによる自然言語操作に最適化された次世代の軽量自動化ツール「Vibium」を公開した。 **Content Type**: ⚙️ Tools **Language**: ja **Scores**: Signal:5/5 | Depth:3/5 | Unique:4/5 | Practical:3/5 | Anti-Hype:4/5 **Main Journal**: 52/100 | **Annex Potential**: 51/100 | **Overall**: 76/100 **Topics**: [[Vibium, Browser Automation, AI Agent, MCP, WebDriver Bidi]] Seleniumの生みの親であるジェイソン・ハギンズ氏が、AIエージェントと人間の共存を前提とした新しいブラウザ自動化ツール「Vibium」をリリースした。Vibiumは、従来のブラウザ自動化が抱えていた「DOM構造の変化に対する脆弱性」や「スクリプト維持の煩雑さ」という課題を、AIエージェントによる柔軟な解釈と操作によって解決することを目指している。 最大の特徴は、Model Context Protocol(MCP)へのネイティブ対応である。これにより、Visual Studio CodeのGitHub Copilot ChatといったAIエージェントから、標準的なプロトコルを介してブラウザを直接制御することが可能になる。エンジニアが複雑なCSSセレクタやXPathを事前に定義する代わりに、AIに対して「GIGAZINEでJavaScriptに関する記事を検索して」といった自然言語で指示を出すだけで、AIがページ構造を動的に解析し、適切な入力フォームやボタンを特定して実行する。記事内の検証では、当初AIが検索ボタンを特定できなかった際も、追加の言語指示によって即座に修正・実行される柔軟性が示されている。 技術面では、最新のWebDriver Bidi規格を採用しており、ブラウザとの双方向通信やイベント受信をサポートする。バイナリサイズは約10MBと非常に軽量に設計されており、JavaScriptおよびPythonから利用可能なライブラリが提供されている。著者(ハギンズ氏)によれば、このプロジェクトの目的は「ドラマ(手間)のないブラウザ自動化」の実現である。 筆者は、現在のバージョン1がクリックやスクリーンショットといった基本機能に特化していることを認めており、現時点ではJavaScriptの注入やネットワーク監視といったPlaywrightのような高度な機能を完全にはカバーしていない。しかし、今後のロードマップとして、ロボット工学の「Sense-Think-Act(感知・思考・実行)」のサイクルを組み込んだバージョン2への進化を提示している。 Webアプリケーションエンジニアにとっての重要性は、ブラウザ操作の抽象化レイヤーが「厳密なコード」から「目的ベースの自然言語」へと移行し始めた点にある。これは、E2Eテストのメンテナンス負荷を劇的に軽減する可能性を秘めているだけでなく、ブラウザを操作するAIエージェントを自社ツールに組み込む際の標準的なインターフェース(MCP)としての活用を期待させるものである。現状ではPlaywright等の成熟したツールに機能面で譲る部分は多いが、AIファーストの自動化という新しいパラダイムを示すプロダクトとして注視すべき存在である。