Google、Gemini 3.5 FlashにPC操作機能を直接統合し、画面の認識と操作を可能に
Google bakes computer control directly into Gemini 3.5 Flash, letting the model see and operate your screen
記事のポイント
📰ニュース
GoogleがGemini 3.5 Flashに「Computer Use」機能を統合し、AIがPCやブラウザ、モバイルデバイスを自律的に操作できるようになりました。
🔍注目ポイント
AIモデルがOSWorldベンチマークで78.4点を記録し、GPT-5.5と同等のPC操作能力を持つことが技術的ポイントです。
🔮これからどうなる
開発者はGemini APIを通じて、ソフトウェアテストやオフィス自動化のためのAIエージェントを構築できるようになります。
この新機能により、Gemini 3.5 Flashはユーザーの画面を認識し、直接操作することが可能になります。
これにより、AIがより複雑なタスクを自動で実行できるようになり、開発者は多様な自動化ソリューションを構築するための強力なツールを手に入れます。
これにより、AIがより複雑なタスクを自動で実行できるようになり、開発者は多様な自動化ソリューションを構築するための強力なツールを手に入れます。
GeminiがPCを直接操作できるようになるのはすごいですね。これで私たちの日常業務がかなり効率化されそうです。