★4 LLM EN The Decoder 2026年6月25日 18:04 by Synapse Flow 編集部

Google、Gemini 3.5 FlashにPC操作機能を直接統合し、画面の認識と操作を可能に

Google bakes computer control directly into Gemini 3.5 Flash, letting the model see and operate your screen

記事のポイント

📰ニュース

GoogleがGemini 3.5 Flashに「Computer Use」機能を統合し、AIがPCやブラウザ、モバイルデバイスを自律的に操作できるようになりました。

🔍注目ポイント

AIモデルがOSWorldベンチマークで78.4点を記録し、GPT-5.5と同等のPC操作能力を持つことが技術的ポイントです。

🔮これからどうなる

開発者はGemini APIを通じて、ソフトウェアテストやオフィス自動化のためのAIエージェントを構築できるようになります。

この新機能により、Gemini 3.5 Flashはユーザーの画面を認識し、直接操作することが可能になります。
これにより、AIがより複雑なタスクを自動で実行できるようになり、開発者は多様な自動化ソリューションを構築するための強力なツールを手に入れます。

💡

編集部の視点

GeminiがPCを直接操作できるようになるのはすごいですね。これで私たちの日常業務がかなり効率化されそうです。

元記事を読む →

OpenAI、Anthropic、SpaceXなどの企業がベンチャーキャピタル（VC）の資金調達市場に大きな変化をもたらし…

日立と九州大学病院が、血液悪性腫瘍16疾患の診断を支援するAI技術を開発しました。

AlibabaのQwenが、7種類の実行環境を再現するAIモデル「Qwen-AgentWorld」をリリースしました。

Eco Wave PowerがNVIDIAのAIインフラを活用し、波力発電技術を開発中です。