ProactiveMobile: モバイルデバイス上のプロアクティブAIを促進する包括的ベンチマーク
モバイルデバイス上でユーザーの潜在的な意図を予測し、自律的に行動するプロアクティブAIの性能を評価す…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
モバイルデバイス上でユーザーの潜在的な意図を予測し、自律的に行動するプロアクティブAIの性能を評価す…
LLMが生成するインタラクティブなHTMLベースのアプリケーション「MiniApps」の評価ベンチマーク「MiniAppB…
言語モデルが多段階で外部情報を収集し、知識集約型タスクを解決するエージェント型検索の新しい学習フレ…
AIエージェントが他者の行動観察のみで、複雑な環境知識を効率的に獲得するメカニズムが示されました。
LLMの内部活性化を操作しても、同じ挙動をテキストプロンプトで再現できないことが証明されました。
LLMが複数の推論パスを並行して実行し、互いに情報を共有・修正する新しいフレームワーク「LACE」が発表さ…
未来の出来事を予測するAIが、未解決の質問に対する過去の予測履歴から学習し、予測精度を向上させる新手…
GamED.AIは、教師が提供する質問から、プレイ可能な教育用ゲームを自動生成するフレームワークです。
LLMの多段階事実検証における推論の信頼性と解釈性を向上させる新しいフレームワークが開発されました。
マルチエージェントシステム(MAS)において、単一エージェントの感染が広がる「感染性ジェイルブレイク」…
LLMがウィキペディアの中立的な観点(NPOV)ポリシーをどの程度理解し、適用できるかを評価した研究が発表…
ロボットが複数の目標を達成するオフライン強化学習において、目標条件付きデシジョントランスフォーマー…