SynBench:差分プライバシーを考慮したテキスト生成のベンチマーク
差分プライバシーを保証する合成テキスト生成の統一評価フレームワーク「SynBench」が発表されました。
差分プライバシーを保証する合成テキスト生成の統一評価フレームワーク「SynBench」が発表されました。
LLMが多段階推論を獲得するメカニズムを統計物理学の観点から解明し、新しい学習手法を提案しました。
LLMが複雑な推論タスクを学習する際、専門家の思考プロセスから報酬関数を自動で学習する新手法が提案され…
LLMを活用したマルチエージェントフレームワーク「CompassLLM」が、人気経路クエリを解決しました。
LLMが長期タスクで注意散漫になるのを防ぐため、作業記憶管理を自律的に行うフレームワークが提案されまし…
LLMの推論能力向上に伴い、自己整合性(複数推論パスのサンプリング)の効果が薄れ、コストが増大している…
マルチモーダル大規模言語モデル(MLLM)の空間認識能力を評価する新しいベンチマーク「SpatialBench」が…
LLMエージェントがオンデマンドの感覚コンテキストを活用し、日常生活でユーザーを能動的に支援するシステ…
離散施設配置問題の最適化を加速する新しいハイブリッドアーキテクチャが開発されました。
LLMが数学の概念理解と応用能力のギャップを埋めるための新しい強化学習フレームワーク「CORE」が開発され…
6Gネットワークでユーザーの意図を理解し、AIエージェントが連携してネットワークを最適化するフレームワ…
LLMの強化学習において、トークンごとの貢献度を評価する新しいアルゴリズムが開発されました。