Owen-Shapley方策最適化:生成探索LLMのための原理的な強化学習アルゴリズム
LLMの強化学習において、トークンごとの貢献度を評価する新しいアルゴリズムが開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの強化学習において、トークンごとの貢献度を評価する新しいアルゴリズムが開発されました。
LLMエージェントが高度な推論を行うための新しい記憶フレームワーク「E-mem」が提案されました。
バイオインフォマティクス分野のAIエージェント性能を評価するベンチマーク「BioAgent Bench」が発表され…
時系列データに特化したLLM推論フレームワーク「VeriTime」が開発され、高い推論性能を実現しました。
LLMベースの推薦システムが、ユーザーの過去の嗜好と矛盾する説明を生成する問題を解決するフレームワーク…
Minecraft環境で、エージェントが過去の経験から学習し、自己進化するフレームワーク「MineEvolve」が開発…
LLMと形式検証ツールを組み合わせたニューロシンボリックフレームワークが、システムソフトウェアの自動証…
LLMエージェントが設計課題で陥る「固着」を、メタ認知による自己・共同規制で克服するAIシステムが開発さ…
エージェント型LLMの評価における既存の課題を解決する新しい評価フレームワーク「Grounded Continuous Ev…
実世界の出来事を予測するAIエージェントの性能を向上させるための新しい強化学習環境「FutureWorld」が発…
半導体製造におけるウェーハ欠陥の視覚的質問応答を、小規模な視覚言語モデルで実現するフレームワークが…
LLMエージェントの強化学習において、報酬が少ない環境でも効率的に学習できる新手法「AEM」が開発されま…