PersonaKit (PK): A Plug-and-Play Platform for User Testing Diverse Roles in Full-Duplex Dialogue
対話システムが多様な役割を演じる際の、人間らしい発話交代をテストするプラットフォームが発表されまし…
対話システムが多様な役割を演じる際の、人間らしい発話交代をテストするプラットフォームが発表されまし…
LLMの推論能力向上を目指し、選択的適格性トレース(S-trace)という新しい強化学習手法が提案されました。
ランダム化アダマール変換(RHT)を用いた量子化手法の理論的裏付けが示されました。
深層学習時系列予測モデルにおいて、合成データが性能に与える影響を大規模に実証研究しました。
LLMの報酬モデル学習において、ノイズの多い人間からのフィードバックを最適輸送理論で効率的に処理する新…
nGPTという正規化されたLLMアーキテクチャが、4ビット精度で安定して学習できることが示されました。
長期間にわたる複雑なタスクをこなす言語エージェントの学習効率を大幅に向上させる新フレームワーク「BEA…
動画理解LLMの推論能力を向上させる「VISD」という新しい学習フレームワークが発表されました。
LLMの推論能力を向上させる、論理規則で正規化された教師なし検証器「LOVER」が開発されました。
複雑なカードゲーム「マジック:ザ・ギャザリング」をベンチマークとした因果強化学習の新しいテスト環境…
Decision TransformerのRTGをシーケンスから外し、状態表現に注入する「SlimDT」が提案されました。
コードLLM向けに、タスクの有用性に基づいた強化学習フレームワーク「ASTOR」が開発されました。