ロバストフィルターアテンション:自己注意を精度加重状態推定として再構築
自己注意メカニズムをロバストな状態推定器として再定式化する「ロバストフィルターアテンション(RFA)」…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
自己注意メカニズムをロバストな状態推定器として再定式化する「ロバストフィルターアテンション(RFA)」…
オフポリシー強化学習における外挿誤差を、静止摩擦のアナロジーで解決する新アルゴリズムが提案されまし…
LLMの長文生成における幻覚を抑制する新しい強化学習フレームワーク「KLCF」が提案されました。
REMAPは、ノイズの多い長尺の指示動画から手順を学習する教師なしフレームワークです。
AIモデルの性能向上に伴い飽和する既存ベンチマークに対し、インターネットから自動で難易度の高い新たな…
ロールプレイングゲームとLLMを組み合わせ、デジタルシステムユーザーの道徳的プロファイルを要件定義で抽…
検証可能な報酬による強化学習(RLVR)の理論的基盤が構築され、その収束条件が解明されました。
AIモデルが自身の計算ステップ数を動的に調整し、応答準備ができたことを示す新しい学習手法が提案されま…
白内障手術動画の深層学習分析に向け、大規模なマルチソース・マルチタスクベンチマークデータセット「Cat…
MLPの代替として注目されるKANsに関する包括的なレビューが公開されました。
ロボットの行動生成において、非同期フローマッチング(AFM)を導入したAsyncVLAが開発されました。
視覚言語行動(VLA)モデルが、ネットワークパラメータを増やさずに継続的にスキル知識を学習するフレーム…