知識レベル一貫性強化学習:長文生成における事実性のためのデュアルファクトアライメント
LLMの長文生成における幻覚を抑制する新しい強化学習フレームワーク「KLCF」が提案されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの長文生成における幻覚を抑制する新しい強化学習フレームワーク「KLCF」が提案されました。
REMAPは、ノイズの多い長尺の指示動画から手順を学習する教師なしフレームワークです。
AIモデルの性能向上に伴い飽和する既存ベンチマークに対し、インターネットから自動で難易度の高い新たな…
ロールプレイングゲームとLLMを組み合わせ、デジタルシステムユーザーの道徳的プロファイルを要件定義で抽…
検証可能な報酬による強化学習(RLVR)の理論的基盤が構築され、その収束条件が解明されました。
AIモデルが自身の計算ステップ数を動的に調整し、応答準備ができたことを示す新しい学習手法が提案されま…
白内障手術動画の深層学習分析に向け、大規模なマルチソース・マルチタスクベンチマークデータセット「Cat…
MLPの代替として注目されるKANsに関する包括的なレビューが公開されました。
ロボットの行動生成において、非同期フローマッチング(AFM)を導入したAsyncVLAが開発されました。
視覚言語行動(VLA)モデルが、ネットワークパラメータを増やさずに継続的にスキル知識を学習するフレーム…
AI生成動画の検出において、透かしが検出精度に与える影響を評価する新しいベンチマーク「RobustSora」が…
サッカーの多様な視覚理解タスクを統一的に処理するAIモデル「SoccerMaster」が発表されました。