VISD: Enhancing Video Reasoning via Structured Self-Distillation
動画理解LLMの推論能力を向上させる「VISD」という新しい学習フレームワークが発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
動画理解LLMの推論能力を向上させる「VISD」という新しい学習フレームワークが発表されました。
GNSS測位の信頼性を高めるCredibleDFGOが、都市部での位置推定精度と不確実性評価を改善しました。
Decision TransformerのRTGをシーケンスから外し、状態表現に注入する「SlimDT」が提案されました。
コードLLM向けに、タスクの有用性に基づいた強化学習フレームワーク「ASTOR」が開発されました。
イベントカメラを用いた物体追跡で、動的に処理深度を調整し精度と効率を両立する新手法が提案されました。
画像劣化の種類を問わず、単一モデルで高精度な画像復元を実現する新手法「CEA」が発表されました。
AIエージェントが生成したコードベースの品質を、後続エージェントによる情報回復の容易さで評価する新プ…
自己回帰型画像生成モデルの生成品質を向上させる「Prologue」という新しい手法が提案されました。
LLMの推論能力向上に向け、リストワイズ方策最適化(LPO)という新しい強化学習手法が提案されました。
物理システムの生成モデル「SymDrift」が、対称性を考慮しつつ高速なワンショット生成を実現しました。
個人が過去を語る際に間接的に言及するエンティティを認識するベンチマーク「IRC-Bench」が発表されました…
AI生成画像の検出システムにおいて、人間が理解しやすい説明を生成する手法が開発されました。