テキストからオーディオ生成システムにおける意味的脆弱性の評価:プロンプト摂動下の研究
テキストからオーディオを生成するAIモデルが、わずかなプロンプト変更で出力が大きく変わる「意味的脆弱…
テキストからオーディオを生成するAIモデルが、わずかなプロンプト変更で出力が大きく変わる「意味的脆弱…
LLMが追加データや人間の監視なしに、プロンプトと応答間の相互情報量を最大化することで自己改善する手法…
LLMの評価における候補順序の不安定性を解決するため、複数の順序で評価し結果を集約する新手法「PCFJudge…
マルチモーダルLLMの推論において、異なるデータタイプ(テキスト、画像、動画)の処理を効率化する新しい…
ロボットの知能、能力、実行を統合する単一エージェント運用アーキテクチャ「AEROS」が発表されました。
ロボットがユーザーとの対話を通じて何を記憶し、何を忘れるべきかを学習するフレームワークが開発されま…
Q-価値反復(Q-VI)が最適方策を特定するまでの時間を、幾何学的な視点から分析する新しい研究が発表され…
ロボットの視覚言語行動(VLA)モデルに物理的実現可能性の制約を明示的に導入する研究が発表されました。
強化学習のQ学習において、収束率を厳密に分析する新しい理論が開発されました。
生成推薦システムにおいて、セマンティックID生成の課題を解決する新しいフレームワークが提案されました。
オンデバイスLLMの推論効率を向上させるため、KVキャッシュの読み込みを最適化するフレームワーク「SparKV…
学生のコード提出物からパターンベースの知識コンポーネントを抽出し、個別化された解答例を生成するAIシ…