ガウス平滑化を用いたソフト決定論的方策勾配
決定論的方策勾配(DPG)の学習安定性を向上させる新しい強化学習アルゴリズムが提案されました。
決定論的方策勾配(DPG)の学習安定性を向上させる新しい強化学習アルゴリズムが提案されました。
潜在的なパターンや暗黙的な意図を伴う「斜め(oblique)」なクエリに対する検索性能の課題を指摘する研究…
マルチモーダル推薦システムへの回避型プロモーション攻撃に対し、協調型敵対的学習で防御する新手法が提…
フォワードフォワードネットワークの学習において、後続層が先行層の成果に便乗する「フリーライディング…
深層ニューラルネットワークの学習メカニズムを解明する新しい理論的枠組みが提案されました。
推論時に合成表形式データを改善する新しいフレームワーク「TARDIS」が開発されました。
方言の音声データにおける意味セグメンテーションの課題を解決する新しいベンチマークとモデルが発表され…
LLMが生成するPythonコードに含まれるライブラリのバージョンに、多くの脆弱性や互換性の問題があることが…
ランダム因果有向非巡回グラフ(DAG)において、因果順序に沿って到達可能なノード(親族)の数が単調増加…
クラス不均衡なマルチモーダルデータに対する半教師あり学習で、モデルの性能を向上させる新しい深層生成…
機械生成テキスト検出において、既存手法がシンプソンのパラドックスにより性能を損なっていることを発見…
モデル説明の二次相互作用効果を定量化する「メタゲーム」という新しい概念フレームワークが発表されまし…