大規模言語モデルを用いた強化学習インターフェースの発見
LLMと進化的フレームワークを組み合わせ、強化学習の環境インターフェースを自動生成する技術が開発されま…
LLMと進化的フレームワークを組み合わせ、強化学習の環境インターフェースを自動生成する技術が開発されま…
AIが非テキストデータから世界の仕組みを説明する「理論」を構築する新しい学習パラダイムが提案されまし…
LLMの安全対策が数学的エンコーディングされた有害なプロンプトによって回避されることが判明しました。
FINER-SQLは、小規模言語モデル(SLM)を強化し、テキストからSQLへの変換精度を大幅に向上させる新しい強…
医療退院要約におけるLLMのハルシネーションを検出するマルチエージェントフレームワーク「CuraView」が開…
LLMエージェントの外部メモリに対するメモリポイズニング攻撃を形式化し、新たな防御手法「MEMSAD」を提案…
人間中心のシーンにおける知覚と推論を評価する、新しい多次元ベンチマーク「MHPR」が発表されました。
グラフデータをトークン化してLLMに入力する手法が、グラフ情報を十分に理解しているか疑問視されています…
言語モデルが既存のプログラムとドキュメントから、その挙動を再現するコードベースをゼロから構築する能…
LLMのKVキャッシュ量子化において、モデルが認識する歪みを測定し、それを補正する新しい手法「HeadQ」が…
特許審査の全段階をモデル化する、オフィスアクションと出願人反論生成の新しいベンチマーク「PatRe」が発…
リーマン対称空間上でフローマッチングモデルを訓練する汎用フレームワークが発表されました。