制約の劣化:バックエンドコード生成におけるLLMエージェントの脆弱性
LLMエージェントがバックエンドコード生成において、構造的制約が増えると性能が著しく低下する「制約の劣…
LLMエージェントがバックエンドコード生成において、構造的制約が増えると性能が著しく低下する「制約の劣…
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
RLVR(検証可能な報酬による強化学習)が訓練データに暗黙的に過学習する現象が発見されました。
新しい言語モデル「Cola DLM」が、階層的な潜在拡散アプローチでテキスト生成の効率と品質を向上させまし…
グラフ構造の類似度を測るグラフ編集距離(GED)を、ニューラルネットワークでより正確に推定する研究が発…
DINORANKCLIPは、CLIPの弱点を克服し、視覚言語モデルの性能を向上させる新しい事前学習フレームワークで…
大規模言語モデル(LLM)の性能を向上させる自己蒸留の統合フレームワーク「UniSD」が提案されました。
LLMで初期トークンがアテンションを独占する「アテンションシンク」現象の構造的起源が解明されました。
SignSGDがSGDよりも優れた性能を発揮する条件と理由を理論的に解明しました。
自己複製しサブタスクを委任する「再帰的エージェント」を強化学習で訓練する手法「RAO」が発表されました…
LLMエージェントの長期的な意思決定能力を向上させる新しい強化学習フレームワーク「StraTA」が発表されま…