制約の劣化:バックエンドコード生成におけるLLMエージェントの脆弱性
LLMエージェントがバックエンドコード生成において、構造的制約が増えると性能が著しく低下する「制約の劣…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMエージェントがバックエンドコード生成において、構造的制約が増えると性能が著しく低下する「制約の劣…
ベイズ最適化における取得関数推定のノイズを低減する新しい手法「ORTHOBO」が提案されました。
強化学習において、新しいオフポリシー評価フレームワーク「Q-MMR」が提案されました。
三値ニューラルネットワークの推論を消費者向けCPUで高速化するLitespark-Inferenceが開発されました。
3D MRI画像を制御可能な2Dスライスシーケンスに変換し、その動きを予測する新しい自己教師あり学習手法が…
連続強化学習において、価値を保持する構造を自動で発見し、学習効率と安定性を向上させる新手法が提案さ…
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
研究成果物には潜在的なセキュリティリスクが含まれており、その評価手法が提案されました。
Transformerベースの表形式基盤モデルの推論メカニズムを大規模に分析し、層ごとの冗長性を発見しました。
強化学習を用いて、二段階確率計画問題のベンダー分解におけるカット選択を最適化するフレームワークが提…
RLVR(検証可能な報酬による強化学習)が訓練データに暗黙的に過学習する現象が発見されました。
動画の背景を自然言語の指示で置き換えるための大規模データセットとモデル「Sparkle」が発表されました。