Transformerにおけるアーキテクチャ的観測可能性の崩壊
Transformerモデル内部の意思決定品質を監視する「観測可能性」が、特定のアーキテクチャで崩壊することが…
Transformerモデル内部の意思決定品質を監視する「観測可能性」が、特定のアーキテクチャで崩壊することが…
ロボットのスキルライブラリ更新時に、複合スキルのパフォーマンス変化を効率的に評価する手法が提案され…
連続時間・空間の確率過程を任意の部分観測に基づいて生成する新しいモデル「ABC」が提案されました。
マルチモーダルLLMが回路図からVerilogコードを生成する際の「幻影」現象を特定し、その解決策を提案しま…
最先端の言語モデルは、複雑な脱獄手法を用いてもその性能がほとんど低下しないことが判明しました。
LLMが生成するコードに深刻な社会的バイアスが存在し、既存の対策ではむしろ悪化する可能性が指摘されまし…
認知ワークフローシステムにおいて、ステップ実行器が意図しない副作用を起こさないよう、構造的かつ暗号…
LLMエージェントの長期記憶に潜伏型ペイロードを仕込み、機密情報が議論された際にデータを流出させる「ト…
科学論文における事実の局所的な編集が、非局所的な改訂義務をLLMがどこまで伝播できるかを測定する新しい…
オフライン安全強化学習において、拡散モデルを用いた新しい手法「SDGD」が開発されました。
シュティーフェル多様体上の最適化において、リトラクション不要な新しい2次手法が提案されました。
LLMの推論を高速化する推測デコーディングにおいて、最適な推測長を動的に決定する手法が開発されました。