プロンプトと応答間の相互情報量を最大化することで、追加データや人間の監視なしにLLMのパーソナライゼーションを改善
LLMが追加データや人間の監視なしに、プロンプトと応答間の相互情報量を最大化することで自己改善する手法…
LLMが追加データや人間の監視なしに、プロンプトと応答間の相互情報量を最大化することで自己改善する手法…
LLMの評価における候補順序の不安定性を解決するため、複数の順序で評価し結果を集約する新手法「PCFJudge…
マルチモーダルLLMの推論において、異なるデータタイプ(テキスト、画像、動画)の処理を効率化する新しい…
Q-価値反復(Q-VI)が最適方策を特定するまでの時間を、幾何学的な視点から分析する新しい研究が発表され…
オンデバイスLLMの推論効率を向上させるため、KVキャッシュの読み込みを最適化するフレームワーク「SparKV…
Transformerモデル内部の意思決定品質を監視する「観測可能性」が、特定のアーキテクチャで崩壊することが…
マルチモーダルLLMが回路図からVerilogコードを生成する際の「幻影」現象を特定し、その解決策を提案しま…
最先端の言語モデルは、複雑な脱獄手法を用いてもその性能がほとんど低下しないことが判明しました。
LLMが生成するコードに深刻な社会的バイアスが存在し、既存の対策ではむしろ悪化する可能性が指摘されまし…
科学論文における事実の局所的な編集が、非局所的な改訂義務をLLMがどこまで伝播できるかを測定する新しい…
シュティーフェル多様体上の最適化において、リトラクション不要な新しい2次手法が提案されました。
LLMの推論を高速化する推測デコーディングにおいて、最適な推測長を動的に決定する手法が開発されました。