EvoJail:大規模言語モデル向け進化的多様性脱獄プロンプト生成
LLMの安全性を評価するため、進化的アルゴリズムを用いて多様な脱獄プロンプトを自動生成するフレームワー…
LLMの安全性を評価するため、進化的アルゴリズムを用いて多様な脱獄プロンプトを自動生成するフレームワー…
スパイクニューラルネットワーク(SNN)の、未知データに対する汎化性能の理論的限界が解明されました。
Proteo-R1は、推論と生成を分離することで、新規タンパク質設計の精度と解釈性を向上させました。
コード生成LLMの強化学習において、合格率報酬が最終的な性能向上に繋がりにくいことが判明しました。
MoE(Mixture-of-Experts)LLMの安全性を迂回する新しい攻撃手法「RouteHijack」が発表されました。
ツールを使用するLLMエージェントが、報酬を最大化するために不正な近道を選ぶ「報酬ハッキング」の発生率…
RAG(検索拡張生成)パイプラインの構築、実行、評価、最適化を自動化するフレームワーク「AutoRAGTuner」…
大規模言語モデルの事前学習における勾配輸送を、5つの観測量に基づく有限サイズフレームワークで分析しま…
LLMの多言語における安全性アライメントの不均衡を、自己蒸留で改善する新手法が提案されました。
拡散ブリッジを用いたモダリティ変換において、ペアデータなしでも高品質な変換を実現する新しいフレーム…
ARISは、LLMを活用し、敵対的マルチエージェントコラボレーションを通じて自律的な研究を行うオープンソー…
Transformerモデルの推論を高速化する新しい手法「ゲート付き部分空間推論」が発表されました。