EvoJail:大規模言語モデル向け進化的多様性脱獄プロンプト生成
LLMの安全性を評価するため、進化的アルゴリズムを用いて多様な脱獄プロンプトを自動生成するフレームワー…
LLMの安全性を評価するため、進化的アルゴリズムを用いて多様な脱獄プロンプトを自動生成するフレームワー…
スパイクニューラルネットワーク(SNN)の、未知データに対する汎化性能の理論的限界が解明されました。
ヒンディー語の音声認識において、CNNを用いたキーワード検出システムが開発されました。
大規模AIモデルの学習を、一般ユーザーが分散型かつ持続可能な形で共同で行う新しい手法「DeRelayL」が提…
脳活動をデータ駆動型で普遍的な空間に表現する「Universal Brain Dynamics (UBD)」が開発されました。
Proteo-R1は、推論と生成を分離することで、新規タンパク質設計の精度と解釈性を向上させました。
PAMNetは、多変量時系列データの周期パターンを位相と振幅に分解し、高精度な予測を実現する新しいAIモデ…
動画コンテンツの論争性を検出する、学習不要のマルチエージェントAIフレームワーク「AuDisAgent」が開発…
ミームの有害コンテンツをゼロショットで検出し、その判断過程を解釈可能なマルチエージェントAIが開発さ…
医療AIエージェントの強化学習訓練のための包括的なシミュレーション環境が開発されました。
コード生成LLMの強化学習において、合格率報酬が最終的な性能向上に繋がりにくいことが判明しました。
MoE(Mixture-of-Experts)LLMの安全性を迂回する新しい攻撃手法「RouteHijack」が発表されました。