One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue
マルチターン対話におけるLLMへの隠れた悪意ある攻撃を検知する防御手法が開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
マルチターン対話におけるLLMへの隠れた悪意ある攻撃を検知する防御手法が開発されました。
AIチューターの評価軸に学生の行動データを加える新フレームワークが提案されました。
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
LLMのマルチタスク学習におけるタスク間干渉を低減する新手法「BADIT」が提案されました。
生成AIの危険性を発見するため、ペルソナを活用したレッドチーム手法「PersonaTeaming」が開発されました。
KANが時系列予測において、学習されたエッジ関数から忠実な説明を生成するフレームワークを提案しました。
LLMエージェントの推論効率を向上させる新しいキャッシュシステム「Irminsul」が発表されました。
Transformerモデルの計算コストを動的に制御する新しい手法が発表されました。
Apple Silicon上でint4 KVキャッシュがfp16より高速に動作する技術が発表されました。
プロアクティブなAIコーディングアシスタントの評価と訓練に関する実証研究が発表されました。
LLMベースのマルチエージェントシステムにおいて、アクティブラーニングで最適なコミュニケーション構造を…
LLMエージェントの安全性を高める階層型メモリ拡張ガードレール「SafeHarbor」が開発されました。