XL-SafetyBench: A Country-Grounded Cross-Cultural Benchmark for LLM Safety and Cultural Sensitivity
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
ベクトル検索システムにおいて、未知のデータに対する性能低下を抑える新しいアダプター学習手法「EGA」が…
LLMのマルチタスク学習におけるタスク間干渉を低減する新手法「BADIT」が提案されました。
生成AIの危険性を発見するため、ペルソナを活用したレッドチーム手法「PersonaTeaming」が開発されました。
KANが時系列予測において、学習されたエッジ関数から忠実な説明を生成するフレームワークを提案しました。
動画のプライバシー保護とアクション認識を両立する、圧縮に強い暗号化技術が開発されました。
LLMエージェントの推論効率を向上させる新しいキャッシュシステム「Irminsul」が発表されました。
Transformerモデルの計算コストを動的に制御する新しい手法が発表されました。
Apple Silicon上でint4 KVキャッシュがfp16より高速に動作する技術が発表されました。
プロアクティブなAIコーディングアシスタントの評価と訓練に関する実証研究が発表されました。
LLMベースのマルチエージェントシステムにおいて、アクティブラーニングで最適なコミュニケーション構造を…
LLMエージェントの安全性を高める階層型メモリ拡張ガードレール「SafeHarbor」が開発されました。