XL-SafetyBench: A Country-Grounded Cross-Cultural Benchmark for LLM Safety and Cultural Sensitivity
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
生成AIの危険性を発見するため、ペルソナを活用したレッドチーム手法「PersonaTeaming」が開発されました。
動画のプライバシー保護とアクション認識を両立する、圧縮に強い暗号化技術が開発されました。
Apple Silicon上でint4 KVキャッシュがfp16より高速に動作する技術が発表されました。
LLMベースのマルチエージェントシステムにおいて、アクティブラーニングで最適なコミュニケーション構造を…
LLMエージェントの安全性を高める階層型メモリ拡張ガードレール「SafeHarbor」が開発されました。
AIエージェントが自律的に研究を行い、効果的な機械学習の学習レシピを開発しました。
機械学習を用いた最適電力潮流問題のウォームスタート手法の評価基準が修正され、新たなベンチマークWARP…
LLMの継続学習における壊滅的忘却を防ぐ新フレームワーク「CRAFT」が提案されました。
交通予測のための継続学習フレームワーク「CoMemNet」が開発されました。
LLMが株価予測AIの行動を多角的に評価し、強化学習で性能を向上させるフレームワークが発表されました。
フーリエ特徴量を用いた非線形因果探索手法FFMLスコアリングとFFCIテストが開発されました。