Market-Alignment Risk in Pricing Agents: Trace Diagnostics and Trace-Prior RL under Hidden Competitor State
AI価格設定エージェントが、競合の隠れた状態下で不適切な行動を学習するリスクが指摘されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AI価格設定エージェントが、競合の隠れた状態下で不適切な行動を学習するリスクが指摘されました。
疫病予測における空間情報と疫学的事前知識のベンチマーク「SpatialEpiBench」が発表されました。
AI生成アイデアの多様性低下を事前に評価する新しいフレームワークが発表されました。
フローモデルのファインチューニングを最適制御問題として捉え、人間選好に合わせる新手法が提案されまし…
LLMエージェント「NeuroAgent」が、複雑な脳画像解析の自動化を実現しました。
SkillOSは、LLMエージェントが過去の経験からスキルを学習し、自己進化する新しいフレームワークです。
LLMベースのマルチエージェントシステム向けに、プロンプトを自動で共同最適化する新フレームワーク「MASP…
RLがLLMの長期的推論を教える際の課題を、新しい論理推論フレームワークで研究しました。
陶磁器釉薬の特性予測と画像生成のための大規模データセット「GlazyBench」が発表されました。
AIコ・マセマティシャンは、数学者の研究を支援する対話型AIワークベンチです。
TurboQuantと先行研究であるDRIVE/EDENの量子化手法の関係性が明らかにされました。
ニューラルネットワークの汎化性能と関連するとされる「平坦な最小値」が、実際には錯覚である可能性が示…