SkillRet: A Large-Scale Benchmark for Skill Retrieval in LLM Agents
LLMエージェント向けスキル検索の大規模ベンチマーク「SkillRet」が発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMエージェント向けスキル検索の大規模ベンチマーク「SkillRet」が発表されました。
膝の変形性関節症の重症度を、軽量化した深層学習とLLMを組み合わせたAIで診断するシステムが提案されまし…
時系列データ生成において、自己回帰モデルの課題を克服する非自己回帰型フレームワーク「SDFlow」が提案…
LLMの複雑な長期的推論におけるエラーを検出し回復する「ReFlect」システムが発表されました。
LLMの推論における「認知的努力」を、層ごとの信頼度変化から定量化する新手法「HyperLens」が発表されま…
ハイブリッドフィードバックモデル下での最適アーム特定手法が提案されました。
安全性が重要な自動目標認識(ATR)システムにおける説明可能なAI(XAI)の限界が指摘されました。
AIが不確実性を考慮し、透過性ペプチドを効率的に設計する新手法が発表されました。
自然言語プロンプトからアナログ回路を設計するAIモデル「CircuitFormer」が開発されました。
新しいデータドメインに継続的に適応するAIモデルの性能劣化を抑制するフレームワークが提案されました。
フォン・ノイマンの細胞オートマトンを基にした新しいニューラルネットワーク「Von Neumann Networks(VNN…
複数シートにまたがるスプレッドシートをAIが理解するための新しい表現方法「Sheet as Token」が提案され…