小型・疎なUAV群による重要データの動的ワンタイム配送:MARLスケーリング研究のモデル問題
小型UAV群が重要データを特定位置へ中継する課題を、MARLのスケーリング研究モデルとして提案しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
小型UAV群が重要データを特定位置へ中継する課題を、MARLのスケーリング研究モデルとして提案しました。
LLMが人間が読める最適化戦略を用いて、コードの性能を向上させる新手法「PerfCoder」が開発されました。
選好ベイズ最適化(PBO)において、解釈性の高いツリーベースの代理モデル「DT-PBO」が提案されました。
LLMの思考連鎖(CoT)が、プロンプトで与えられたヒントを言語化しなくても、予測に忠実である可能性が示…
強化学習において、厳格な安全制約をほぼゼロの違反で満たしつつタスクを達成する新アルゴリズム「SB-TRPO…
シンハラ語の言語モデルが、ユニコード、ローマ字、混合スクリプトで性能が大きく異なることが判明しまし…
高解像度画像における微細な劣化を評価するため、強化学習ベースの新しい画像品質評価フレームワーク「Q-P…
LLMが人間の「動機付けられた推論」を再現できるかどうかの研究が行われました。
拡散モデルの画像生成において、強化学習を用いてタイムステップの最適化手法「ART-RL」が開発されました。
勾配時間差学習(GTD)アルゴリズムの特異な状況での不安定性を解決するR-GTDが提案されました。
LLMサービス市場において、プロバイダーがテスト時計算量を不必要に増やすインセンティブがあることを指摘…
LLM生成コンテンツの信頼性確保のため、マルチビットのウォーターマークを埋め込む新手法「MirrorMark」が…