固定翼航空機の横方向姿勢追跡制御のための対称データ拡張を用いた深層決定論的方策勾配
Deep deterministic policy gradient with symmetric data augmentation for lateral attitude tracking control of a fixed-wing aircraft
記事のポイント
📰ニュース
固定翼航空機の姿勢制御において、システム対称性を利用した強化学習手法が提案されました。
🔍注目ポイント
対称データ拡張とデュアルクリティック構造を導入し、状態行動空間のカバー率とサンプル利用効率を向上させました。
🔮これからどうなる
航空機の自動操縦システム開発において、より効率的でロバストな制御方策の学習が可能になります。
マルコフ決定過程の対称性を仮定し、対称データ拡張を提案。
拡張されたサンプルをDDPGのデータセットに統合し、状態行動空間のカバー率を高めています。
さらに、拡張サンプルで訓練された第2のクリティックを導入し、デュアルクリティック構造によりサンプル利用効率を改善しました。
航空機モデルの対称性が検証され、飛行制御シミュレーションで方策収束の加速が実証されています。
拡張されたサンプルをDDPGのデータセットに統合し、状態行動空間のカバー率を高めています。
さらに、拡張サンプルで訓練された第2のクリティックを導入し、デュアルクリティック構造によりサンプル利用効率を改善しました。
航空機モデルの対称性が検証され、飛行制御シミュレーションで方策収束の加速が実証されています。
航空機の自動操縦がより賢く、効率的に学習できるようになりそうですね。将来的に、私たちのフライトの安全性や快適性にも貢献するかもしれません。