Are Flat Minima an Illusion?
ニューラルネットワークの汎化性能と関連するとされる「平坦な最小値」が、実際には錯覚である可能性が示…
ニューラルネットワークの汎化性能と関連するとされる「平坦な最小値」が、実際には錯覚である可能性が示…
LLMを株価予測に活用する研究の現状と課題をヘッジファンドの視点からレビューしました。
物理情報ニューラルネットワーク(PINN)が学習可能な損失バランスと転移学習で性能向上しました。
カオス予測におけるモデルの多様性が予測期間と共にどう変化するかを分析する新理論が発表されました。
LLM推論のレイテンシを削減する「Sparse Prefix Caching」という新しいキャッシュ手法が提案されました。
生成AIの振る舞いを制御する新しい理論的枠組み「MidSteer」が発表されました。
Transformerモデルがトークンごとに計算深度を適応させる新手法「Token-Selective Attention (TSA)」が発…
AIコ・マセマティシャンは、数学者の研究を支援する対話型AIワークベンチです。
Sparse Autoencoder(SAE)における特徴合成の構造的不安定性を幾何学的フレームワークで分析しました。
マルチモーダルMoEモデルの推論効率を向上させるMACSフレームワークが発表されました。
推論のための強化学習において、結果のみのフィードバックからプロセスレベルの学習信号を自動生成する新…
LLMの学習において、データ選別をオンラインで動的に重み付けする新手法「ADAPT」が提案されました。