Are Flat Minima an Illusion?
ニューラルネットワークの汎化性能と関連するとされる「平坦な最小値」が、実際には錯覚である可能性が示…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
ニューラルネットワークの汎化性能と関連するとされる「平坦な最小値」が、実際には錯覚である可能性が示…
LLMを株価予測に活用する研究の現状と課題をヘッジファンドの視点からレビューしました。
MedMambaが医療時系列データ分類で既存手法を上回り、推論速度も大幅に向上しました。
AIがレイアウトを考慮した表現学習で、未知の身分証明書詐欺を99.83%の精度で発見しました。
物理情報ニューラルネットワーク(PINN)が学習可能な損失バランスと転移学習で性能向上しました。
カオス予測におけるモデルの多様性が予測期間と共にどう変化するかを分析する新理論が発表されました。
LLM推論のレイテンシを削減する「Sparse Prefix Caching」という新しいキャッシュ手法が提案されました。
生成AIの振る舞いを制御する新しい理論的枠組み「MidSteer」が発表されました。
Transformerモデルがトークンごとに計算深度を適応させる新手法「Token-Selective Attention (TSA)」が発…
Sparse Autoencoder(SAE)における特徴合成の構造的不安定性を幾何学的フレームワークで分析しました。
AIモデルの不正学習を防ぐ「学習不能な例(UE)」が、事前学習・ファインチューニングの環境で効果が薄れ…
マルチモーダルMoEモデルの推論効率を向上させるMACSフレームワークが発表されました。