SlopCodeBench:反復的な長期間タスクにおけるコーディングエージェントの劣化をベンチマーク
コーディングAIが反復的なソフトウェア開発タスクでどのようにコード品質が劣化するかを測定する新たなベ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
コーディングAIが反復的なソフトウェア開発タスクでどのようにコード品質が劣化するかを測定する新たなベ…
AIが数学界に与える影響と、それに対する数学コミュニティの対応が議論されました。
生物画像から形態学的特徴を自動で抽出し、アノテーションする新しいAIパイプラインが開発されました。
グラフ対照学習において、ノードごとに低周波と高周波の情報を適応的に融合する新手法「ASPECT」が提案さ…
LLMの感情ベクトルが、感情価と覚醒度からなる2次元の円環幾何学を持つサブスペースに組織されていること…
モデルの重み空間から抽出した「量子化ベクトル」を転送することで、訓練なしで量子化後の精度を大幅に向…
深層学習の最適化を安定させる勾配正規化手法「Muon」の理論的基盤が構築されました。
Androidエージェントのオンライン強化学習において、単一状態から複数行動を学習する新フレームワーク「An…
AIコンポーネントベースシステムにおいて、新しいAI能力モジュールの安全な導入とロールバックを管理する…
長文LLMのKVキャッシュオフロードが、情報抽出量の多いタスクで性能劣化することが判明しました。
大規模言語モデルの効率的な後学習手法「Lightning OPD」が開発されました。
AIが自然な環境下でマルチモーダルデータからうつ病の重症度を推定する新手法が開発されました。