モデルはどのくらいの速さで教師信号にコミットすべきか?Tsallis損失連続体を用いた推論モデルの学習
推論モデルの学習におけるSFT-then-RLVRの有効性を、Tsallis q-対数を用いた統一的な損失関数で理論的に説…
推論モデルの学習におけるSFT-then-RLVRの有効性を、Tsallis q-対数を用いた統一的な損失関数で理論的に説…
AIが人間による正解なしに、検証可能な問題を生成し、解決し、自己改善する新しい学習パラダイムが提案さ…
RSATは、小型言語モデルが表の質問に対して、根拠となるセルを引用しながら段階的な推論を生成する手法で…
大規模言語モデルの新しいアーキテクチャ「Caracal」が、アテンションの代わりにフーリエ変換を用いて長文…
LLMがオンラインかつ非定常な環境で在庫ポリシーを進化させるInvEvolveフレームワークが開発されました。
言語モデルの潜在表現から階層構造(深さ、ペアワイズ距離)を抽出する「H-probes」が開発されました。
大規模言語モデル(LLM)の内部に残る記憶痕跡を、機能低下なしに外科的に除去する技術が開発されました。
LLMを活用し、ニューラルネットワーク設計の効率と信頼性を高める新しい手法「SPARK」が提案されました。
LLMが外部記憶を生物の記憶のように自律的に更新する「Memini」というシステムが提案されました。
AI先進企業2社がClaude Design活用術と漫画AIの発明に関するオンラインウェビナーを開催します。
大企業向け生成AI「ChatSense」が、新たにNotebook機能のリリースを予定しています。
SCSKが生成AIを活用したスキル評価システムを共同開発しました。