Normalized Architectures are Natively 4-Bit
nGPTという正規化されたLLMアーキテクチャが、4ビット精度で安定して学習できることが示されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
nGPTという正規化されたLLMアーキテクチャが、4ビット精度で安定して学習できることが示されました。
長期間にわたる複雑なタスクをこなす言語エージェントの学習効率を大幅に向上させる新フレームワーク「BEA…
動画理解LLMの推論能力を向上させる「VISD」という新しい学習フレームワークが発表されました。
Decision TransformerのRTGをシーケンスから外し、状態表現に注入する「SlimDT」が提案されました。
コードLLM向けに、タスクの有用性に基づいた強化学習フレームワーク「ASTOR」が開発されました。
LLMの推論能力向上に向け、リストワイズ方策最適化(LPO)という新しい強化学習手法が提案されました。
個人が過去を語る際に間接的に言及するエンティティを認識するベンチマーク「IRC-Bench」が発表されました…
画像とテキストの不一致を検出するモデルの性能を向上させる新しいデータセット「HNC」が提案されました。
多変量回帰において、条件付きカバレッジを満たす最小体積の予測領域を直接構築する新しい数学的フレーム…
FunctionalAgentは、強相関分子系の電子エネルギー計算に用いるオン・トップ汎関数を自動開発するエージェ…
LLMの各層にトークンインデックスを再注入する新手法「TIDE」が提案されました。
LLMの振る舞いを制御する新しい手法「Memory Inception(MI)」が開発されました。