固定された心理的ペルソナを超えて:言語モデルは「状態」を見落としている
言語モデルがユーザーの状況(状態)を考慮せず、固定的な特性(特性)のみに基づいて応答していることが…
言語モデルがユーザーの状況(状態)を考慮せず、固定的な特性(特性)のみに基づいて応答していることが…
LLMエージェントが自動でデータ処理戦略を生成・最適化し、モデルのファインチューニングを効率化します。
LLM推論の分散アーキテクチャにおいて、アテンションとFFNの最適なリソース比率を決定する分析フレームワ…
LLMが検証不可能なタスクで自己進化できるよう、メタ評価を用いたフレームワークが提案されました。
LLMがプライバシー侵害や著作権侵害などのコンテンツを継続的に忘却する新フレームワーク「FIT」が開発さ…
言語モデルの入力埋め込みと出力射影を分離する新しいTransformerアーキテクチャ「Leviathan」が発表され…
LLMが標準アメリカ英語以外の英語方言を認識し、自然な対話を生成する能力を向上させるフレームワークが開…
勾配降下法がニューラルネットワークの理論的容量をタスクに適合する実効容量に削減するメカニズムが解明…
トランスフォーマーがパリティ問題を解くために必要な最小層数が2層であることを証明しました。
自律型機械学習エンジニアリングにおいて、エージェントの行動停滞を克服する新しい強化学習フレームワー…
マルチモーダルLLMが複雑な推論タスクで生成する情報の信頼性を評価する新しいベンチマークが発表されまし…
Visual Para-Thinkerは、画像理解において並列推論を導入する初のマルチモーダルLLMフレームワークです。