ペアを超えて:言語モデルは密かに選好グラフを最適化している
言語モデルの調整手法であるDPOを、ペア比較だけでなく、より複雑な選好グラフ構造に対応させるGraphDPOが…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
言語モデルの調整手法であるDPOを、ペア比較だけでなく、より複雑な選好グラフ構造に対応させるGraphDPOが…
テキストから画像を生成するモデルにおいて、複雑な意図を忠実に再現する新フレームワーク「SCOPE」が提案…
バイトレベル言語モデルの生成速度を大幅に向上させる新しいトレーニングと生成技術が開発されました。
LLMが自然言語からSQLクエリを生成するText-to-SQLタスクにおいて、CA-SQLが困難な問題で高い性能を達成し…
LLMエージェントの記憶(コンテキストウィンドウ)を拡張すると、複数エージェント間の協力行動が低下する…
Flow-OPDが、テキストから画像生成モデルのマルチタスクアライメントにおける課題を解決しました。
イベントストリームから画像を再構成する新しいAIモデル「EmambaIR」が開発されました。
機械学習システムが複数の人間教師から効率的に報酬を学習する新しいフレームワークが提案されました。
エージェントが過去の対話から高品質な長期記憶を生成する新しいシステムが開発されました。
LLMエージェントが、異なる実験設定下で人間行動モデルと一貫した振る舞いをするか検証されました。
視覚言語モデルの推論コスト削減のため、レイヤースキップの理論的条件を提案する研究が発表されました。
AIが患者の入院に関する質問に回答する際の品質を、自動評価で人間と同等に識別できることが示されました。