AI評価の標準化に向けて:実世界のユースケースから評価シナリオへ
AIシステムの評価方法論における「リンゴとオレンジ」のような比較を解消するため、標準化された評価シナ…
AIシステムの評価方法論における「リンゴとオレンジ」のような比較を解消するため、標準化された評価シナ…
LLMが選択するツールがモデル内部で線形に読み取り可能かつ操作可能であることが判明しました。
グラフ構造ハイパーディメンショナルコンピューティング(PSP-HDC)が、少ないデータで複雑な3D微細構造の…
AIの機械的解釈可能性研究が因果関係を主張する際に、必要な識別仮定を明示していないことが指摘されまし…
スパイクニューラルネットワーク(SNN)の学習における、グローバル最適解を導く新しいアルゴリズムが提案…
言語モデルの調整手法であるDPOを、ペア比較だけでなく、より複雑な選好グラフ構造に対応させるGraphDPOが…
テキストから画像を生成するモデルにおいて、複雑な意図を忠実に再現する新フレームワーク「SCOPE」が提案…
バイトレベル言語モデルの生成速度を大幅に向上させる新しいトレーニングと生成技術が開発されました。
LLMが自然言語からSQLクエリを生成するText-to-SQLタスクにおいて、CA-SQLが困難な問題で高い性能を達成し…
LLMエージェントの記憶(コンテキストウィンドウ)を拡張すると、複数エージェント間の協力行動が低下する…
Flow-OPDが、テキストから画像生成モデルのマルチタスクアライメントにおける課題を解決しました。
イベントストリームから画像を再構成する新しいAIモデル「EmambaIR」が開発されました。