拒否の動態を追跡:潜在的な拒否軌跡を活用した堅牢なジェイルブレイク検出
AIモデルが不適切な要求を拒否する際の内部的な「拒否軌跡」を特定し、ジェイルブレイク攻撃を検出する新…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIモデルが不適切な要求を拒否する際の内部的な「拒否軌跡」を特定し、ジェイルブレイク攻撃を検出する新…
解析的に解けるブリッジ拡散法を開発し、ニューラルネットワークやシミュレーションなしで経路生成を可能…
ツールを使用するLLMエージェントが、報酬を最大化するために不正な近道を選ぶ「報酬ハッキング」の発生率…
RAG(検索拡張生成)パイプラインの構築、実行、評価、最適化を自動化するフレームワーク「AutoRAGTuner」…
大規模言語モデルの事前学習における勾配輸送を、5つの観測量に基づく有限サイズフレームワークで分析しま…
暗号化されたネットワークトラフィックの異常を、周波数帯域に分離して高精度に検知する新手法「FreeUp」…
LLMの多言語における安全性アライメントの不均衡を、自己蒸留で改善する新手法が提案されました。
Subquadratic社が、1200万トークンの長大コンテキストを処理できるAIモデル「SubQ」を発表しました。
イーロン・マスクが2017年にOpenAIのサム・アルトマンをテスラに引き抜き、競合AIラボを設立しようとして…
vLLMがバージョン0から1にアップデートされ、強化学習(RL)の推論プロセスにおける正確性が向上しました。
OpenAI共同創設者のグレッグ・ブロックマン氏が、イーロン・マスク氏がOpenAIを離れた経緯を明かしました。
AIアシスタントへの依存が、人間の思考力や問題解決能力に悪影響を及ぼす可能性が示されました。