LLMのように操縦する:プロンプトを模倣する活性化ステアリング
LLMの活性化ステアリングが、プロンプトベースの手法に匹敵する性能を達成する新フレームワークが提案され…
LLMの活性化ステアリングが、プロンプトベースの手法に匹敵する性能を達成する新フレームワークが提案され…
言語モデルが哲学的概念の定義を反例を用いて反復的に分析・修正する能力を研究しました。
臨床LLMの安全性と精度が、モデル規模の拡大とは異なる法則で変化することが判明しました。
VLMを活用し、複数のAIエージェントが協調して行動する新たなフレームワーク「COMPASS」が開発されました。
分布型強化学習において、正規化フローと新しい距離指標を使い、パラメータ効率を大幅に向上させる手法「N…
大規模言語モデル(LLM)を活用し、論文を対話型知識システムに変える「エージェント型出版」の概念が提案…
LLMベースのエージェントが外部ツールを使用する際の原則として、「認識論的に必要な場合のみ」という基準…
ベンチャーキャピタル分野で創業者の成功を予測する初のLLM向けベンチマーク「VCBench」が発表されました。
LLMエージェントが長期的タスクで計画と実行を分離する新しい階層的学習フレームワーク「HiMAC」が開発さ…
LLMなどの汎用AIエージェントの非推移的な相互作用を評価する新しいフレームワークが発表されました。
AIエージェントが自律的に行動すべきか、助けを求めるべきかを判断する能力を測る新しいベンチマーク「HiL…
LLMエージェントが実際のハードウェアバグを修正する能力を評価する大規模ベンチマーク「HWE-Bench」が発…