Decomposing the Basic Abilities of Large Language Models: Mitigating Cross-Task Interference in Multi-Task Instruct-Tuning
記事のポイント
📰ニュース
LLMのマルチタスク学習におけるタスク間干渉を低減する新手法「BADIT」が提案されました。
🔍注目ポイント
LLMのパラメータを基本的な能力に分解し、直交性を強制することで干渉を抑制し性能を向上させます。
🔮これからどうなる
より効率的で高性能なLLMの開発が進み、多様なタスクを高い精度でこなせるAIが身近になります。
マルチタスク学習では、異なるタスク間で共有パラメータの勾配が衝突し、性能低下を招く「タスク間干渉」が課題でした。
既存手法はタスク固有パラメータで対応していましたが、共有パラメータの干渉は残っていました。
BADITは、LLMが複数の直交する基本能力をエンコードしているという仮説に基づき、LoRAエキスパートを基本能力として分解し、訓練中に直交性を動的に強制します。
既存手法はタスク固有パラメータで対応していましたが、共有パラメータの干渉は残っていました。
BADITは、LLMが複数の直交する基本能力をエンコードしているという仮説に基づき、LoRAエキスパートを基本能力として分解し、訓練中に直交性を動的に強制します。
LLMが複数の基本能力の組み合わせでタスクをこなすという発想は面白いですね。この技術で、より汎用性の高いAIが実現し、私たちの仕事の効率も上がりそうです。