★4 LLM EN arXiv cs.AI 2026年5月8日 13:00 by Synapse Flow 編集部

LCC-LLM: Leveraging Code-Centric Large Language Models for Malware Attribution

記事のポイント

📰ニュース

コード中心のLLM「LCC-LLM」がマルウェア分析と属性特定に活用されました。

🔍注目ポイント

逆アセンブルされたCコードやアセンブリなど多角的なデータでLLMを訓練し、マルウェア分析の精度を高めています。

🔮これからどうなる

サイバーセキュリティアナリストは、より信頼性の高いマルウェア分析レポートを迅速に得られるようになります。

LCC-LLMは、約3.4万個のPEサンプルからなるベンチマークデータセット「LCCD」を使用し、逆コンパイルされたCコード、アセンブリコード、CFG/FCGアーティファクトなど多様な形式でマルウェアを表現しています。
LangGraphと多層RAGパイプラインを統合し、DeepSeek-R1-Distill-Qwen-14BとQwen3-Coder-30B-A3Bをファインチューニングしました。
これにより、43種類のマルウェア分析タスクで平均0.634のセマンティック類似度を達成し、特に構造化レポート生成やIoC抽出で高い性能を示しました。

💡

編集部の視点

これはサイバーセキュリティ分野に大きな進歩をもたらしそうです。マルウェア分析の自動化が進めば、私たちのデジタルな生活もより安全になるかもしれませんね。

元記事を読む →