長いプロンプトが他のリクエストをブロックする仕組み - LLMパフォーマンスの最適化
LLMにおいて、長いプロンプトがGPUリソースを占有し、他のリクエストの処理を遅延させる問題が指摘されま…
LLMにおいて、長いプロンプトがGPUリソースを占有し、他のリクエストの処理を遅延させる問題が指摘されま…
Hugging Faceが、AIモデル開発を加速するKernel Hubを公開しました。
Hugging Faceが推論プロバイダーでFeatherless AIをサポート開始しました。
OpenAIとマテルが提携し、バービーやホットウィールなどの人気ブランドにAIを統合します。
Hugging FaceがNVIDIAと提携し、AIモデル学習用のクラスタをサービスとして提供開始しました。
GUIエージェントの性能を包括的に評価するための新しいスイート「ScreenSuite」が発表されました。
Google DeepMindがGemini 2.5のAI音声対話・生成能力の向上を発表しました。
ArmベースのデバイスでリアルタイムAIサウンド生成が可能になった。
Hugging FaceがGUI自動化に特化した新しいVLM(視覚言語モデル)ファミリー「Holo1」を発表しました。
WixがOpenAIを活用したAIウェブサイトビルダーを発表しました。
Hugging FaceがLiger GRPOとTRLの連携を発表しました。
DellがHugging Faceとの提携により、オンプレミスAI構築を支援する「Dell Enterprise Hub」を発表しました…