Optimum-NVIDIA:たった1行のコードで超高速LLM推論を実現
Hugging FaceがNVIDIA GPU向けに最適化されたLLM推論ライブラリ「Optimum-NVIDIA」を発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Hugging FaceがNVIDIA GPU向けに最適化されたLLM推論ライブラリ「Optimum-NVIDIA」を発表しました。
Hugging FaceがLoRAモデルの推論速度を300%向上させる技術を開発しました。
AWS Inferentia2を利用することで、Llamaモデルの推論速度が大幅に向上しました。
アノテーションツールProdigyがHugging Faceモデルと直接連携可能になりました。
OpenAIがユーザーが独自のカスタムChatGPTを作成できる「GPTs」を発表しました。
OpenAIがGPT-4 Turbo、新しいAssistants API、DALL·E 3 APIなどを発表しました。
Hugging Face Hubが、モデルやデータセットの保存場所として複数のストレージリージョンを導入しました。
Hugging Faceがユーザーが自身のコードベースで訓練できるパーソナルなコーディングアシスタント「Persona…
Hugging Faceデータセットを一行のPythonコードで対話的に探索できる新機能がリリースされました。
Hugging Faceが埋め込みモデルのデプロイを容易にする新機能を発表しました。
OpenAIの画像生成AI「DALL·E 3」がChatGPT PlusおよびEnterpriseユーザー向けに提供開始されました。
Gradio-Liteは、サーバーなしでブラウザ内でGradioアプリを直接実行できる新技術です。