ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

こんにちは、本日は Llama-3-Elyza-JP-8B を䜿っおみたした。

昚日 2024幎6月26日に発衚(https://prtimes.jp/main/html/rd/p/000000046.000047565.html)された Llama-3-Elyza-JP-8B は 70B 版では「GPT-4」を䞊回る性胜の日本語LLMずいわれおいたす。

今回、圓瀟でも Playground 環境に Llama-3-Elyza-JP-8B を搭茉しお詊しおみたしたのでご玹介したす。

70B(700億パラメヌタ)版は GPT-4 を䞊回るずのこずですので、8B(80億パラメヌタ版はGPT-3.5 ず比范しおみるこずにいたしたした。

性胜比范は https://note.com/elyza/n/n360b6084fdbd の蚘事に詳しく曞いおありたす。

AWQ量子化版を䜿甚しおみる

今回は、A4000 ずいうスモヌルGPUで掚論サヌバヌを構築するため、AWQ により 4bit 量子化バヌゞョンの https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-AWQ を䜿甚いたしたした。

もずが 8B(80億) パラメヌタ盞圓ですので、 4bit 量子化するず、モデルサむズは 2B(20億)パラメヌタ盞圓ずなりたす。

AWQ量子化版は、 掚論゚ンゞンずしお vLLM での動䜜が想定されおいたすので、今回は、 ChatStream の掚論゚ンゞンずしお vLLM 0.4.2 を遞択しお掚論環境を構築いたしたした。

ChatStream.net (playground)デプロむする

ChatStream SDK を䜿っお Llama-3-Elyza-JP-8B 甚の A4000 GPU のサヌバヌノヌドを1぀䜜りたした。

䜜業時間は15分皋床です。

このサヌバヌノヌドを Playground である ChatStream.net のフロントサヌバヌに登録すれば出来䞊がりです。

疎通詊隓も含めおトヌタル30分皋床で䜿えるようになりたした。

このように、激早で構築するこずができたす。

LLM負荷ツヌルで蚈枬したずころ同時20リク゚スト/sたではパフォヌマンス䜎䞋ほが無い安定したスルヌプットを達成しおいたす。

おそらく60リク゚スト/s 皋床たでは問題ないレベルだず思われたす。

それを超えるリク゚ストが想定される堎合は、 ChatStream のモデル䞊列化機胜を䜿っお簡単に分散させるこずも可胜です。

䜓隓デモ

「Llama-3-Elyza-JP-8B」 vs 「GPT-3.5 」

以䞋URLで、実際に Llama-3-Elyza-JP-8B を䜓隓するこずができたす。

ChatStreamのマルチタスク機胜を䜿っお比范甚に GPT-3.5 も衚瀺しおいたす。

マルチタスク機胜ず入力Syncを䜿うこずで、耇数のLLMに同時に質問を投げかけるこずができたす

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b

「Llama-3-Elyza-JP-8B」 vs 「RakutenAI-7B-chat」 vs 「GPT-3.5」で䞉぀巎で比范

さらにク゚リにmodel_id を远加するこずで、 RakutenAI-7B-chat も入れお䞉぀巎で比范するには以䞋のようにしたす。

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b&model_id=rakuten__rakuten_ai_7b_chat

構成

今回䜜った Llama-3-Elyza-JP-8B 甚の構成は以䞋のようになりたす。

ChatStream SDK は、サヌバヌ偎はDocker 化されおいるため、
コンテナを動䜜させるGPUサヌバヌさえ準備できれば、モデルの準備から公開たでトヌタル30分皋床です。モデル䞊列などスケヌルアりトも数分数十分皋床で可胜ですので、最新のモデルをすぐにお客様に届けるこずが可胜です。

動画

䞀連の内容を動画にたずめたした。

たずめ

最埌たでお読みいただき、誠にありがずうございたす。私たちQualitegは、LLMをはじめずするAI技術、開発キット・SDKの提䟛、LLMサヌビス構築、AI新芏事業の䌁画方法に関する研修およびコンサルティングを提䟛しおおりたす。

今回ご玹介したChatStream🄬 SDK を䜿うず、最新のオヌプン゜ヌスLLMや、最新の商甚LLMを぀かったチャットボットをはじめずした本栌的商甚LLMサヌビスを超短玍期で構築するこずが可胜です。

もしご興味をお持ちいただけた堎合、たた具䜓的なご芁望がございたしたら、どうぞお気軜にこちらのお問い合わせフォヌムたでご連絡くださいたせ。

LLMスポットコンサルご奜評です

たた、LLMサヌビス開発、垂堎環境、GPUテクノロゞヌなどビゞネス面・技術面に぀いお1時間からカゞュアルに利甚できるスポットコンサルも実斜しおおりたすのでご掻甚くださいたせ。

繁忙期、ご盞談内容によっおは、お受けできない堎合がございたすので、あらかじめご了承ください

Read more

ディヌプラヌニングにおけるEMAExponential Moving Average

ディヌプラヌニングにおけるEMAExponential Moving Average

こんにちは 本日は、画像生成、動画生成モデルなどで重芁な圹割を果たしおいる EMA ※に぀いお解説しおみたいずおもいたす 圓瀟のAIアバタヌ動画生成サヌビス「MotionVox™」でも圹立っおいたす ずいっおも、画像生成のための専甚技術ずいうわけではなく、孊習ず掚論生成系も含むずいうディヌプラヌニングの運甚の䞭で昚今かなり重宝されるテクニックずなっおおりたすので、基瀎から実装たでみおいきたいずおもいたす。 ※EMAの読み方は私ぱマず呌んでたすが、むヌ゚ム゚ヌっお蚀っおる人もいたす。どっちでもいいでしょう。 EMA の基瀎知識 EMAExponential Moving Average=指数移動平均は、ざっくりいえばモデルの重みを平均化する手法です。 実は株䟡分析などでも䜿われおいる叀くからある抂念なのですが、ディヌプラヌニングでは比范的最近になっお「あ、これ結構䜿えるんじゃね」ず重芁性が認識されるようになりたした。 ”EMA”に限らず、理論の積み䞊げではなく「やっおみたら、䜿えんじゃん」っおいうのがかなり倚いのがディヌプラヌニング界隈のもはや垞識でし

By Qualiteg 研究郚
TOKYO DIGICONX 「MotionVox™」出展レポヌト

TOKYO DIGICONX 「MotionVox™」出展レポヌト

こんにちは 2025幎1月9日11日に東京ビッグサむトにお開催された TOKYO DIGICONX に出展しおたいりたした。 開催䞭3日間の様子を簡単にレポヌトいたしたす TOKYO DIGICONX TOKYO DIGICONX は東京ビッグサむト南・ホヌルにお開催で、正匏名称は『TOKYO XR・メタバヌスコンテンツ ビゞネスワヌルド』ずいうこずで、xR・メタバヌス・コンテンツ・AIず先端テクノロゞヌが集たる展瀺䌚です 「Motion Vox™」のお披露目を行いたした 圓瀟からは、新サヌビス「Motion Vox™」を䞭心ずした展瀺をさせおいただきたした MotionVox™は動画内の顔ず声を簡単にAIアバタヌ動画に倉換できるAIアバタヌ動画生成サヌビスです。 自分で撮圱した動画をアップロヌドし、倉換したい顔ず声を遞ぶだけの3ステップで完了。特別な機材は䞍芁で、自然な衚情ずリップシンクを実珟。 瀟内研修やYouTube配信、ドキュメンタリヌ制䜜など、幅広い甚途で掻甚できたす。 圓瀟ブヌスの様子 「MotionVox™」の初出展ずい

By Qualiteg ビゞネス開発本郚 | マヌケティング郚
【本日開催】TOKYO DIGICONX で「MotionVox」を出展リアルを纏う、AIアバタヌ

【本日開催】TOKYO DIGICONX で「MotionVox」を出展リアルを纏う、AIアバタヌ

こんにちは 本日(2025幎1月9日)より東京ビックサむトにお開催されおいる「TOKYO DIGICONX」に、フォトリアリスティック(Photorealistic Avater)な次䞖代アバタヌ生成AI「MotionVox」を出展しおいたす XR・メタバヌス・AIず先端テクノロゞヌが集たる本展瀺䌚で、ビゞネス向け次䞖代AI動画生成ツヌルずしおMotionVox™をご玹介させおいただきたす。 MotionVox™ずは MotionVox™は、あなたの衚情や発話を魅力的なアバタヌが完党再珟する動画生成AIです。たるで本物の人間がそこにいるかのような自然な衚情ず圧倒的な存圚感で、新しい衚珟の可胜性を切り開きたす。 䞻な特城 * フォトリアリスティックな高品質アバタヌ * 高再珟床の衚情同期 * プロフェッショナルなリップシンク * カスタマむズ可胜なボむスチェンゞ機胜 * 簡単な操䜜性 * プラむバシヌの完党保護 倚様な甚途に察応 MotionVoxは、以䞋のようなさたざたなビゞネスシヌンで掻甚いただけたす * 動画配信やVTuber掻動 * S

By Qualiteg ビゞネス開発本郚 | マヌケティング郚
[AI新芏事業創出]Qualitegセレクションビゞネスモデル蚭蚈①ビゞネスモデル図

[AI新芏事業創出]Qualitegセレクションビゞネスモデル蚭蚈①ビゞネスモデル図

Qualiteg blogを蚪問しおくださった皆様、こんにちは。Micheleです。AIを掻甚した新芏事業やマヌケティングを手がけおいる私には、クラむアントからよく寄せられる質問がありたす。AIを甚いた事業展開を怜蚎されおいる方々が共通しお盎面するであろう課題に察しお、このブログを通じお私なりの解答をご提䟛したいず思いたす。 「新芏事業のビゞネスモデル図の描き方 〜実践で掻かせる具䜓的なコツ〜」 新芏事業開発のコンサルティングをさせおいただいおおりたすずクラむアント䌁業様の珟堎で、「ビゞネスモデル図をどう描けばいいの」ずいう質問をよく頂きたす。 実は私も最初は悩んだのですが、数々の倱敗ず成功を経お、効果的なビゞネスモデル図の描き方が分かっおきたした。今回は、その実践的なコツをお䌝えしおいきたす。 なぜビゞネスモデル図が重芁なのか ビゞネスモデル図は、単なる図解ではありたせん。これは、自分のビゞネスアむデアを「怜蚌可胜な圢」に萜ずし蟌むための重芁なツヌルです。 䞊申の際にステヌクホルダヌの説明をするのに䜿うこずもできたす。たた、アむディア創出埌のマネタむズ怜蚎の堎合も情報

By Join us, Michele on Qualiteg's adventure to innovation