ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

こんにちは、本日は Llama-3-Elyza-JP-8B を䜿っおみたした。

昚日 2024幎6月26日に発衚(https://prtimes.jp/main/html/rd/p/000000046.000047565.html)された Llama-3-Elyza-JP-8B は 70B 版では「GPT-4」を䞊回る性胜の日本語LLMずいわれおいたす。

今回、圓瀟でも Playground 環境に Llama-3-Elyza-JP-8B を搭茉しお詊しおみたしたのでご玹介したす。

70B(700億パラメヌタ)版は GPT-4 を䞊回るずのこずですので、8B(80億パラメヌタ版はGPT-3.5 ず比范しおみるこずにいたしたした。

性胜比范は https://note.com/elyza/n/n360b6084fdbd の蚘事に詳しく曞いおありたす。

AWQ量子化版を䜿甚しおみる

今回は、A4000 ずいうスモヌルGPUで掚論サヌバヌを構築するため、AWQ により 4bit 量子化バヌゞョンの https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-AWQ を䜿甚いたしたした。

もずが 8B(80億) パラメヌタ盞圓ですので、 4bit 量子化するず、モデルサむズは 2B(20億)パラメヌタ盞圓ずなりたす。

AWQ量子化版は、 掚論゚ンゞンずしお vLLM での動䜜が想定されおいたすので、今回は、 ChatStream の掚論゚ンゞンずしお vLLM 0.4.2 を遞択しお掚論環境を構築いたしたした。

ChatStream.net (playground)デプロむする

ChatStream SDK を䜿っお Llama-3-Elyza-JP-8B 甚の A4000 GPU のサヌバヌノヌドを1぀䜜りたした。

䜜業時間は15分皋床です。

このサヌバヌノヌドを Playground である ChatStream.net のフロントサヌバヌに登録すれば出来䞊がりです。

疎通詊隓も含めおトヌタル30分皋床で䜿えるようになりたした。

このように、激早で構築するこずができたす。

LLM負荷ツヌルで蚈枬したずころ同時20リク゚スト/sたではパフォヌマンス䜎䞋ほが無い安定したスルヌプットを達成しおいたす。

おそらく60リク゚スト/s 皋床たでは問題ないレベルだず思われたす。

それを超えるリク゚ストが想定される堎合は、 ChatStream のモデル䞊列化機胜を䜿っお簡単に分散させるこずも可胜です。

䜓隓デモ

「Llama-3-Elyza-JP-8B」 vs 「GPT-3.5 」

以䞋URLで、実際に Llama-3-Elyza-JP-8B を䜓隓するこずができたす。

ChatStreamのマルチタスク機胜を䜿っお比范甚に GPT-3.5 も衚瀺しおいたす。

マルチタスク機胜ず入力Syncを䜿うこずで、耇数のLLMに同時に質問を投げかけるこずができたす

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b

「Llama-3-Elyza-JP-8B」 vs 「RakutenAI-7B-chat」 vs 「GPT-3.5」で䞉぀巎で比范

さらにク゚リにmodel_id を远加するこずで、 RakutenAI-7B-chat も入れお䞉぀巎で比范するには以䞋のようにしたす。

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b&model_id=rakuten__rakuten_ai_7b_chat

構成

今回䜜った Llama-3-Elyza-JP-8B 甚の構成は以䞋のようになりたす。

ChatStream SDK は、サヌバヌ偎はDocker 化されおいるため、
コンテナを動䜜させるGPUサヌバヌさえ準備できれば、モデルの準備から公開たでトヌタル30分皋床です。モデル䞊列などスケヌルアりトも数分数十分皋床で可胜ですので、最新のモデルをすぐにお客様に届けるこずが可胜です。

動画

䞀連の内容を動画にたずめたした。

たずめ

最埌たでお読みいただき、誠にありがずうございたす。私たちQualitegは、LLMをはじめずするAI技術、開発キット・SDKの提䟛、LLMサヌビス構築、AI新芏事業の䌁画方法に関する研修およびコンサルティングを提䟛しおおりたす。

今回ご玹介したChatStream🄬 SDK を䜿うず、最新のオヌプン゜ヌスLLMや、最新の商甚LLMを぀かったチャットボットをはじめずした本栌的商甚LLMサヌビスを超短玍期で構築するこずが可胜です。

もしご興味をお持ちいただけた堎合、たた具䜓的なご芁望がございたしたら、どうぞお気軜にこちらのお問い合わせフォヌムたでご連絡くださいたせ。

LLMスポットコンサルご奜評です

たた、LLMサヌビス開発、垂堎環境、GPUテクノロゞヌなどビゞネス面・技術面に぀いお1時間からカゞュアルに利甚できるスポットコンサルも実斜しおおりたすのでご掻甚くださいたせ。

繁忙期、ご盞談内容によっおは、お受けできない堎合がございたすので、あらかじめご了承ください

Read more

【出展報告】ASCII STARTUP TechDay 2025

【出展報告】ASCII STARTUP TechDay 2025

こんにちは 本日、「ASCII STARTUP TechDay 2025」に出展しおたいりたしたのでレポヌトさせおいただきたす ASCII STARTUP TechDay 2025 ASCII STARTUP TechDay 2025は、2025幎11月17日月に東京・浅草橋ヒュヌリックホヌル&カンファレンスで開催された、ディヌプテック・スタヌトアップの゚コシステム構築をテヌマにした展瀺亀流・カンファレンスむベントです。 秋の展瀺䌚は本圓にいいですね 本日はずおもよいお倩気で、涌しくお、展瀺䌚にはピッタリの気候で朝からルンルンでした。しかも午埌からの展瀺䌚ずいうこずで、気持ちに䜙裕をもっお朝の業務をこなしおいたずころ、けっこうすぐに昌前になり、あわおお珟堎ぞ。 浅草橋は圓瀟からもわりず近いずいう立地の良さを甘く芋おおりたしたが💊、なんずか予定時刻前に到着したした。やっぱり、郜心開催は本圓にありがたいですね。 䌚堎ぞ急いでいるず、おなかが「ぐ」ず鳎り 「そういえば、朝食ただだったわ」 ずおもったずころに、なんず私の倧奜きな゚ッセンさん🍞のトラックがあるで

By Qualiteg ビゞネス開発本郚 | マヌケティング郚
サブスクビゞネス完党攻略 第1回『アヌプがさぁ...』『チャヌンがさぁ...』にもう困らない完党ガむド

サブスクビゞネス完党攻略 第1回『アヌプがさぁ...』『チャヌンがさぁ...』にもう困らない完党ガむド

なぜサブスクリプションモデルが䞖界を倉えおいるのか、でもAI台頭でSaaSは終わっおしたうの こんにちは Qualitegコンサルティングです 新芏事業戊略コンサルタントずしお日々クラむアントず向き合う䞭で、ここ最近特に増えおいるのがSaaSビゞネスに関する盞談です。興味深いのは、その背景にある動機の倚様性です。玔粋に収益モデルを改善したい䌁業もあれば、 「SaaS化を通じお、うちもデゞタルネむティブ䌁業ずしお芋られたい」 ずいう願望を持぀䌝統的な倧䌁業も少なくありたせん。 SaaSずいう蚀葉が日本のビゞネスシヌンに本栌的に浞透し始めたのは2010幎代前半。それから玄15幎が経ち、今やSaaSは「先進的な䌁業の蚌」のように扱われおいたす。 たず SaaSは「サヌズ」ず読みたす。 「サヌス」でも間違ではありたせん、どっちもアリです ほかにも、 MRR、ARR、アヌプ、チャヌンレヌト、NRR、Rule of 40

 こうした暪文字が飛び亀う経営䌚議に、戞惑いながらも「乗り遅れおはいけない」ず焊る新芏事業担圓者の姿をよく目にしたす。 しかし䞀方で、2024

By Qualiteg コンサルティング
ASCII STARTUP TechDay 2025に出展したす

ASCII STARTUP TechDay 2025に出展したす

株匏䌚瀟Qualitegは、2025幎11月17日月に東京・浅草橋ヒュヌリックホヌルカンファレンスで開催される「ASCII STARTUP TechDay 2025」に出展いたしたす。 むベント抂芁 「ASCII STARTUP TechDay 2025」は、日本のディヌプテック゚コシステムを次のレベルぞ抌し䞊げ、新産業を創出するむノベヌションカンファレンスです。ディヌプテック・スタヌトアップの成長を支える゚コシステムの構築、そしお成長・発展を目的に、孊術、産業、行政の垣根を越えお知を結集する堎ずしお開催されたす。 開催情報 * 日時2025幎11月17日月13:0018:00 * 䌚堎東京・浅草橋ヒュヌリックホヌルカンファレンス * 䜏所〒111-0053 東京郜台東区浅草橋1-22-16ヒュヌリック浅草橋ビル * アクセスJR総歊線「浅草橋駅西口」より埒歩1分 出展内容 圓瀟ブヌスでは、以䞋の3぀の䞻芁サヌビスをご玹介いたしたす。 1.

By Qualiteg ニュヌス
倧䌁業のAIセキュリティを支える基盀技術 - 今こそ理解するActive Directory 第4回 プロキシサヌバヌず統合Windows認蚌

倧䌁業のAIセキュリティを支える基盀技術 - 今こそ理解するActive Directory 第4回 プロキシサヌバヌず統合Windows認蚌

11月に入り、朝晩の冷え蟌みが本栌的になっおきたしたね。オフィスでも暖房を入れ始めた方も倚いのではないでしょうか。 枩かいコヌヒヌを片手に、シリヌズ第4回「プロキシサヌバヌず統合Windows認蚌」をお届けしたす。 さお、前回第3回は、クラむアントPCやサヌバヌをドメむンに参加させる際の「信頌関係」の確立に぀いお深掘りしたした。コンピュヌタヌアカりントが120文字のパスワヌドで自動認蚌される仕組みを理解いただけたこずで、今回のプロキシサヌバヌの話もスムヌズに入っおいけるはずです。 ChatGPTやClaudeぞのアクセスを監芖する䞭間プロキシを構築する際、最も重芁なのが「確実なナヌザヌ特定」です。せっかくHTTPS通信をむンタヌセプトしお入出力内容を蚘録できおも、アクセス元が「tanaka_t」なのか「yamada_h」なのかが分からなければ、監査ログずしおの䟡倀は半枛しおしたいたす。 今回は、プロキシサヌバヌ自䜓をドメむンメンバヌずしお動䜜させるこずで、Kerberosチケットの怜蚌を可胜にし、透過的なナヌザヌ認蚌を実珟する方法を詳しく解説したす。Windows版Squid

By Qualiteg AIセキュリティチヌãƒ