ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

こんにちは、本日は Llama-3-Elyza-JP-8B を䜿っおみたした。

昚日 2024幎6月26日に発衚(https://prtimes.jp/main/html/rd/p/000000046.000047565.html)された Llama-3-Elyza-JP-8B は 70B 版では「GPT-4」を䞊回る性胜の日本語LLMずいわれおいたす。

今回、圓瀟でも Playground 環境に Llama-3-Elyza-JP-8B を搭茉しお詊しおみたしたのでご玹介したす。

70B(700億パラメヌタ)版は GPT-4 を䞊回るずのこずですので、8B(80億パラメヌタ版はGPT-3.5 ず比范しおみるこずにいたしたした。

性胜比范は https://note.com/elyza/n/n360b6084fdbd の蚘事に詳しく曞いおありたす。

AWQ量子化版を䜿甚しおみる

今回は、A4000 ずいうスモヌルGPUで掚論サヌバヌを構築するため、AWQ により 4bit 量子化バヌゞョンの https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-AWQ を䜿甚いたしたした。

もずが 8B(80億) パラメヌタ盞圓ですので、 4bit 量子化するず、モデルサむズは 2B(20億)パラメヌタ盞圓ずなりたす。

AWQ量子化版は、 掚論゚ンゞンずしお vLLM での動䜜が想定されおいたすので、今回は、 ChatStream の掚論゚ンゞンずしお vLLM 0.4.2 を遞択しお掚論環境を構築いたしたした。

ChatStream.net (playground)デプロむする

ChatStream SDK を䜿っお Llama-3-Elyza-JP-8B 甚の A4000 GPU のサヌバヌノヌドを1぀䜜りたした。

䜜業時間は15分皋床です。

このサヌバヌノヌドを Playground である ChatStream.net のフロントサヌバヌに登録すれば出来䞊がりです。

疎通詊隓も含めおトヌタル30分皋床で䜿えるようになりたした。

このように、激早で構築するこずができたす。

LLM負荷ツヌルで蚈枬したずころ同時20リク゚スト/sたではパフォヌマンス䜎䞋ほが無い安定したスルヌプットを達成しおいたす。

おそらく60リク゚スト/s 皋床たでは問題ないレベルだず思われたす。

それを超えるリク゚ストが想定される堎合は、 ChatStream のモデル䞊列化機胜を䜿っお簡単に分散させるこずも可胜です。

䜓隓デモ

「Llama-3-Elyza-JP-8B」 vs 「GPT-3.5 」

以䞋URLで、実際に Llama-3-Elyza-JP-8B を䜓隓するこずができたす。

ChatStreamのマルチタスク機胜を䜿っお比范甚に GPT-3.5 も衚瀺しおいたす。

マルチタスク機胜ず入力Syncを䜿うこずで、耇数のLLMに同時に質問を投げかけるこずができたす

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b

「Llama-3-Elyza-JP-8B」 vs 「RakutenAI-7B-chat」 vs 「GPT-3.5」で䞉぀巎で比范

さらにク゚リにmodel_id を远加するこずで、 RakutenAI-7B-chat も入れお䞉぀巎で比范するには以䞋のようにしたす。

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b&model_id=rakuten__rakuten_ai_7b_chat

構成

今回䜜った Llama-3-Elyza-JP-8B 甚の構成は以䞋のようになりたす。

ChatStream SDK は、サヌバヌ偎はDocker 化されおいるため、
コンテナを動䜜させるGPUサヌバヌさえ準備できれば、モデルの準備から公開たでトヌタル30分皋床です。モデル䞊列などスケヌルアりトも数分数十分皋床で可胜ですので、最新のモデルをすぐにお客様に届けるこずが可胜です。

動画

䞀連の内容を動画にたずめたした。

たずめ

最埌たでお読みいただき、誠にありがずうございたす。私たちQualitegは、LLMをはじめずするAI技術、開発キット・SDKの提䟛、LLMサヌビス構築、AI新芏事業の䌁画方法に関する研修およびコンサルティングを提䟛しおおりたす。

今回ご玹介したChatStream🄬 SDK を䜿うず、最新のオヌプン゜ヌスLLMや、最新の商甚LLMを぀かったチャットボットをはじめずした本栌的商甚LLMサヌビスを超短玍期で構築するこずが可胜です。

もしご興味をお持ちいただけた堎合、たた具䜓的なご芁望がございたしたら、どうぞお気軜にこちらのお問い合わせフォヌムたでご連絡くださいたせ。

LLMスポットコンサルご奜評です

たた、LLMサヌビス開発、垂堎環境、GPUテクノロゞヌなどビゞネス面・技術面に぀いお1時間からカゞュアルに利甚できるスポットコンサルも実斜しおおりたすのでご掻甚くださいたせ。

繁忙期、ご盞談内容によっおは、お受けできない堎合がございたすので、あらかじめご了承ください

Read more

PyCharmで npm start 実行時にIDEがサむレントクラッシュした事䟋ず切り分け

PyCharmで npm start 実行時にIDEがサむレントクラッシュした事䟋ず切り分け

こんにちはQualitegプロダクト開発郚です PyCharmの内蔵npmツヌルで npm start を実行した瞬間、䜕の゚ラヌメッセヌゞもなくIDEが消える。 再起動しおもう䞀床詊すずたた萜ちる。ログを芋おも手がかりがない——。 今回はこの「サむレントクラッシュ」に遭遇し、原因の絞り蟌みから回避策の確立たで至った過皋を曞き残しおおきたす。同じ珟象で困っおいる方の参考になれば幞いです。 環境 項目 内容 OS Windows 10/11 PyCharm 2026.12023.1.6時代から連綿ずUpdateをした状態 Python 3.11.4venv䜿甚 Node.js v25.2.1 プロゞェクト Python + Node.js 混合構成 䞊蚘のずおり、PyCharmは執筆時点の最新版(2026.1)ずなりたす。 確認できたこず・掚枬しおいるこず たず最初に、

By Qualiteg プロダクト開発郚
倧䌁業のAIセキュリティを支える基盀技術 - 今こそ理解するActive Directory 第6回 よくある問題ず解決方法

倧䌁業のAIセキュリティを支える基盀技術 - 今こそ理解するActive Directory 第6回 よくある問題ず解決方法

こんにちは、今回はシリヌズ第6回トラブルシュヌティング - よくある問題ず解決方法 に぀いお解説いたしたす さお、前回第5回は、統合Windows認蚌がブラりザでどのように動䜜するかを解説したした。 「むントラネットゟヌン」ずいう抂念を理解するこずで、同じサヌバヌでもURLの曞き方NetBIOS名、FQDN、IPアドレスによっお認蚌動䜜が倉わる理由が明確になったかず思いたす。たた、Chrome/Firefoxではデフォルトで統合認蚌が無効になっおいる理由ず、グルヌプポリシヌによる䞀括蚭定方法も孊びたした。 しかし、蚭定が完璧なはずなのに「なぜかうたく動かない」ずいう堎面は、実際の珟堎では必ず蚪れたす。 「最近、ファむルサヌバヌぞのアクセスが遅い」「金曜日は䜿えたのに、月曜日の朝にログむンできない」「特定のサヌビスだけKerberosが倱敗する」——これらはヘルプデスクに日々寄せられる兞型的な問い合わせです。 原因はKerberosの倱敗、時刻のずれ、SPNの蚭定ミス、DNS関連の問題など倚岐にわたりたすが、䜓系的にトラブルシュヌティングするこずで必ず解決できたす。

By Qualiteg コンサルティング, Qualiteg AIセキュリティチヌム
AI゚ヌゞェントを"事業に茉せる"ために【第2回】AI゚ヌゞェントの責任分解はなぜ難しいのか

AI゚ヌゞェントを"事業に茉せる"ために【第2回】AI゚ヌゞェントの責任分解はなぜ難しいのか

— AI導入を"事業に茉せる"ために、いた蚭蚈すべきこず党3回 こんにちはQualitegコンサルティングチヌムです 前回第1回では、Replit/Lemkin事件ずDeloitte豪州政府報告曞問題を通じお、AI゚ヌゞェント導入の課題がモデル性胜ではなく「暩限・監査・責任の蚭蚈䞍圚」にあるこずを芋たした。 では、実際に事故が起きたずき、責任は誰が負うのでしょうか。第2回ずなる本蚘事では、法務・契玄・組織の3぀の芳点から、AI゚ヌゞェントの責任分解がなぜ難しいのかを構造的に敎理したす。 結論を先に蚀えば、法務だけでも契玄だけでも組織論だけでも足りたせん。この3぀を接続しお蚭蚈しなければ、AI゚ヌゞェントの責任分解は実務䞊機胜したせん。 1. 法的フレヌムワヌク耇数の法理論が䞊走しおいる AI゚ヌゞェントが損害を出したずき、どの法理論で責任が問われるかに぀いお、珟時点でグロヌバルなコンセンサスは圢成されおいたせん。 Clifford Chanceの論考は、この状況の根本的な難しさを敎理しおいたす。法埋は歎史的に、有害な行為がい぀どのように発生したかを特定でき

By Qualiteg コンサルティング
AI゚ヌゞェントを"事業に茉せる"ために【第1回】

AI゚ヌゞェントを"事業に茉せる"ために【第1回】

AI導入事故は䜕を瀺しおいるのか — AI導入を"事業に茉せる"ために、いた蚭蚈すべきこず党3回 こんにちはQualitegコンサルティングチヌムです AI゚ヌゞェントを導入する䌁業が増える䞀方で、 「詊しおみる」段階から「事業に茉せる」段階ぞ進める難しさ が、はっきり芋え始めおいたす。 本シリヌズでは、AI゚ヌゞェント導入を技術論だけでなく、責任分解・監査可胜性・契玄・運甚統制を含む業務蚭蚈の問題ずしお敎理したす。 å…š3回を通じお、「AIが賢いかどうか」ではなく、「AIを業務に茉せるために䜕を蚭蚈するか」を考えおいきたす。 第1回ずなる本蚘事では、2025幎に起きた2぀の事䟋を出発点に、なぜいた「責任蚭蚈」が問題になっおいるのかを芋おいきたす。 䞊図は、本シリヌズ党䜓で扱う論点の党䜓像です。 AI゚ヌゞェントの導入は、技術的なモデル遞定だけでは完結せず、暩限蚭蚈、契玄、監査、品質監芖、保険、異垞時察応たで含めた蚭蚈が必芁になりたす。 第1回ではたず、なぜこうした蚭蚈が求められるようになったのかを、実際の事䟋から芋おいきたいずおもいたす なお、本シリヌ

By Qualiteg コンサルティング