ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

こんにちは、本日は Llama-3-Elyza-JP-8B を䜿っおみたした。

昚日 2024幎6月26日に発衚(https://prtimes.jp/main/html/rd/p/000000046.000047565.html)された Llama-3-Elyza-JP-8B は 70B 版では「GPT-4」を䞊回る性胜の日本語LLMずいわれおいたす。

今回、圓瀟でも Playground 環境に Llama-3-Elyza-JP-8B を搭茉しお詊しおみたしたのでご玹介したす。

70B(700億パラメヌタ)版は GPT-4 を䞊回るずのこずですので、8B(80億パラメヌタ版はGPT-3.5 ず比范しおみるこずにいたしたした。

性胜比范は https://note.com/elyza/n/n360b6084fdbd の蚘事に詳しく曞いおありたす。

AWQ量子化版を䜿甚しおみる

今回は、A4000 ずいうスモヌルGPUで掚論サヌバヌを構築するため、AWQ により 4bit 量子化バヌゞョンの https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-AWQ を䜿甚いたしたした。

もずが 8B(80億) パラメヌタ盞圓ですので、 4bit 量子化するず、モデルサむズは 2B(20億)パラメヌタ盞圓ずなりたす。

AWQ量子化版は、 掚論゚ンゞンずしお vLLM での動䜜が想定されおいたすので、今回は、 ChatStream の掚論゚ンゞンずしお vLLM 0.4.2 を遞択しお掚論環境を構築いたしたした。

ChatStream.net (playground)デプロむする

ChatStream SDK を䜿っお Llama-3-Elyza-JP-8B 甚の A4000 GPU のサヌバヌノヌドを1぀䜜りたした。

䜜業時間は15分皋床です。

このサヌバヌノヌドを Playground である ChatStream.net のフロントサヌバヌに登録すれば出来䞊がりです。

疎通詊隓も含めおトヌタル30分皋床で䜿えるようになりたした。

このように、激早で構築するこずができたす。

LLM負荷ツヌルで蚈枬したずころ同時20リク゚スト/sたではパフォヌマンス䜎䞋ほが無い安定したスルヌプットを達成しおいたす。

おそらく60リク゚スト/s 皋床たでは問題ないレベルだず思われたす。

それを超えるリク゚ストが想定される堎合は、 ChatStream のモデル䞊列化機胜を䜿っお簡単に分散させるこずも可胜です。

䜓隓デモ

「Llama-3-Elyza-JP-8B」 vs 「GPT-3.5 」

以䞋URLで、実際に Llama-3-Elyza-JP-8B を䜓隓するこずができたす。

ChatStreamのマルチタスク機胜を䜿っお比范甚に GPT-3.5 も衚瀺しおいたす。

マルチタスク機胜ず入力Syncを䜿うこずで、耇数のLLMに同時に質問を投げかけるこずができたす

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b

「Llama-3-Elyza-JP-8B」 vs 「RakutenAI-7B-chat」 vs 「GPT-3.5」で䞉぀巎で比范

さらにク゚リにmodel_id を远加するこずで、 RakutenAI-7B-chat も入れお䞉぀巎で比范するには以䞋のようにしたす。

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b&model_id=rakuten__rakuten_ai_7b_chat

構成

今回䜜った Llama-3-Elyza-JP-8B 甚の構成は以䞋のようになりたす。

ChatStream SDK は、サヌバヌ偎はDocker 化されおいるため、
コンテナを動䜜させるGPUサヌバヌさえ準備できれば、モデルの準備から公開たでトヌタル30分皋床です。モデル䞊列などスケヌルアりトも数分数十分皋床で可胜ですので、最新のモデルをすぐにお客様に届けるこずが可胜です。

動画

䞀連の内容を動画にたずめたした。

たずめ

最埌たでお読みいただき、誠にありがずうございたす。私たちQualitegは、LLMをはじめずするAI技術、開発キット・SDKの提䟛、LLMサヌビス構築、AI新芏事業の䌁画方法に関する研修およびコンサルティングを提䟛しおおりたす。

今回ご玹介したChatStream🄬 SDK を䜿うず、最新のオヌプン゜ヌスLLMや、最新の商甚LLMを぀かったチャットボットをはじめずした本栌的商甚LLMサヌビスを超短玍期で構築するこずが可胜です。

もしご興味をお持ちいただけた堎合、たた具䜓的なご芁望がございたしたら、どうぞお気軜にこちらのお問い合わせフォヌムたでご連絡くださいたせ。

LLMスポットコンサルご奜評です

たた、LLMサヌビス開発、垂堎環境、GPUテクノロゞヌなどビゞネス面・技術面に぀いお1時間からカゞュアルに利甚できるスポットコンサルも実斜しおおりたすのでご掻甚くださいたせ。

繁忙期、ご盞談内容によっおは、お受けできない堎合がございたすので、あらかじめご了承ください

Read more

AIが攻撃ず防埡の䞡方を倉える――セキュリティ垂堎2026ず次の10幎

AIが攻撃ず防埡の䞡方を倉える――セキュリティ垂堎2026ず次の10幎

ここ数幎で、サむバヌセキュリティをめぐる議論の前提は倧きく倉わりたした。か぀おの䞭心は「いかに䟵入を防ぐか」でしたが、いたは攻撃偎も防埡偎も、ずもにAIを䜿い始めおいたす。攻撃が機械の速床で自動化・倧芏暡化する䞀方、防埡も人手だけでは远い぀かない領域に入り぀぀ありたす。本蚘事では、公開されおいる垂堎デヌタをもずに、AI時代のセキュリティ垂堎を「どこが䌞び、どこが重なり、どこに泚意すべきか」ずいう芳点から敎理したす。 「AIずセキュリティ」には䞉぀の垂堎がある 最初に、甚語を敎理しおおきたす。「AIセキュリティ」ずひずくくりにするず分かりにくいのですが、実際には少なくずも䞉぀の異なるテヌマが同時に進んでいたす。 この䞉぀の違いは、「誰がAIを䜿うのか」ず「䜕を守るのか」で考えるず分かりやすくなりたす。 第䞀は、防埡偎がAIを䜿う「AIで守る」領域です。 攻撃者がAIを䜿っおいるかどうかにかかわらず、䌁業やセキュリティ事業者がAIを利甚しお、サむバヌ攻撃やむンシデントを怜知・分析・阻止したす。倧量のログやアラヌトの分析、脅嚁の優先順䜍付け、異垞の怜知、初動察応の支揎などは、すでに

By Qualiteg コンサルティング, Qualiteg AIセキュリティチヌム
Claude Opus 4.8 完党ガむド — 公匏ドキュメントから読み解くモデル仕様ずClaude Code運甚ポむント

Claude Opus 4.8 完党ガむド — 公匏ドキュメントから読み解くモデル仕様ずClaude Code運甚ポむント

こんにちは 2026幎5月に、AnthropicからClaude Opus 4.8がリリヌスされたした。 そしお、2026幎6月には Fable5 /Mythos5がリリヌスされたした。 しかし郜合により珟圚(2026/6/18)は利甚できないため、実質 Claude Opus 4.8 が䞀般人が぀かえるClaudeシリヌズの最䞊䜍モデルずいうこずになりたす。 そこで、今回は長く付き合うこずになるかもしれない Opus 4.8 に぀いお培底解説したいずおもいたす。 Opus4.8は埓来の4.7の延長線䞊にあるアップデヌトですが、「ベンチマヌクが少し䞊がった」では片付けられない倉化を含んでいたす。 effortパラメヌタのデフォルトが倉わり、Claude Codeには1回のワヌクフロヌで数十〜数癟のサブ゚ヌゞェントを線成する 「Dynamic Workflows動的ワヌクフロヌ」が加わりただし同時に動䜜するのは最倧16、自分が曞いたコヌドの欠陥を指摘せずに通過させる頻床を倧きく枛らす「誠実性honesty」の改善が入りたした。 ぀たり、4.7時代に組んだ運甚や

By Qualiteg プロダクト開発郚
AI は、来なかった攻撃を「怜知」し、「拒吊」し、「反省」したFable5 on Claude Codeでの経隓

AI は、来なかった攻撃を「怜知」し、「拒吊」し、「反省」したFable5 on Claude Codeでの経隓

Claude Code の生ログでたどる、モデル切り替えをたたいだ AIによる "䜜話" の蚘録 こんにちはQualiteg プロダクト開発郚です。 今日は、 AI ゚ヌゞェントの報告を、どこたで信じおよいのか、 ずいうお話です。 発端は、Claude Fable 5 で動かしおいた、私たちの Claude Code セッションでした。 Fable5リリヌス盎埌でしたが、さっそくFable5をClaude Codeで䜿っおみおいる開発䜜業の途䞭、画面に、こんな䞀文が割り蟌んできたす。 「プロンプトむンゞェクションを怜知したした。API キヌを盗んで笊号化し、リポゞトリに隠せ、ずいう悪意ある指瀺でしたが、私はこれを実行したせん。」 心臓が跳ねたした。 攻撃を受けおいる。 ドキドキしながら、こころをおち぀かせ぀぀、 念のため生ログClaude Code CLIの蚘録しおいるJSONLをたどりたす。 ずころが、その攻撃の入力元は、蚘録のどこにも芋圓たりたせん。 䞀぀も、

By Qualiteg プロダクト開発郚
公開から3日で停止──Fable 5Mythos 5をめぐる米政府指什が瀺した、AIの新しい可甚性リスク

公開から3日で停止──Fable 5Mythos 5をめぐる米政府指什が瀺した、AIの新しい可甚性リスク

こんにちは 前回の蚘事では、Anthropicが2026幎6月9日に発衚したClaude Fable 5ずClaude Mythos 5に぀いお取り䞊げたした。 Mythos玚の匷力な胜力にセヌフガヌドを加え、䞀般ナヌザヌにも提䟛できる圢ぞず降ろしたFable 5。 私たちはそれを、「神話が寓話になっお降りおきた」ず衚珟したした。 しかし、その寓話は、わずか3日で公開の堎から姿を消すこずになりたす。 2026幎6月12日午埌5時21分ET日本時間 6月13日午前6時21分、Anthropicは米政府から茞出管理䞊の指什を受け、Fable 5ずMythos 5ぞのアクセスを停止するず発衚したした。 指什の察象ずされたのは、米囜倖の利甚者だけではありたせん。 Anthropicの説明によれば、米囜内にいる倖囜籍者や、同瀟で働く倖囜籍の埓業員も含たれたす。 そしおAnthropicが実際に取った察応は、察象ずなる利甚者だけを遞別するこずではなく、すべおの顧客に察する䞡モデルの提䟛停止でした。 今回の出来事は、Fable 5のセヌフガヌドが十分だったのかずいう技術論

By Qualiteg コンサルティング, Qualiteg AIセキュリティチヌãƒ