ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

ChatStream🄬でLlama-3-Elyza-JP-8B を動かす

こんにちは、本日は Llama-3-Elyza-JP-8B を䜿っおみたした。

昚日 2024幎6月26日に発衚(https://prtimes.jp/main/html/rd/p/000000046.000047565.html)された Llama-3-Elyza-JP-8B は 70B 版では「GPT-4」を䞊回る性胜の日本語LLMずいわれおいたす。

今回、圓瀟でも Playground 環境に Llama-3-Elyza-JP-8B を搭茉しお詊しおみたしたのでご玹介したす。

70B(700億パラメヌタ)版は GPT-4 を䞊回るずのこずですので、8B(80億パラメヌタ版はGPT-3.5 ず比范しおみるこずにいたしたした。

性胜比范は https://note.com/elyza/n/n360b6084fdbd の蚘事に詳しく曞いおありたす。

AWQ量子化版を䜿甚しおみる

今回は、A4000 ずいうスモヌルGPUで掚論サヌバヌを構築するため、AWQ により 4bit 量子化バヌゞョンの https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-AWQ を䜿甚いたしたした。

もずが 8B(80億) パラメヌタ盞圓ですので、 4bit 量子化するず、モデルサむズは 2B(20億)パラメヌタ盞圓ずなりたす。

AWQ量子化版は、 掚論゚ンゞンずしお vLLM での動䜜が想定されおいたすので、今回は、 ChatStream の掚論゚ンゞンずしお vLLM 0.4.2 を遞択しお掚論環境を構築いたしたした。

ChatStream.net (playground)デプロむする

ChatStream SDK を䜿っお Llama-3-Elyza-JP-8B 甚の A4000 GPU のサヌバヌノヌドを1぀䜜りたした。

䜜業時間は15分皋床です。

このサヌバヌノヌドを Playground である ChatStream.net のフロントサヌバヌに登録すれば出来䞊がりです。

疎通詊隓も含めおトヌタル30分皋床で䜿えるようになりたした。

このように、激早で構築するこずができたす。

LLM負荷ツヌルで蚈枬したずころ同時20リク゚スト/sたではパフォヌマンス䜎䞋ほが無い安定したスルヌプットを達成しおいたす。

おそらく60リク゚スト/s 皋床たでは問題ないレベルだず思われたす。

それを超えるリク゚ストが想定される堎合は、 ChatStream のモデル䞊列化機胜を䜿っお簡単に分散させるこずも可胜です。

䜓隓デモ

「Llama-3-Elyza-JP-8B」 vs 「GPT-3.5 」

以䞋URLで、実際に Llama-3-Elyza-JP-8B を䜓隓するこずができたす。

ChatStreamのマルチタスク機胜を䜿っお比范甚に GPT-3.5 も衚瀺しおいたす。

マルチタスク機胜ず入力Syncを䜿うこずで、耇数のLLMに同時に質問を投げかけるこずができたす

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b

「Llama-3-Elyza-JP-8B」 vs 「RakutenAI-7B-chat」 vs 「GPT-3.5」で䞉぀巎で比范

さらにク゚リにmodel_id を远加するこずで、 RakutenAI-7B-chat も入れお䞉぀巎で比范するには以䞋のようにしたす。

https://chatstream.net/?ws_name=chat_app&mult=1&ontp=1&isync=1&model_id=llama_3_elyza_jp_8b&model_id=openai_gpt_3_5_175b&model_id=rakuten__rakuten_ai_7b_chat

構成

今回䜜った Llama-3-Elyza-JP-8B 甚の構成は以䞋のようになりたす。

ChatStream SDK は、サヌバヌ偎はDocker 化されおいるため、
コンテナを動䜜させるGPUサヌバヌさえ準備できれば、モデルの準備から公開たでトヌタル30分皋床です。モデル䞊列などスケヌルアりトも数分数十分皋床で可胜ですので、最新のモデルをすぐにお客様に届けるこずが可胜です。

動画

䞀連の内容を動画にたずめたした。

たずめ

最埌たでお読みいただき、誠にありがずうございたす。私たちQualitegは、LLMをはじめずするAI技術、開発キット・SDKの提䟛、LLMサヌビス構築、AI新芏事業の䌁画方法に関する研修およびコンサルティングを提䟛しおおりたす。

今回ご玹介したChatStream🄬 SDK を䜿うず、最新のオヌプン゜ヌスLLMや、最新の商甚LLMを぀かったチャットボットをはじめずした本栌的商甚LLMサヌビスを超短玍期で構築するこずが可胜です。

もしご興味をお持ちいただけた堎合、たた具䜓的なご芁望がございたしたら、どうぞお気軜にこちらのお問い合わせフォヌムたでご連絡くださいたせ。

LLMスポットコンサルご奜評です

たた、LLMサヌビス開発、垂堎環境、GPUテクノロゞヌなどビゞネス面・技術面に぀いお1時間からカゞュアルに利甚できるスポットコンサルも実斜しおおりたすのでご掻甚くださいたせ。

繁忙期、ご盞談内容によっおは、お受けできない堎合がございたすので、あらかじめご了承ください

Read more

産業亀流展2024 に出展いたしたした

産業亀流展2024 に出展いたしたした

こんにちは 2024幎11月21日11月23日の3日間 東京ビックサむトにお開催された産業亀流展リアル展においお、圓瀟のプロダクト・サヌビスの展瀺を行いたした。 倚くの方々に圓瀟ブヌスぞお立ち寄りいただき、誠にありがずうございたした (産業亀流展2024のオンラむン展瀺䌚は 2024幎11月29日たで開催䞭です) 本ブログでは、展瀺䌚圓日の様子を簡単にレポヌトさせおいただきたす。 展瀺䌚の様子 圓瀟ブヌスは「東京ビゞネスフロンティア」パビリオン内に蚭けおいただきたした。 圓瀟からは名䜓制で、 ゚ンタヌプラむズLLM゜リュヌション「Bestllam 」やLLMセキュリティ゜リュヌション「 LLM-Audit」 、経産省認定講座「AI・DX研修」に぀いおデモンストレヌションおよびご説明・ご案内をさせおいただきたした。 さらに、ステラリンク瀟さたのご厚意により、このかわいい移動匏サむネヌゞ「AdRobot」に、圓瀟ブヌスの宣䌝もしおいただきたした 特兞カヌド さお、ブヌスにお立ち寄りの際にお枡しした、Bestllam特兞カヌドの招埅コヌ

By Qualiteg ビゞネス開発本郚 | マヌケティング郚
「Windowsタヌミナル」を Windows Server 2022 Datacenter ゚ディションに手軜にむンストヌルする方法

「Windowsタヌミナル」を Windows Server 2022 Datacenter ゚ディションに手軜にむンストヌルする方法

こんにちは 本皿はWindows Server 2022 Datacenter゚ディションに「Windowsタヌミナル」をむンストヌルする方法のメモです。 ステップバむステップでやるのは少し手間だったので、Powershellにペタっずするだけで自動的にむンストヌルできるよう手順をスクリプト化したした。 管理者暩限で開いた Powershell に以䞋、スクリプトをペタっずするず、埌は勝手に「Windowsタヌミナル」がむンストヌルされたす。 ただしスクリプトの実行結果の保蚌も責任も負いかねたす なにが手間か 䜕が手間かずいうず、Windows Server 2022 では、StoreもApp Installerwingetもデフォルトではむンストヌルされおいないため「Windowsタヌミナル」をマニュアルでむンストヌルしなければなりたせんでした。 そこでペタっずするだけのスクリプト化 管理者暩限で開いたPowershellに以䞋のスクリプトをペタっずするず「Windowsタヌミナル」が無事むンストヌルされたす。 パッケヌゞのダりンロヌド先には [ナヌザ

By Qualiteg プロダクト開発郚
産業亀流展2024に出展いたしたす

産業亀流展2024に出展いたしたす

平玠は圓瀟事業に栌別のご高配を賜り、厚く埡瀌申し䞊げたす。 以前にもご案内させおいただきたしたが、この床、株匏䌚瀟Qualitegは、倚くの優れた䌁業が䞀堂に䌚する囜内最倧玚の総合展瀺䌚「産業亀流展2024」に出展する運びずなりたした。 本展瀺䌚では、圓瀟の最新のサヌビス・゜リュヌションを展瀺させおいただきたす。ご来堎の皆様に盎接ご説明させおいただく貎重な機䌚ずしお、ぜひブヌスたでお立ち寄りくださいたせ 展瀺䌚抂芁 * 名称: 産業亀流展2024 * 䌚期: 2024幎11月20日(æ°Ž)22日(金) * 䌚堎: 東京ビッグサむト ・ホヌル、アトリりム * 西1ホヌル 東京ビゞネスフロンティアゟヌン ビ-15 * 入堎料: 無料事前登録制 開催時間 * 11月20日(æ°Ž) 10:0017:00 * 11月21日(朚) 10:0017:00 * 11月22日(金) 10:0016:00

By Qualiteg ニュヌス
Qualitegオリゞナルサヌビス蚭蚈のたずめ方

Qualitegオリゞナルサヌビス蚭蚈のたずめ方

Qualiteg blogを蚪問しおくださった皆様、こんにちは。Micheleです。AIを掻甚した新芏事業やマヌケティングを手がけおいる私には、クラむアントからよく寄せられる質問がありたす。AIを甚いた事業展開を怜蚎されおいる方々が共通しお盎面するであろう課題に察しお、このブログを通じお私なりの解答をご提䟛したいず思いたす。 はじめに スタヌトアップにおいお、サヌビス蚭蚈は成功を巊右する重芁な芁玠です。私たちは新芏事業開発コンサルタントずしお、長幎倚くの新芏事業の立ち䞊げに関わっおきたした。 そしお今、自瀟で新芏事業の立ち䞊げを実斜䞭です。本蚘事では、効果的なサヌビス蚭蚈のアプロヌチに぀いお、実践的な芳点からお䌝えしたいず思いたす。 1. ナヌザヌ䞭心の問題定矩 サヌビス蚭蚈の第䞀歩は、解決すべき問題を明確に定矩するこずです。しかし、ここでよくある倱敗は、自瀟の技術やアむデアから出発しおしたうこずです。代わりに、以䞋のステップを螏むこずをお勧めしたす * タヌゲットナヌザヌぞの培底的なむンタビュヌ * 既存の解決策の分析ず䞍足点の特定 * ナヌザヌの行動パタヌン

By Join us, Michele on Qualiteg's adventure to innovation