[AI新規事業創出]LLMとは?

MicheleがAI活用のビジネスやマーケティングについて質問に答えるブログを紹介。大規模言語モデル(LLM)について説明し、ChatGPTを例に挙げてLLMのビジネス活用事例や技術的な側面を解説。さらに、専用パソコンや日本語対応モデルも紹介しています。

[AI新規事業創出]LLMとは?

Qualiteg blogを訪問してくださった皆様、こんにちは。Micheleです。AIを活用した新規事業やマーケティングを手がけている私には、クライアントからよく寄せられる質問があります。AIを用いた事業展開を検討されている方々が共通して直面するであろう課題に対して、このブログを通じて私なりの解答をご提供したいと思います。


LLMとは大規模言語モデル

LLM(Large Language Model、大規模言語モデル)とは、人間の言葉を理解し、それに基づいてテキストを生成する人工知能技術の一つです。この技術は、インターネット上の大量のテキストデータを学習して、様々な言語タスクをこなすことができるモデルを構築するものです。

ChatGPTもLLMを活用した生成AI

2022年に米国で開発されたOpenAI社のChatGPTはLLM(大規模言語モデルと呼ばれる言語生成AI)技術を活用し人間のアシスタントとして様々なタスクを代行したり、弁護士試験や医師国家試験に合格したりするなど既に平均的な人間の能力を超えていると言われており現在も秒進分歩で進化をつづけています。

ChatGPTはFortune 500企業の過半数でビジネス活用されているなど欧米中心に大きなビジネスインパクトを与えており、これに刺激され世界中で同様のLLMを作る動きが活発化されております。

LLMはコンピューターに例えるならCPU部分

LLMとは、人間のように質問に気の利いた回答をしたり、指示に従って文章を生みだしたりすることのできるAI技術で、昨今話題のChatGPTのコア技術としても使用されています。LLMはパソコンに例えるのであれば頭脳部分をつかさどるCPUに相当します。

イノベーションには常にリスクが伴います。株式会社Qualitegの Innovation-Crossは、そのリスクを最小化しながら成果を最大化する共創支援プログラム。現状分析を通じてリスク要因を可視化し、「自社だけでは管理困難」なリスクに対する戦略を策定します。アイデアワークショップや小規模な実証実験を通じて低コストで学習と検証を重ね、オープンイノベーションやパートナー開拓でリスクと投資を分散した革新創出を推進。

最先端AI技術の活用支援も含め、経験豊富な専門コンサルタントが、失敗のコストを抑えながら成功の可能性を高める共創プロセスを設計します。安全に挑戦し、確実に革新する—この両立を実現するのが、私たちのアプローチです。

CPUだけでパソコンは動く?

CPUのみではパソコンが使えないのと同様、LLMだけではユーザーが使える状態にはなりません。パソコンでは、キーボード、マウスといった入力装置、ディスプレイ、スピーカーなどの出力装置、メモリやHDDといった記憶装置、それらとCPUをつなぐマザーボードなど様々なパーツが協調して動作します。

LLMを動作させるにも、入出力や協調のための高度な仕組みが必要です。さらに、多くのユーザーが使用するためのセキュリティや堅牢性も兼ね備えることが求められます。このようにLLMを活用するには様々なソフトウェアとそれらを統合するプラットフォーム技術が必要であり、当社は商用サービス向け、LLMプラットフォーム ChatStream®(チャットストリーム)を開発・提供しています。

5.日本語対応の大規模言語モデル(例)

- matsuo-lab/weblab-10b-instruction-sft
- cyberagent/open-calm-7b
- cyberagent/open-calm-3b
- rinna/japanese-gpt-neox-3.6b-instruction-sft-v2
- rinna/bilingual-gpt-neox-4b-instruction-sft
- rinna/japanese-gpt-neox-3.6b-instruction-sft
- rinna/japanese-gpt-neox-3.6b-instruction-ppo
- stabilityai/japanese-stablelm-instruct-alpha-7b
- line-corporation/japanese-large-lm-3.6b-instruction-sft
- stockmark/gpt-neox-japanese-1.4b

6.英語対応の大規模言語モデル(例)

- meta-llama/Llama-2-7b-chat
- openlm-research/open_llama_3b_v2
- openlm-research/open_llama_7b_v2
- openlm-research/open_llama_3b
- togethercomputer/RedPajama-INCITE-Chat-3B-v1
- togethercomputer/RedPajama-INCITE-7B-Chat
- mosaicml/mpt-7b-chat
- databricks/dolly-v2-7b
- databricks/dolly-v2-3b

7.生成AI専用パソコンのご案内

当社では、プロ用GPUを搭載した、プロフェッショナル向けLLM(大規模言語モデル)専用パソコンのハイコストパフォーマンスモデル Qualiteg IntegrityPro-11600を販売中です。

必要なソフトウェアはあらかじめプリインストールされているため、電源をいれたらすぐに対話チャットWebアプリでLLMを試すことができます。もうAI実行に必要なPCパーツ構成や煩わしいソフトウェアインストールに悩まず、必要な作業にご集中いただけます。


コラムを最後までお読みいただき、誠にありがとうございます。私たちQualitegは、AI技術や新規事業の企画方法に関する研修およびコンサルティングを提供しております。もしご興味をお持ちいただけた場合、また具体的なご要望がございましたら、どうぞお気軽にこちらのお問い合わせフォームまでご連絡くださいませ。

また、新規事業創出のステップを体得したいという方にご好評のワークショップも実施しております。それぞれの担当者の方が役員目線で事業を考えるという点にフォーカスしたトレーニング内容となっており、企画担当者の方だけではなく、カウンターパートのエンジニア、デザイナー、マーケターの方にもご受講いただけるコンテンツとなっております。

皆様からのお問い合わせを心よりお待ちしております。次回のコラムも、ぜひご期待くださいね。


navigation

Read more

LLM推論基盤プロビジョニング講座 第3回 使用モデルの推論時消費メモリ見積もり

LLM推論基盤プロビジョニング講座 第3回 使用モデルの推論時消費メモリ見積もり

こんにちは!前回はLLMサービスへのリクエスト数見積もりについて解説しました。今回は7ステッププロセスの3番目、「使用モデルの推論時消費メモリ見積もり」について詳しく掘り下げていきます。 GPUメモリがリクエスト処理能力を決定する LLMサービス構築において、GPUが同時に処理できるリクエスト数はGPUメモリの消費量によって制約されます。 つまり、利用可能なGPUメモリがどれだけあるかによって、同時に何件のリクエストを処理できるかがほぼ決まります。 では、その具体例として、Llama3 8B(80億パラメータ)モデルをNVIDIA RTX A5000(24GB)にロードするケースを考えてみましょう。 このGPUには24GBのGPUメモリがありますが、すべてをリクエスト処理に使えるわけではありません。最初にモデル自体が一定量のメモリを消費し、残りの領域で実際のリクエスト処理を行います。 GPUメモリ消費の二大要素 GPUの消費メモリ量は主に以下の2つの要素によって決まります 1. モデルのフットプリント LLMをGPUに読み込んだときに最初に消費されるメモリ

By Qualiteg コンサルティング
システムとcondaのC++標準ライブラリ(libstdc++)のバージョン違い問題による事象と対処法解説

システムとcondaのC++標準ライブラリ(libstdc++)のバージョン違い問題による事象と対処法解説

こんにちは! 先日、dlibをつかったPythonアプリケーション(conda環境で動作する)作っていたところ、以下のようなエラーに遭遇しました。 ImportError: /home/mlu/anaconda3/envs/example_env/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (required by /home/mlu/anaconda3/envs/example_env/lib/python3.10/site-packages/_dlib_pybind11.cpython-310-x86_64-linux-gnu.so) 「dlib_pybind11モジュールがGLIBCXX_3.4.32を要求してるけど、みつからない!」という感じのエラーですね。

By Qualiteg プロダクト開発部
LLM推論基盤プロビジョニング講座 第2回 LLMサービスのリクエスト数を見積もる

LLM推論基盤プロビジョニング講座 第2回 LLMサービスのリクエスト数を見積もる

こんにちは! 今回はLLM推論基盤プロビジョニング講座 第2回です! STEP2 LLMサービスへのリクエスト数見積もり それでは、早速、LLM推論基盤プロビジョニングの第2ステップである「リクエスト数見積もり」の重要性と方法を解説いたします。 LLMサービスを構築する際に必要となるGPUノード数を適切に見積もるためには、まずサービスに対して想定されるリクエスト数を正確に予測する必要があります。 リクエスト数見積もりの基本的な考え方 LLMサービスへの想定リクエスト数から必要なGPUノード数を算出するプロセスは、サービス設計において非常に重要です。過小評価すればサービス品質が低下し、過大評価すれば無駄なコストが発生します。このバランスを適切に取るための基礎となるのがリクエスト数の見積もりです。 想定リクエスト数の諸元 リクエスト数を見積もるための5つの重要な要素(諸元)をみてみましょう。 1. DAU(Daily Active Users): 1日あたりの実際にサービスを利用するユーザー数です。これはサービスの規模を示す最も基本的な指標となります。 2. 1日

By Qualiteg コンサルティング
Zoom会議で肩が踊る?自動フレーミング映像安定化とAIによる性能向上の可能性

Zoom会議で肩が踊る?自動フレーミング映像安定化とAIによる性能向上の可能性

こんにちは! 本日は、自動フレーミング映像の安定化に関するアルゴリズム・ノウハウを解説いたします 第1章 問題の背景と目的 バストアップ映像を撮影する際、特にオンラインミーティングやYouTubeなどのトーク映像では、人物がうなずく、首を振るなどの自然な動作をした際に「首まわりや肩がフレーム内で上下に移動してしまう」という現象がしばしば起こります。これは、多くの場合カメラや撮影ソフトウェアが人物の「目や顔を画面中央に保とう」とする自動フレーミング機能の働きに起因します。 撮影対象の人物が頭を下げた際に、映像のフレーム全体が相対的に上方向へシフトし、その結果、本来動いていないはずの肩の部分が映像内で持ち上がっているように見えてしまう現象です。 本稿では、この問題を撮影後の後処理(ポストプロセッシング)のみを用いて、高速、高い精度かつロバストに解決する手法をご紹介します。 前半では、従来のCV(コンピュータービジョン)の手法を使い高速に処理する方法をご紹介します。後半では、AIを使用してより安定性の高い性能を実現する方法について考察します。 第2章 古典手法による肩の上下

By Qualiteg 研究部