Latest

[ChatStream] HTTP セッションミドルウェアの設定

ChatStream Guide

[ChatStream] HTTP セッションミドルウェアの設定

こんにちは! (株)Qualiteg プロダクト開発部 です! 本稿では、 ChatStream に セッションミドルウェアをセットし、Webアプリケーションをステートフルにする方法についてご説明いたします! ChatStream では Qualiteg が開発した独自のセッションミドルウェアを使用しており、通常の Starlette 用のセッションミドルウェアよりも高い柔軟性を実現しています。(Java Servlet のセッション管理アプローチに近いです) セッションミドルウェア 開いたブラウザでWebチャットをするときにマルチラウンドの会話を成立するためには ChatPrompt(会話履歴) が複数ターンの会話のなかで更新されていく必要があります。 デフォルトでは、 ChatStream は HTTP セッションを使用してWebアプリケーションをステートフルにし、 ChatPrompt をブラウザが開いている間保持することができます。 HTTP セッションを使用するには、以下のように FastAPI のミドルウェアを登録します。 from fas

By Qualiteg プロダクト開発部
[AI新規事業創出]Qualitegが考える、質の良いアイディア創出のための3つのポイント

AI-Business

[AI新規事業創出]Qualitegが考える、質の良いアイディア創出のための3つのポイント

新規事業のコンサルティングの中で多くのクライアントから「質の良いアイディアの出し方」についてご質問をいただきます。Qualitegは長年の経験から、要件定義、業界情報の収集、効果的なファシリテーションを重要視しています。これによりアイディア創出の質が向上し、ブレスト時の空振りを防ぐことが可能になります。

By Join us, Michele on Qualiteg's adventure to innovation
[ChatSream] モデルをロードする方法

ChatStream Guide

[ChatSream] モデルをロードする方法

こんにちは! (株)Qualiteg プロダクト開発部 です! 本稿では、 ChatStream に HuggingFaceモデルを読み込むときのアプローチについてご説明いたします HuggingFace モデルのロード モデルごとに指定された方法で HuggingFace モデルを読み込みます。 model_path = "togethercomputer/RedPajama-INCITE-Chat-3B-v1" device = "cuda" # "cuda" / "cpu" tokenizer = AutoTokenizer.from_pretrained(model_path) model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16) model.to(device) こちらは、

By Qualiteg プロダクト開発部
[自作日記5] マザーボードはどれがいい?

GPUマシン自作

[自作日記5] マザーボードはどれがいい?

今回は、マザーボードの選定をします。 Junさんの買い物の続きをみるまえにもう一度チップセットについておさらいしておきましょう。 インテルの CoreシリーズCPUは 12世代、13世代ともに、CPUソケットが LGA 1700 となっており、多くの場合、12世代用のチップセットは13世代のCPUとも互換性がありますが、最新の機能や最適な性能を得るには、対応する世代のチップセットを使用することが推奨されます。 たとえば、12世代のインテルCoreシリーズCPU用に設計されている チップセットには以下のようなものがありますが、AI用途であればGPUを使いますので、Z690,H670のようなハイエンドチップセットを選ぶのが安全でしょう。 * Z690: 高性能チップセットで、オーバークロッキングサポート、PCIe 5.0 x16スロット、多数のPCIe 4.0レーン、高速なUSB 3.2 Gen 2x2接続、および高速ストレージのための複数のM.2スロットが提供されています。 * H670: オーバークロッキングはサポートしていませんが、それ以外の機能はZ690に近いチップセッ

By Qualiteg Boot Camp
GPUリッチと日本の現状

Blog

GPUリッチと日本の現状

世界的なGPU不足が深刻化しており、特に高性能なグラフィックスプロセッシングユニット(GPU)の確保が困難な状況に直面しています。この不足は、AI研究開発をはじめとする多くのテクノロジー業界に大きな影響を及ぼしており、企業や研究機関の間で新たな競争が生まれています。 GPU不足の現状 「GPUが非常に不足しているため、当社の製品を使用する人が少ないほど良いです」「GPUが不足しているため、当社の製品の使用量が減ってくれると嬉しいです」との声が業界内で聞かれるほど、GPUの調達は困難を極めています。 イーロン・マスクは、GPUの入手困難さを「麻薬よりも取得が難しい」と形容しています。 米国のビッグテックやメガベンチャーでは、GPUを万単位で確保しており、一例として1万台のGPUを確保するには約600億円の投資が必要とされています。これらの企業は、「GPUリッチ」と呼ばれるほどに、NVIDIAのA100やH100などの高性能GPUを大量に所有しています。 GPUリッチの影響 このGPUリッチな環境は、米国内でのAI研究開発競争を加速させています。ベイエリアのトップAI研究者

By Tomonori Misawa / CEO
[ChatStream] ChatPrompt の実装

ChatStream Guide

[ChatStream] ChatPrompt の実装

ChatPrompt とは こんにちは! (株)Qualiteg プロダクト開発部 です! 本稿では、 ChatPrompt の具体的な実装方法をご紹介いたします! ChatPrompt とは、事前学習済言語モデル(以降、モデル)用のプロンプトを生成するためのクラスです。プロンプトクラスと呼びます。 たとえば、 redpajama-incite の場合は以下のようなプロンプトをつくり、モデルに入力します。 <human>: Who is Alan Turing <bot>: すると、モデルは続きの文章を生成し、以下を出力します。 <human>: Who is Alan Turing <bot>: He was a very honorable man.

By Qualiteg プロダクト開発部
[自作日記4] いざ秋葉原! CPU選び

GPUマシン自作

[自作日記4] いざ秋葉原! CPU選び

こんにちは、さっそく自作PCを作っていきましょう。 ここでは、Qualitegの若手社員 Jun さんにご登場いただき、GPUマシン自作体験記を赤裸々に語っていただくストーリーとして進めていきます! Junです。ソフトウェアエンジニアです。 ある日、出社すると、席に1枚の封筒がおいてありました。 なんだこれ? 開いて見ると、中に便箋がはいっており、 今時手書きで、しかも太めのマッキーで、こんなことが書いてありました。 Junさんへ、 Qualiteg へようこそ! 当社ではメンバーは必ず1台はGPUマシンを自作するのが掟(おきて)となっています。 そこの封筒に45万円ありますので、これをもって秋葉原に行ってパソコンのパーツを買ってきてください。 以下にヒントを書いておきますので、よろしくおねがいします。 ① CPUは 12世代か13世代のどちらでもよい。 ② GPU中心でつかうため、CPU側の能力は i5程度で問題ない。 ③ マザーボードのチップセットは CPUが12世代ならZ690 か CPUが13世代ならZ790。ATX。 ④ CPUメ

By Qualiteg Boot Camp
[ChatStream] クイックスタート

ChatStream Guide

[ChatStream] クイックスタート

こんにちは! (株)Qualiteg プロダクト開発部 です! まだまだ暑いですね! 早速、昨日発表しました ChatStream をつかったリアルタイムストリーミングチャットサーバーを作ってみたいと思います。 パッケージのインストール 早速 ChatStream パッケージのインストールをしていきます pip install chatstream 必要パッケージのインストール pip install torch torchvision torchaudio pip install transformers pip install "uvicorn[standard]" gunicorn ChatStream サーバーの実装 今回は RedPajamaINCITE をLLMとしてつかったストリーミングチャットサーバーを実装します。 chatstream_server.py import torch from fastapi import FastAPI, Request from fastsession

By Qualiteg プロダクト開発部
[AI新規事業創出]生成AIを活用してオフィス業務を効率化する方法

AI-Business

[AI新規事業創出]生成AIを活用してオフィス業務を効率化する方法

MicheleはQualiteg blogで、AIを活用した新規事業やマーケティングに関する質問に答えています。特に多いのが、「ChatGPTを使って業務効率化をどう始めればいいか」という問い合わせです。彼女は、社内文書の自動生成からAI導入を始めることを推奨しており、カスタマーサポート業務の効率化にも大きな効果があると説明しています。また、バックオフィス業務改革を最初のステップとしてお勧めしています。

By Join us, Michele on Qualiteg's adventure to innovation
[自作日記3] グラボ2枚挿しの夢

GPUマシン自作

[自作日記3] グラボ2枚挿しの夢

こんにちは! 今日の話題はレーン分割とグラボ2枚挿しについてです。 前回みてきたとおり、インテル Core シリーズCPUでは、CPUから接続されるPCI Express は PCIe gen5 で x 16(16レーン分)使えました。 PCIe gen5 は非常に高速で、そのレーンを16レーン使えるので、実質的にこの PCIe gen5 x 16 がグラフィックボード(GPU)用です。 実はマザーボードによっては、 PCIe gen5 x16 を2分割して使えるものがあります。 さて、ここで、もう1回、 z690 チップセットのブロック図をみてみましょう。 この左上の↓ですが、2つのボックスがあり、それの中間にORとかいてあります。 これは、「以下の2つのパターンのうち、どちらかを選択することができるよ」という意味になります 1. 1x16

By Qualiteg Boot Camp
[自作日記2] CPUとチップセットと PCI Express の関係

GPUマシン自作

[自作日記2] CPUとチップセットと PCI Express の関係

こんにちは!今日はCPUとチップセットについて学びたいとおもいます! 最終的にはAI開発に使えるGPUマシンをつくりたいのですが、GPUってパソコンのどのあたりに入れて使うものでしょうか。 はい、正解は、パソコンのPCI Express のスロットに挿して使います。 「知っとるわ」という声が聞こえました。 さすがです。 では、次の問いです。 GPU が挿さる PCI Express スロットのレーンはどこにつながってるのでしょうか? 1.「チップセット」 2.「CPU」 正解は2のCPUです。 この問いの答えが一瞬で出た方は、本記事を読みとばしていただいて問題ありません。 「?」となった方は、本記事に参考になる部分があるかもしれません。 ということで、GPU は PCI Express という拡張スロットに挿して使うことはご存じかもしれませんが、PCI Express は内部でどのようにつながっているのでしょうか。実はGPUパソコンを作るときにこの辺がけっこう重要になります。 今後、GPU2枚挿し、GPU4枚挿し、など本格的なGPUマシンを作るときにもこのあたり

By Qualiteg Boot Camp
[ChatStream] matsuo-lab/weblab-10b-instruction-sft用の ChatPrompt

ChatStream Guide

[ChatStream] matsuo-lab/weblab-10b-instruction-sft用の ChatPrompt

matsuo-lab/weblab-10b-instruction-sft 用の ChatPrompt クラスをリリースしました。 最新バージョンのChatStreamに取り込んでいますが、以下コードを使用することも可能です。 from chatstream import AbstractChatPrompt from chatstream.chat_prompt.prompt_ttl import PromptTTL class ChatPromptMatsuoLabJpGptNeoxInstSft(AbstractChatPrompt): def __init__(self): super().__init__() # Call the initialization of the base class self.set_system("以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。") self.set_requester("指示") self.

By Qualiteg プロダクト開発部
人間のクリエイティビティとAI

Blog

人間のクリエイティビティとAI

先日、あるVCの方と当社のミッションについてお話したとき人々のクリエイティビティがいつか ChatGPT 等のAIに追い抜かれてしまうのかという点が話題になりました。 私は AIやAGIがどれほど進化しても、人間のクリエイティビティには勝ることができないという確信を持っています。 この信念は、クリエイティビティの本質とAIの能力の根本的な違いから来ています。 まず、クリエイティビティは、既存の枠組みやパターンを超えた新しいアイデアや解決策を生み出す能力です。このプロセスは、直感(直観)、感情、そして複雑な人間関係の理解を必要とします。人間の創造力は、経験、文化的背景、個人的な価値観、そして無意識の深層から湧き出るインスピレーションに根差しています。 このインスピレーションを「宇宙からアイディアが突然降ってくる」ととらえている人も多いです。このようなアンテナが存在するのかどうかはわかりませんが、私自身にもそのような経験は多くあり、あながち幻でもなさそうに思います。 これをクリエイティビティと言って良いのかどうかはわかりませんが、少なくとも、これらの要素は、人間独自のものであり、

By Tomonori Misawa / CEO