GPUマシン自作

[自作日記7] AI用GPUの選定

Qualiteg Boot Camp

2023年11月17日 — 3 min read

今回は、AIに適したグラフィックボード(GPU)の選定をします。

本編に行く前に、グラフィックボードとGPUの違いについて整理しておきましょう

グラフィックボードは、コンピューターで画像処理やAIの計算を担当する重要なハードウェアでパソコンのPCI Express のスロットに挿入して使用するのが一般的です。

一方 GPU はグラフィックボードの主要な構成要素の１つで、グラフィックボードは以下のようなコンポーネントで構成されています。

GPUチップ - グラフィック処理の中心で、複雑な数学的計算を高速に実行します。
VRAM（ビデオRAM） - GPUが直接アクセスする専用メモリで、ディープラーニングでは、パラメータ（重みやバイアス）や計算過程を保持する役割があり非常に高速に動作します。
冷却システム - GPUが生成する熱を効果的に放散するためのファンやヒートシンク。

グラフィックボードとGPUを同一視して書いている記事も多く、私たちもあまり厳密に分けて書いていないですが、実体としては↑のような感じですね。

さて、それでは Jun さんの買い物の続きをみていきましょう。

肉の万世本店はやっぱり最高でした。

2階でハンバーグを食べてきましたが、出世したら3階、4階のレストランも行ってみたい。あと、1階のパーコー麵にもチャレンジしてみたいです。麵が上下してるあのオブジェ？も楽しいですね。
（なぜか、いつも2階ばかり行ってしまうんですよね。）

おなかもいっぱいになったので、これから今日の目玉のGPUを買いに行きたいと思います。

とその前に、今まで買ったものを整理しておきます

マザーボード: Asrock Z690 Steel Legend 約4万円
メモリ: Crucial デスクトップ用 DDR5 32G x 2 = 約3万円
CPU: Intel Core i7 12700 約5万円
昼食:万世コンボ+和食セット約2千円

だいたい12.5万円を使ったので、のこり32.5万円くらいあります。GPUは良いものを買えそうです！

GPUを買いにお店へ！

AIをやるなら、間違いなく NVIDIA の GPU です。

どれにしようかなー、と探し始めましたが、拍子抜けするくらい簡単に決まりました。

その理由は簡単。

ディープラーニング、とりわけLLMをやる場合に一番重要なのは VRAM の量つまりGPUのメモリ容量です。

そして、ここ秋葉原で売っているGPUは通常コンシューマー向けのGPUなので、VRAMの上限は決まっています。

そうです、 NVIDIA の GeForce 3090 か GeForce 4090 を搭載したグラフィックボードが VRAM 24 GBytes で最大なのです。つまりこのどちらかしか選択肢にないといってもいいでしょう。

この下のモデルになるといきなり VRAM が 16GBytes になってしまいます。

もともと、コンシューマ向けGPUというのは、3Dゲーム用途がほとんどであるため、24GBytes もVRAMがあれば十分ということなのでしょう。

ということで、もう3090か4090のどちらかで決めることにしました。

さて、この２つからの選択もほぼ迷いませんでした。

なぜなら、残りの資金が30万円弱だったのですが、4090のほうはのきなみ30万円以上の価格設定。残り資金を全部つかってしまったら電源など残りのパーツが買えません。

ということで、コンシューマ向けでメモリが一番多く、お値段も手が出るものという現実的な条件で、 GeForce 3090 搭載の以下のグラフィックボードを購入しました。

MSI SUPRIM X GeForce RTX 3090 Ti

約20万円で購入しました。今日一番高い買い物です。

買い出し用にコストコの巨大袋をもってきましたが、マザーボードの箱とグラボの箱ですでに、だいぶキツキツです。

三ツ矢サイダーの缶とくらべてわかるとおり箱がかなりでかく、高価なモノを買った感があります。

袋にはいってるのは、ざっとこんなかんじ。

コストコの袋に入ってるもの

マザーボード: ASRock Z690 Steel Legend 約4万円
メモリ: Crucial デスクトップ用 DDR5 32G x 2 = 約3万円
CPU: Intel Core i7 12700 約5万円
GPU:MSI SUPRIM X GeForce RTX 3090 Ti 約20万円

胃袋に入ってるもの

万世コンボ+和食セット約2千円

残金は 45-12.5-20 = 12.5 万円です。

いったん荷物を置きに会社に戻り、
残金で、残りのパーツである　電源、SSD、ケースを購入したいとおもいます。

今回はいかがでしたでしょうか。Jun さんは無事GPUをゲットできました。

次回は電源、SSD、ケースの購入をする予定です！お楽しみに！

navigation

PyTorchの重いCUDA処理を非同期化したらメモリリークした話と、その解決策

こんにちは！Qualitegプロダクト開発部です！今回は同期メソッドを非同期メソッド(async)化しただけなのに、思わぬメモリリーク※に見舞われたお話です。深層学習モデルを使った動画処理システムを開発していた時のことです。「処理の進捗をリアルタイムでWebSocketで通知したい」という要件があり、「単にasync/awaitを使えばいいだけでしょ？」と軽く考えていたら、思わぬ落とし穴にはまりました。プロ仕様のGPUを使っていたにも関わらず、メモリ不足でクラッシュしてしまいました。この記事では、その原因と解決策、そして学んだ教訓を詳しく共有したいと思います。同じような問題に直面している方の参考になれば幸いです。 ※ 厳密には「メモリリーク」ではなく「メモリの解放遅延」ですが、実用上の影響は同じなので、この記事では便宜上「メモリリーク」と表現します。背景：なぜ進捗通知は非同期である必要があるのかモダンなWebアプリケーションの要求最近のWebアプリケーション開発では、ユーザー体験を向上させるため、長時間かかる処理の進捗をリアルタイムで表示することが

ゼロトラスト時代のLLMセキュリティ完全ガイド：ガーディアンエージェントへの進化を見据えて

こんにちは！今日はセキュリティの新たな考え方「ゼロトラスト」とLLMを中心としたAIセキュリティについて解説いたします！はじめに 3つのパラダイムシフトが同時に起きているいま、企業のIT環境では3つの大きな変革が起ころうとしています。 1つ目は「境界防御からゼロトラストへ」というセキュリティモデルの転換。 2つ目は「LLMの爆発的普及」による新たなリスクの出現。そして3つ目は「AIエージェント時代の到来」とそれに伴う「ガーディアンエージェント」という新概念の登場です。これらは別々の出来事のように見えて、実は密接に関連しています。本記事では、この3つの変革がどのように結びつき、企業がどのような対策を取るべきかを解説いたします目次 1. はじめに：3つのパラダイムシフトが同時に起きている 2. 第1の変革：ゼロトラストという新しいセキュリティ思想 3. 第2の変革：LLM時代の到来とその影響 4. 第3の変革：AIエージェントとガーディアンエージェント 5. 3つの変革を統合する：実践的なアプローチ 6. 実装のベストプラクティス 7. 日本

発話音声からリアルなリップシンクを生成する技術第4回：LSTMの学習と限界、そしてTransformerへ

1. 位置損失 (L_position) - 口の形の正確さ時間口の開き正解予測 L_position = Σᵢ wᵢ × ||y_pred - y_true||² 各時点での予測値と正解値の差を計算。重要なパラメータ（顎の開き、口の開き）には大きな重みを付けます。 jaw_open: ×2.0 mouth_open: ×2.0 その他: ×1.0 2. 速度損失 (L_velocity) - 動きの速さ時間速度 t→t+1 v = y[t] -

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回基本概念の理解

こんにちは！今回から数回にわたり Active Directory について解説してまいります。 Active Directory（AD:アクティブディレクトリー）は、Microsoft が開発したディレクトリサービスであり、今日の大企業における IT インフラストラクチャーにおいて、もはやデファクトスタンダードと言っても過言ではない存在となっており、組織内のユーザー、コンピューター、その他のリソースを一元的に管理するための基盤として広く採用されています。 AIセキュリティの現実：単独では機能しない ChatGPTやClaudeなどの生成AIが企業に急速に普及する中、「AIセキュリティ」という言葉が注目を集めています。情報漏洩の防止、不適切な利用の検知、コンプライアンスの確保など、企業が取り組むべき課題は山積みです。しかし、ここで注意しなければいけない事実があります。それは、 AIセキュリティソリューションは、それ単体では企業環境で限定的な効果しか期待できないということです。企業が直面する本質的な課題 AIセキュリティツールを導入する際、企業のIT部門

コストコの袋に入ってるもの

胃袋に入ってるもの

Read more

PyTorchの重いCUDA処理を非同期化したらメモリリークした話と、その解決策

ゼロトラスト時代のLLMセキュリティ完全ガイド：ガーディアンエージェントへの進化を見据えて

発話音声からリアルなリップシンクを生成する技術 第4回：LSTMの学習と限界、そしてTransformerへ

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回 基本概念の理解

発話音声からリアルなリップシンクを生成する技術第4回：LSTMの学習と限界、そしてTransformerへ

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回基本概念の理解