[自作日記17] SW編: NVIDIA Display Driver を GPUマシンの Ubuntu にインストールする

[自作日記17] SW編: NVIDIA Display Driver を GPUマシンの Ubuntu にインストールする

こんにちは!

今回は Ubuntu で GPU を使用できるようにするため、 NVIDIA Display Drive をインストールしていきます

3.2 Nvidia Display Driverのインストール

今回購入した GPU NVIDIA RTX 3090 Ti 24G に対応したディスプレイドライバーをインストールしていきます!

3.2.1 ドライバーのダウンロード

以下のサイトにアクセスして RTX 3090 Ti 用のドライバをさがします

https://www.nvidia.co.jp/Download/index.aspx?lang=jp

自分の環境(RTX 3090 Ti,Linux)を選択して、 探す をクリックするとドライバをさがしてくれるので便利です

ライセンスを確認し同意したらダウンロードの同意 をクリックします

これで、downloads ディレクトリに NVIDIA-Linux-x86_64-525.60.11.run というファイルがダウンロードされます。

3.2.2 ビルドツール gcc のインストール

さきほどインストールしたドライバーのインストールスクリプトを実行するまえに、ドライバーのビルド用のコンパイラ gcc をインストールしておく必要があります。

端末を開いて、以下のコマンドを実行します。

sudo apt install build-essential

ちなみに、gccインストールを忘れると以下のようなエラーがでるので注意しましょう

ERROR: Unable to find the development tool`cc` in your path; please make sure that you have the package 'gcc' installed. If gcc is installed on your system, then please check that `cc` is in your PATH.

上記終了したら、いったんリブートします

sudo reboot

3.2.3 Nvidia ディスプレイドライバのインストール

STEP 1. 以下のコマンドを実行して、インストールスクリプトを実行します

cd downloads/

スクリプトに実行権限を付与し、

chmod +x NVIDIA-Linux-x86_64-525.60.11.run

スクリプトを実行します

sudo ./NVIDIA-Linux-x86_64-525.60.11.run --no-x-check

(オプションに --no-x-check をつけないと、You appear to be running an X server; please exit X before installing.というエラーがでますので、オプションをつけるのを忘れないようにしましょう。)


STEP 2. ドライバのインストールが開始します


STEP 3. 以下の画面がでたら Continue installation を選択します

An alternate method of installing the NVIDIA driver was detected(This is usually a package provided by your distributor.) というメッセージは、Ubuntuでは別のほうほうでインストールできるよ と親切に教えてくれていますが、 apt install をする方法は、環境によってはうまくいかないので、このままNvidiaのインストーラーを使う! のがオススメです。

STEP4.以下の画面は OK を選択します

ERROR: The Nouveau kernel driver is currently in use by your system.This driver is incompatible with the NVIDIA driver, and must be disabled before proceeding.  と出ます。つまり Nouveau kernel driverがあると、Nvidia driverがインストールできないよという警告ですが、次のステップでなんとかなるので、OK をおします。

STEP.以下の画面は YES を選択します

For some distributions, Nouveau can be disabled by adding a file in...
** Nouveau は、無効にできるかもしれないけど試しますか?** ときいているので YES を選択します。
実際これで無効にできます。

STEP 6. 以下の画面は OK を選択します

Nouveau を無効にするための *.conf ファイルを作成した というメッセージとなります

STEP 7.以下の画面は OK を選択します

Installation has failed.Please see the file ... インストールは失敗しました みたいなメッセージがでますが、ここで落ち込まないでください。

Nouveau ドライバーをいま無効にしたので、次のインストールでは成功できますので、心配無用なのです。

STEP 8. Reboot

以下のコマンドで Reboot します

sudo reboot

STEP 9. リブートしたら、端末を開いて再びインストールスクリプトを実行します

sudo ./NVIDIA-Linux-x86_64-525.60.11.run --no-x-check

STEP 10.以下の画面は No を選択します


32ビット互換ライブラリは不要のため

STEP 11.以下の画面は

OK を選択します

WARNING: Unable to determine the path to install the libglvnd EGL vendor library config files. Check that you have pkg-config and the libglvnd development libraries installed, or specify a path with --glvnd-egl-config-path. と表示されています。
このWARNINGがきになる場合は以下を実行して libglvnd をインストールしても問題はないです

sudo apt install pkg-config libglvnd-dev
libglvnd は、複数のベンダー間で OpenGL API 呼び出しを調停するための、ベンダーに依存しないディスパッチ レイヤーです。異なるベンダーの複数のドライバーが同じファイルシステムに共存できるようにし、実行時に各 API 呼び出しをディスパッチするベンダーを決定します。

(https://github.com/NVIDIA/libglvnd)

というもので、OpenGL系のライブラリなので、なんにせよ Deep Learning 用途で使う場合には必要はないですね。

SSTEP 12. 以下の画面は No を選択します

Would you like to run the nvidia-xconfig utility to ...

「Xの設定を更新するか?」聞いています。
今はNoですすめておきます。これはnvidia-xconfigコマンドを使えばいつでも実行可能です。

STEP 12.以下の画面は OK を選択します

これで Nvidia Driver のインストール終了となります。


STEP 14.設定を反映するため リブート

これまでの設定反映のためリブートします

sudo reboot

STEP 15. リブートしたらNvidia Driver のインストールが成功したか確認する

端末を開いて以下のコマンドを実行します

nvidia-settings

OSがGPUをちゃんと認識しており無事ドライバをインストールできました!


次回は、 Anaconda をインストールして Python 環境を作れるようにしましょう!


navigation

Read more

個人情報検出の精度を、どう正しく語るか ― Recall、信頼区間、代表性から考える評価設計

個人情報検出の精度を、どう正しく語るか ― Recall、信頼区間、代表性から考える評価設計

こんにちは。Qualiteg研究部です。 私たちは、個人情報(PII)や機密情報、要配慮個人情報を含むセンシティブな情報を検出・マスキングする技術(https://pii-fi.com)の開発に取り組んでいます。 その中で日々向き合っているのが、 「精度の数字を、どうすれば正直に、正しく語れるのか」 という問題です。 たとえば、検出器の Recall(再現率)が 0.95 だったとします。 これは高い数字に見えます。しかし、その数字はどの種類の文書で測ったものなのか。正解データはどう作ったのか。サンプル数は十分なのか。別の業務文書にも同じ数字を当てはめてよいのか。 精度の数字は、単独ではほとんど意味を持ちません。 「何を、どの条件で、どう数えたか」とセットになって、はじめて実務で使える数字になります。 本記事では、私たちが PII 検出の精度評価に取り組む中で得た、精度を誠実に語るための考え方を紹介します。アルゴリズムの中身ではなく、評価のしかたに焦点を当てます。 1. はじめに:「Recall 0.95

By Qualiteg 研究部
一文の依頼で、調査から資料作成まで。AIエージェント「Bestllam」のデモ動画を公開しました

一文の依頼で、調査から資料作成まで。AIエージェント「Bestllam」のデモ動画を公開しました

こんにちは! 本日は当社の統合AIプラットフォーム "Bestllam®" の AIエージェント機能のデモをご紹介いたします! 「指示は出せても、AIが本当に仕事を仕上げてくれるのか」 生成AIを業務に取り入れる企業が増えています。 しかし現場からは、こんな本音も聞こえてきます。 「使い方を覚えるより、自分でやったほうが早い」 「指示を細かく出し直しているうちに、結局時間がかかる」 「便利なのは分かるが、機密情報を入力していいのか不安」 AIを"個人の便利ツール"の域から、"部門の成果"へと引き上げる。 これが当社の法人向け統合AIプラットフォーム Bestllam(ベストラム) が掲げるテーマです。 今回、そのAIエージェント機能を実際の操作画面とともに紹介する動画を公開しました。 たった一文の依頼が、7枚のレポートになるまで 動画のデモはシンプルです。エージェントに、こう入力します。 「先月の売上を年代別に分析し、資料にまとめてください」 これだけです。すると、エージェントはまず自分でTODOリストを組み立て、何をどの順番で進めるかという段取りを示します

By Qualiteg ビジネス開発本部 | マーケティング部
NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

こんにちは! Qualitegプロダクト開発部です! 今日は、Windows + WSL2 のマシンに RTX 4090 を2枚挿して、大規模なオープンモデルを vLLM で動かそうとしたら、NCCL の初期化で見事に詰まった話を書きます。 世の中に断片的にしか情報がなく、抜けるまでにかなり粘ったので、同じ構成で消耗している方の時間を少しでも節約できれば嬉しいです。 経緯 今回の目的は、次々と登場する最新のオープンモデル(オープンウェイトのLLM)を、手元で評価することでした。 オープンモデルは数週間単位で新しいものが出てきます。ベンチマークの数字だけでなく、自分たちのユースケースに対して実際にどう振る舞うのか——出力の質、速度、量子化したときの劣化具合、エージェント的なタスクの得手不得手——を、手を動かして確かめています 今回の環境は Windows + WSL2(Ubuntu) に RTX 4090 を2枚(各24GB)挿したマシンです。 nvidia-smi 上の CUDA Version は 12.8。 動かすのは大規模オープンモデルを

By Qualiteg プロダクト開発部
Claude Codeで「The model's tool call could not be parsed」が頻発する問題の原因分析と対策

Claude Codeで「The model's tool call could not be parsed」が頻発する問題の原因分析と対策

こんにちは!Qualitegプロダクト開発部です。 Claude Code(CLI)を使った開発中に、次のようなエラーが繰り返し表示されて作業が止まる現象に遭遇しました。 ● The model's tool call could not be parsed (retry also failed). リトライしても直らず、/clear で会話をリセットしても、しばらく作業を続けるとまた同じエラーが出るという状況です。本記事では、実際のセッションログ(jsonl)を解析して特定した原因と、その対策について共有します。 結論から書くと、これは利用者側の設定ミスやコンテキスト枯渇が原因ではなく、 Opus 4.7(1Mコンテキスト)+ extended thinking の組み合わせで発生する、モデル応答側のストリーミングバグ でした。 現象 エラーが発生した環境は以下のとおりです。 * Claude Code 2.1.148 * モデル: Opus 4.

By Qualiteg プロダクト開発部