シェルスクリプトからcondaコマンドを活用したいとき

シェルスクリプトからcondaコマンドを活用したいとき

こんにちは!

今日はみんな大好きcondaコマンドについてです。
condaコマンドで仮想環境に入って、何らかの処理をして、戻ってくる ようなシェルスクリプト、バッチタスクをやるときのTipsです。

AI開発において、Anacondaとその中核であるcondaパッケージマネージャーはとっても重宝します。
しかし、シェルスクリプトから自動的にcondaを利用しようとすると、意外なハードルがあります。

本記事では、シェルスクリプトからcondaコマンドを正しく呼び出す方法について解説します。

condaと非対話モードの課題

AnacondaがインストールされているLinux環境において、condaコマンドは通常、.bashrc.bash_profileなどの設定ファイルによって初期化されます。

なんとなくシェルをつかっていると、このcondaコマンドの初期化を忘れてしまいますが、これらの設定は多くの場合シェルの「対話モード」でのみ有効になるように設計されています。

ゆえにシェルスクリプトのような非対話モードでは、condaコマンドが正しく機能してくれません

例えば、.bashrcファイル内のconda初期化部分には、以下のような条件が含まれています

# >>> conda initialize >>>
if [[ $- == *i* ]]; then  # 対話モードの場合のみ実行
    . "/path/to/anaconda3/etc/profile.d/conda.sh"
fi
# <<< conda initialize <<<

ここでの if [[ $- == *i* ]] が対話モードチェックであり、シェルスクリプトのような非対話環境では、この条件に合致せずconda初期化が行われません。
つまりシェルスクリプトの中でcondaコマンドがうまく動いてくれません。

解決策→enable_conda.shスクリプト

この問題を解決するために、以下のようなスクリプトを作成しましょう

#!/bin/bash
###[enable_conda.sh]###########################################################
# condaの初期化を明示的に行う
# ~/.bashrcの対話モードチェックをバイパスするために、条件部分を直接実行する

# ユーザーのホームディレクトリを使用
CONDA_PATH="$HOME/anaconda3"

# condaの初期化部分を直接実行
__conda_setup="$('$CONDA_PATH/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "$CONDA_PATH/etc/profile.d/conda.sh" ]; then
        . "$CONDA_PATH/etc/profile.d/conda.sh"
    else
        export PATH="$CONDA_PATH/bin:$PATH"
    fi
fi
unset __conda_setup

# パスを確認
echo "使用するcondaのパス: $(which conda)"
echo "condaのバージョン: $(conda --version)"
###[/enable_conda.sh]#########################################################

このスクリプトでは、

  1. 対話モードチェックをバイパスして、直接conda初期化コードを実行します
  2. 環境変数を適切に設定し、condaコマンドをシェルスクリプト中からも使用可能にします

sourceコマンドの重要性

さて、このスクリプトの効果を得るためには、これをsourceコマンドをつかって実行するのがポイントです

source ./enable_conda.sh
# または
. ./enable_conda.sh  # ドットコマンド(sourceと同等)

復習)sourceコマンドとは?

sourceコマンドは、指定されたファイル内のコマンドを現在のシェルプロセス内で直接実行するためのシェルビルトインコマンドです。これには以下のような特徴があります

  • ファイル内のコマンドが現在のシェルプロセス内で実行される
  • 環境変数の変更やエイリアスの定義など、シェルの状態変更が現在のセッションに反映される
  • .(ドット)コマンドと同じ機能を持つ

sourceと直接実行の違い

普段あまり気にしていませんが、スクリプトを直接実行する場合との違いは以下のようになります

実行方法 プロセス 環境変数への影響 Condaの場合
sh script.sh 新しいシェルプロセス(子プロセス)を作成 スクリプト内で設定された環境変数は終了後に失われる 初期化は子プロセスでのみ有効、親シェルではcondaコマンドは使えない
source script.sh 現在のシェルプロセス内で直接実行 環境変数の変更が現在のシェルに保持される 現在のシェルでconda初期化が行われ、以降condaコマンドが使える

Condaのような環境管理ツールを初期化するスクリプトでは、現在のシェル環境に変更を反映させる必要があるため、必ずsourceコマンドを使用しましょう

実践的な使用例

以下のように使用することができます

バッチ処理スクリプト

#!/bin/bash
# データ処理バッチジョブ

# condaを初期化
source /path/to/enable_conda.sh

# 特定の環境をアクティベート
conda activate myenv

# Pythonスクリプトを実行
python /path/to/process_data.py

# 処理完了後、基本環境に戻る
conda deactivate

定期実行(cron)ジョブ

crontabファイル:

# 毎日午前2時にデータ更新を実行
0 2 * * * /bin/bash /path/to/daily_update.sh

daily_update.sh:

#!/bin/bash
# conda初期化
source /home/user/scripts/enable_conda.sh

# 環境をアクティベート
conda activate analysis_env

# スクリプト実行
python /home/user/projects/update_database.py

# ログ出力
echo "$(date): データベース更新完了" >> /home/user/logs/cron.log

上記のようにスクリプトを別ファイルにしなくてもそんなにながくないので、実行していスクリプトに直接conda初期化コードを入れてしまってもOKですね

まとめ

シェルスクリプトからcondaコマンドを使用するには

  1. 対話モードチェックをバイパスする初期化スクリプト(enable_conda.sh)を作成する(またスクリプトに入れちゃってもOK)
  2. 外部スクリプトにする場合は、それをsourceコマンドで実行し、現在のシェル環境にconda設定をおぼえさせる
  3. 環境変数を活用して、異なる環境でも再利用可能にする

ということで、シェルスクリプトのなかで気軽にcondaが使えるようになりました!

Read more

LLM推論基盤プロビジョニング講座 第4回 推論エンジンの選定

LLM推論基盤プロビジョニング講座 第4回 推論エンジンの選定

こんにちは!前回までの講座では、LLMサービス構築に必要なリクエスト数の見積もりや、使用モデルの推論時消費メモリ計算について詳しく解説してきました。今回は7ステッププロセスの4番目、「推論エンジンの選定」について詳しく掘り下げていきます。 推論エンジンとは何か 推論エンジンとは、GPU上でLLMモデルの推論計算(テキスト生成)を効率的に行うために設計された専用のソフトウェアプログラムです。一般的なディープラーニングフレームワーク(PyTorch、TensorFlowなど)でも推論は可能ですが、実運用環境では専用の推論エンジンを使用することで、大幅なパフォーマンス向上とリソース効率化が期待できます。 推論エンジンは単なる実行環境ではなく、様々な最適化技術を実装しています。特定のモデルアーキテクチャに特化した最適化機能を実装したものや、推論速度の高速化に特化したもの、前回解説したKVキャッシュのメモリ効率化機能を備えたものなど、それぞれ特徴が異なります。そのため、自社で採用したLLMモデルや運用環境、要件に合致した推論エンジンを選定することが重要です。 推論エンジン選定のアプロ

By Qualiteg コンサルティング
発話音声からリアルなリップシンクを生成する技術 第1回:音素とwav2vec

発話音声からリアルなリップシンクを生成する技術 第1回:音素とwav2vec

こんにちは! 今日は当社のMotionVox でも実際に使っている「リップシンク」技術について総合的に解説してみたいとおもいます。 音声に合わせて自然な口の動きを生成するリップシンク技術は、AIアバターや3Dアニメーション制作においても重要な技術です。 本記事では、最新のディープラーニング技術を活用したリップシンク学習の基礎から実装まで、技術的な観点から詳しく解説します。 1. リップシンク学習の基礎概念 1.1 問題設定 リップシンク学習とは、音声データから対応する口の動きを予測する回帰問題ととらえることができます f: 音声特徴量(t) → 口の動きパラメータ(t) この問題のコアは 音韻(音の特徴)と視素(視覚的な口の形)の対応関係を学習する ことにあります。 1.2 音韻-視素マッピングの複雑性 ただし! 人間の発話における音と口の形の関係は、単純な1対1マッピングではないんです。 同じ音でも文脈で変化 「あ」の発音でも: - 「か」の後の「あ」→ 口がやや狭めから開く - 「ん」の後の「あ」→ 口が閉じた状態から大きく開く 調音結合

By Qualiteg 研究部, Qualiteg コンサルティング
LLM推論基盤プロビジョニング講座 第3回 使用モデルの推論時消費メモリ見積もり

LLM推論基盤プロビジョニング講座 第3回 使用モデルの推論時消費メモリ見積もり

こんにちは!前回はLLMサービスへのリクエスト数見積もりについて解説しました。今回は7ステッププロセスの3番目、「使用モデルの推論時消費メモリ見積もり」について詳しく掘り下げていきます。 GPUメモリがリクエスト処理能力を決定する LLMサービス構築において、GPUが同時に処理できるリクエスト数はGPUメモリの消費量によって制約されます。 つまり、利用可能なGPUメモリがどれだけあるかによって、同時に何件のリクエストを処理できるかがほぼ決まります。 では、その具体例として、Llama3 8B(80億パラメータ)モデルをNVIDIA RTX A5000(24GB)にロードするケースを考えてみましょう。 このGPUには24GBのGPUメモリがありますが、すべてをリクエスト処理に使えるわけではありません。最初にモデル自体が一定量のメモリを消費し、残りの領域で実際のリクエスト処理を行います。 GPUメモリ消費の二大要素 GPUの消費メモリ量は主に以下の2つの要素によって決まります 1. モデルのフットプリント LLMをGPUに読み込んだときに最初に消費されるメモリ

By Qualiteg コンサルティング
システムとcondaのC++標準ライブラリ(libstdc++)のバージョン違い問題による事象と対処法解説

システムとcondaのC++標準ライブラリ(libstdc++)のバージョン違い問題による事象と対処法解説

こんにちは! 先日、dlibをつかったPythonアプリケーション(conda環境で動作する)作っていたところ、以下のようなエラーに遭遇しました。 ImportError: /home/mlu/anaconda3/envs/example_env/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (required by /home/mlu/anaconda3/envs/example_env/lib/python3.10/site-packages/_dlib_pybind11.cpython-310-x86_64-linux-gnu.so) 「dlib_pybind11モジュールがGLIBCXX_3.4.32を要求してるけど、みつからない!」という感じのエラーですね。

By Qualiteg プロダクト開発部