シェルスクリプトからcondaコマンドを活用したいとき

シェルスクリプトからcondaコマンドを活用したいとき

こんにちは!

今日はみんな大好きcondaコマンドについてです。
condaコマンドで仮想環境に入って、何らかの処理をして、戻ってくる ようなシェルスクリプト、バッチタスクをやるときのTipsです。

AI開発において、Anacondaとその中核であるcondaパッケージマネージャーはとっても重宝します。
しかし、シェルスクリプトから自動的にcondaを利用しようとすると、意外なハードルがあります。

本記事では、シェルスクリプトからcondaコマンドを正しく呼び出す方法について解説します。

condaと非対話モードの課題

AnacondaがインストールされているLinux環境において、condaコマンドは通常、.bashrc.bash_profileなどの設定ファイルによって初期化されます。

なんとなくシェルをつかっていると、このcondaコマンドの初期化を忘れてしまいますが、これらの設定は多くの場合シェルの「対話モード」でのみ有効になるように設計されています。

ゆえにシェルスクリプトのような非対話モードでは、condaコマンドが正しく機能してくれません

例えば、.bashrcファイル内のconda初期化部分には、以下のような条件が含まれています

# >>> conda initialize >>>
if [[ $- == *i* ]]; then  # 対話モードの場合のみ実行
    . "/path/to/anaconda3/etc/profile.d/conda.sh"
fi
# <<< conda initialize <<<

ここでの if [[ $- == *i* ]] が対話モードチェックであり、シェルスクリプトのような非対話環境では、この条件に合致せずconda初期化が行われません。
つまりシェルスクリプトの中でcondaコマンドがうまく動いてくれません。

解決策→enable_conda.shスクリプト

この問題を解決するために、以下のようなスクリプトを作成しましょう

#!/bin/bash
###[enable_conda.sh]###########################################################
# condaの初期化を明示的に行う
# ~/.bashrcの対話モードチェックをバイパスするために、条件部分を直接実行する

# ユーザーのホームディレクトリを使用
CONDA_PATH="$HOME/anaconda3"

# condaの初期化部分を直接実行
__conda_setup="$('$CONDA_PATH/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "$CONDA_PATH/etc/profile.d/conda.sh" ]; then
        . "$CONDA_PATH/etc/profile.d/conda.sh"
    else
        export PATH="$CONDA_PATH/bin:$PATH"
    fi
fi
unset __conda_setup

# パスを確認
echo "使用するcondaのパス: $(which conda)"
echo "condaのバージョン: $(conda --version)"
###[/enable_conda.sh]#########################################################

このスクリプトでは、

  1. 対話モードチェックをバイパスして、直接conda初期化コードを実行します
  2. 環境変数を適切に設定し、condaコマンドをシェルスクリプト中からも使用可能にします

sourceコマンドの重要性

さて、このスクリプトの効果を得るためには、これをsourceコマンドをつかって実行するのがポイントです

source ./enable_conda.sh
# または
. ./enable_conda.sh  # ドットコマンド(sourceと同等)

復習)sourceコマンドとは?

sourceコマンドは、指定されたファイル内のコマンドを現在のシェルプロセス内で直接実行するためのシェルビルトインコマンドです。これには以下のような特徴があります

  • ファイル内のコマンドが現在のシェルプロセス内で実行される
  • 環境変数の変更やエイリアスの定義など、シェルの状態変更が現在のセッションに反映される
  • .(ドット)コマンドと同じ機能を持つ

sourceと直接実行の違い

普段あまり気にしていませんが、スクリプトを直接実行する場合との違いは以下のようになります

実行方法 プロセス 環境変数への影響 Condaの場合
sh script.sh 新しいシェルプロセス(子プロセス)を作成 スクリプト内で設定された環境変数は終了後に失われる 初期化は子プロセスでのみ有効、親シェルではcondaコマンドは使えない
source script.sh 現在のシェルプロセス内で直接実行 環境変数の変更が現在のシェルに保持される 現在のシェルでconda初期化が行われ、以降condaコマンドが使える

Condaのような環境管理ツールを初期化するスクリプトでは、現在のシェル環境に変更を反映させる必要があるため、必ずsourceコマンドを使用しましょう

実践的な使用例

以下のように使用することができます

バッチ処理スクリプト

#!/bin/bash
# データ処理バッチジョブ

# condaを初期化
source /path/to/enable_conda.sh

# 特定の環境をアクティベート
conda activate myenv

# Pythonスクリプトを実行
python /path/to/process_data.py

# 処理完了後、基本環境に戻る
conda deactivate

定期実行(cron)ジョブ

crontabファイル:

# 毎日午前2時にデータ更新を実行
0 2 * * * /bin/bash /path/to/daily_update.sh

daily_update.sh:

#!/bin/bash
# conda初期化
source /home/user/scripts/enable_conda.sh

# 環境をアクティベート
conda activate analysis_env

# スクリプト実行
python /home/user/projects/update_database.py

# ログ出力
echo "$(date): データベース更新完了" >> /home/user/logs/cron.log

上記のようにスクリプトを別ファイルにしなくてもそんなにながくないので、実行していスクリプトに直接conda初期化コードを入れてしまってもOKですね

まとめ

シェルスクリプトからcondaコマンドを使用するには

  1. 対話モードチェックをバイパスする初期化スクリプト(enable_conda.sh)を作成する(またスクリプトに入れちゃってもOK)
  2. 外部スクリプトにする場合は、それをsourceコマンドで実行し、現在のシェル環境にconda設定をおぼえさせる
  3. 環境変数を活用して、異なる環境でも再利用可能にする

ということで、シェルスクリプトのなかで気軽にcondaが使えるようになりました!

Read more

AI時代のデータ漏洩防止の要諦とテクノロジー:第1回 AI DLPとPROXY

AI時代のデータ漏洩防止の要諦とテクノロジー:第1回 AI DLPとPROXY

こんにちは!本日はAI時代のデータ漏洩防止について、とくにその通信技術面に焦点をあてつつ、AIセキュリティにどのように取り組んでいくべきか、解説いたします。 1. はじめに 生成AIの急速な普及により、企業のデータガバナンスは新たな局面を迎えています。ChatGPTやClaudeといった大規模言語モデル(LLM)は、業務効率を飛躍的に向上させる一方で、意図しない機密情報の漏洩という深刻なリスクをもたらしています。 従業員が何気なく入力した顧客情報や営業秘密が、AIサービスの学習データとして使用される可能性があることを、多くの組織はまだ十分に認識していません。従来のDLP(Data Loss Prevention)ソリューションは、メールやファイル転送を監視することには長けていましたが、リアルタイムで行われるWebベースのAIチャットやAIエージェントとの対話で発生しうる新しい脅威には対応できていないのが現状です。 本記事では、AI時代のデータ漏洩防止において中核となる技術、特にHTTPS通信のインターセプトとその限界について、技術的な観点から詳しく解説します。プロキシサーバー

By Qualiteg プロダクト開発部, Qualiteg コンサルティング
LLM推論基盤プロビジョニング講座 第5回 GPUノード構成から負荷試験までの実践プロセス

LLM推論基盤プロビジョニング講座 第5回 GPUノード構成から負荷試験までの実践プロセス

こんにちは!これまでのLLM推論基盤プロビジョニング講座では、推論速度の定義、リクエスト数見積もり、メモリ消費量計算、推論エンジン選定について詳しく解説してきました。 今回は、残りのステップである「GPUノード構成見積もり」「負荷試験」「トレードオフ検討」について一気に解説し、最後に実際のサーバー構成例をご紹介します。 STEP5:GPUノード構成見積もり GPUメモリから考える同時リクエスト処理能力 LLMサービスを構築する際、どのGPUを何台選ぶかは非常に重要な決断です。今回はLlama 8Bモデルを例に、GPUメモリ容量と同時リクエスト処理能力の関係を見ていきましょう。 GPUメモリの使われ方を理解する ここは復習となりますが、 LLM推論においてGPUメモリは主に2つの用途で消費されます 1. モデル重みデータ: LLMモデル自体を格納するためのメモリ 2. KVキャッシュ: ユーザーとの対話コンテキストを保持するための一時メモリ Llama 8Bを16ビット精度で実行する場合、モデル重みデータは約16GBのメモリを占めます。これは固定的なメモリ消

By Qualiteg コンサルティング
発話音声からリアルなリップシンクを生成する技術 第2回:AIを使ったドリフト補正

発話音声からリアルなリップシンクを生成する技術 第2回:AIを使ったドリフト補正

こんにちは! 前回の記事では、当社のMotionVoxで使用している「リップシンク」技術について、wav2vecを用いた音声特徴量抽出の仕組みを解説しました。音声から正確な口の動きを予測するための基礎技術について理解いただけたかと思います。 今回は、その続編として、リップシンク制作における重要な技術的課題である「累積ドリフト」に焦点を当てます。wav2vecで高精度な音素認識ができても、実際の動画制作では複数の音声セグメントを時系列に配置する際、わずかなタイミング誤差が蓄積して最終的に大きなずれとなる現象が発生します。 本記事では、この累積ドリフトのメカニズムと、機械学習を活用した最新の補正技術について、実際の測定データを交えながら詳しく解説していきます。前回のwav2vecによる特徴抽出と今回のドリフト補正技術を組み合わせることで、MotionVoxがどのように高品質なリップシンクを実現しているのか、その全体像が見えてくるはずです。 累積ドリフトとは何か 基本概念 累積ドリフトとは、個々の音声セグメントが持つ微小なタイミング誤差が、時間の経過とともに蓄積していく現象で

By Qualiteg 研究部
AIエージェント時代の新たな番人「ガーディアンエージェント」とは?

AIエージェント時代の新たな番人「ガーディアンエージェント」とは?

こんにちは!今日は先日ガートナーが発表したガーディアンエージェントについて解説します ガートナーの公式定義 ハイプカーブで有名なガートナーは2025年6月に、ガーディアンエージェントに関する見解を発表しました。ガーディアン・エージェントとは、AIとの安全で信頼できるやりとりを支援するために設計されたAIベースのテクノロジです。 ざっくりいうと、 「AIエージェントが来るよ」と予言したガートナー社は、次は、「ガーディアンエージェントが来るよ」と予言しました。なぜガーディアンエージェントが来るのでしょうか?本稿では、そのあたりを考察していきたいと思います。 なぜ今、AIの「監視役」が必要なのか 2025年、私たちは本格的なAIエージェント時代の入り口に立っています。AIが単なるツールから、自律的に判断し行動する「エージェント」へと進化する中で、新たな課題が浮上しています。 従来のAIとエージェント型AIの違い さて、ガーディアンエージェントが必要になる理由として、生成AI(以後AIと呼びます)の急速な進化があげられます。従来のAIとエージェント型AIの違いを思い出

By Qualiteg コンサルティング