[ChatStream] ChatPrompt の実装

[ChatStream] ChatPrompt の実装

ChatPrompt とは

こんにちは! (株)Qualiteg プロダクト開発部 です!

本稿では、 ChatPrompt の具体的な実装方法をご紹介いたします!

ChatPrompt とは、事前学習済言語モデル(以降、モデル)用のプロンプトを生成するためのクラスです。プロンプトクラスと呼びます。

たとえば、 redpajama-incite の場合は以下のようなプロンプトをつくり、モデルに入力します。

<human>: Who is Alan Turing
<bot>:

すると、モデルは続きの文章を生成し、以下を出力します。

<human>: Who is Alan Turing
<bot>: He was a very honorable man.

この例では <human><bot> の後に : が続き、\n で区切られています。

こうしたルール、お作法はモデルごとに微妙に異なっています。

このプロンプトの生成や会話履歴の保持を行うクラスが ChatPrompt で、 プロンプトクラス と呼びます。

前述の通り、モデルごとにお作法が違うので、モデルごとの プロンプトクラス が必要になります。

プリセット プロンプトクラス

ChatStream では、いくつかの有名なモデルについてはプロンプトクラス = ChatPromptクラス を準備しています。

プロンプトクラスの自作

新しいモデルなど、まだプロンプトクラスが無い場合は自作することができます。

ChatPrompt プロンプトクラスの実装

プロンプトクラスの役割は以下のとおりです

  • 1. ユーザーの入力や、これまでの会話履歴をもとにモデル用のプロンプトを出力する
  • 2. 文章を適切に生成するため、
    • 2-1. 文章生成を停止する特殊トークンを情報を持つ
    • 2-2. 特定のトークンの変換情報を持つ

プロンプトはモデルごとにお作法が異なるので、そのお作法の違いを実装します

といっても、基本は文章の連結ルールを定義するだけなので難しくありません

プロンプトクラスの基底クラスのインポート

プロンプトクラスのもととなる、 AbstractChatPrompt クラスをインポートします

from chatstream import AbstractChatPrompt

基底クラスのオーバーライド

AbstractChatPrompt クラスは抽象クラスなので、必要なメソッドをオーバーライドしていきます

以下は rinna/japanese-gpt-neox-3.6b-instruction-sft 用のプロンプトクラスの実装例です

このモデルでは、以下のようなプロンプトのフォーマットを出力することが目的です

ユーザー: 日本のおすすめの観光地を教えてください。<NL>システム: どの地域の観光地が知りたいですか?<NL>ユーザー: 渋谷の観光地を教えてください。<NL>システム: 

実装は以下のようになります

from chatstream import AbstractChatPrompt


class ChatPromptRinnaJapaneseGPTNeoxInst(AbstractChatPrompt):
    def __init__(self):
        super().__init__()
        self.set_requester("ユーザー")  # モデルに対して要求する側のロール名 を指定します
        self.set_responder("システム")  # 返信する側=モデル のロール名 を指定します

    def get_stop_strs(self):
        return []  # あるキーワードが来たら文章生成を停止したい場合はここにキーワードを列挙します

    def get_replacement_when_input(self):
        return [("\n", "<NL>")]  # 入力時の入力テキストの置換ルール

    def get_replacement_when_output(self):
        return [("<NL>", "\n")]  # 出力時の出力テキストの置換ルール

    def create_prompt(self, opts={}):
        # プロンプトを構築していきます
        ret = self.system;
        # get_contents でこれまでの会話履歴リストを取得
        for chat_content in self.get_contents(opts):
            # ロール名を取得
            chat_content_role = chat_content.get_role()
            # メッセージを取得
            chat_content_message = chat_content.get_message()

            if chat_content_role:

                if chat_content_message:
                    # メッセージパートが存在する場合
                    merged_message = chat_content_role + ": " + chat_content_message + "<NL>"
                else:
                    merged_message = chat_content_role + ": "

                ret += merged_message

        return ret

    def build_initial_prompt(self, chat_prompt):
        # 初期プロンプトは実装しない
        pass

プロンプトクラスの実装:ロールの設定

  • コンストラクタで、基底クラスの __init__() を呼び出します
  • 2者間チャットの場合は、 set_requesterset_responder でロール名を指定します。
def __init__(self):
    super().__init__()
    self.set_requester("ユーザー")  # モデルに対して要求する側のロール名 を指定します
    self.set_responder("システム")  # 返信する側=モデル のロール名 を指定します

もしシステム全体の初期化メッセージが必要な場合は set_system メソッドでシステムメッセージをセットします

def __init__(self):
    super().__init__()
    self.set_system("ユーザーとシステムからなるチャットシステムです。システムはユーザーに対して丁寧かつ正確な回答をするよう心がけます")
    self.set_requester("ユーザー")  # モデルに対して要求する側のロール名 を指定します
    self.set_responder("システム")  # 返信する側=モデル のロール名 を指定します

プロンプトクラスの実装:停止文字列の設定

  • 停止文字列を指定すると、特定のキーワード、トークンが出現した場合に文章生成を停止させることができます。
  • 無指定の場合は return [] とします
  • 停止文字列 と EOSトークン は異なります。ここで停止文字列を無指定にしても
    tokenizer にあらかじめ設定されている EOSトークン (tokenizer.eos_token_id)でも文章生成は停止します。
    def get_stop_strs(self):


    return ['</s>']  # '</s>' が出現したら、そこで文章生成を停止する

プロンプトクラスの実装:入力テキストの置換ルールの設定

チャットの実装では基本的にユーザーが入力した文章をモデルに入力しますが、モデルに入力できない文字やモデルに入力する際に変換が必要になる場合があります。

たとえば、ユーザーが入力した文章に \n (改行) が含まれているが、モデルが \n を受け付けられない場合は \n を適切な文字列に置換する必要があります。

ユーザーの入力をモデルに入力するときに置換するには以下のように指定します

    def get_replacement_when_input(self):


    return [("\n", "<NL>")]  # 入力時の入力テキストの置換ルール

ここでは \n<NL> に置換するように指定しています。("\n", "<NL>") のように組み合わせをタプルで指定します。
複数の置換パターンを登録したいときはこのタプルを複数指定します。

プロンプトクラスの実装:出力テキストの置換ルールの設定

モデルが出力した文章内に登場するキーワードを置換することができます。

例えば、モデルの出力が おはようございます。<NL>何か御用でしょうか だった場合に <NL> を 改行を示す \n に置換したいときに以下のように設定することで
出力を置換することができます

   def get_replacement_when_output(self):


   return [("<NL>", "\n")]  # 出力時の出力テキストの置換ルール

プロンプトクラスの実装:プロンプトの生成

過去の会話履歴を含めたプロンプト全体を生成するのが create_prompt メソッドです。

過去の会話履歴は self.get_contents() で取得することができます。

get_contents の戻り値は リストで、値には ChatContent クラスのインスタンスが格納されます

ChatContent クラスは1件分のチャット内容が格納されておりchat_content.getRole() でロール名、 chat_content.get_message()
でそのロールの発話内容(テキスト)が取得できます。

これらをつなぎあわせるロジックを記述することで、モデルが期待するフォーマットのプロンプトを生成することができます

    def create_prompt(self, opts={}):


# プロンプトを構築していきます
ret = self.system;
# get_contents でこれまでの会話履歴リストを取得
for chat_content in self.get_contents(opts):
    # ロール名を取得
    chat_content_role = chat_content.get_role()
    # メッセージを取得
    chat_content_message = chat_content.get_message()

    if chat_content_role:

        if chat_content_message:
            # メッセージパートが存在する場合
            merged_message = chat_content_role + ": " + chat_content_message + "<NL>"
        else:
            merged_message = chat_content_role + ": "

        ret += merged_message

return ret

プロンプトクラスの実装:初期プロンプト、初期コンテクストの生成

モデルによっては、事前に、ある程度会話のコンテクストを設定しておきたい場合があります。

いきなりモデルに入力して文章させることを ゼロショット と呼びますが、
事前にいくらか入力しておいて、前提知識や、例示などをあたえると、その後の出力が安定する場合があります。

これを ワンショットやフューショット などと呼びます。

チャットの場合はある特定の話題から会話を開始する、などの用途でも用います

以下は初期コンテクストとして、映画「タイタニック」と会話している状態からチャットを開始するための例です

build_initial_promptメソッドをオーバーライドします

def build_initial_prompt(self, chat_prompt):
    chat_prompt.add_requester_msg("Do you know about the Titanic movie?")
    chat_prompt.add_responder_msg("Yes, I am familiar with it.")
    chat_prompt.add_requester_msg("Who starred in the movie?")
    chat_prompt.add_responder_msg("Leonardo DiCaprio and Kate Winslet.")

Read more

Claude Codeで正規の運用作業が「Usage Policy違反」になる理由 ── リアルタイム・サイバーセーフガードの誤検知と対処法

Claude Codeで正規の運用作業が「Usage Policy違反」になる理由 ── リアルタイム・サイバーセーフガードの誤検知と対処法

こんにちは! 今日は、Claude Code を使っていると突然出てくる「Usage Policy違反」エラー いわゆる リアルタイム・サイバーセーフガードの誤検知(false positive) について、その傾向と対処法を詳しく解説します! 自社サーバへのデプロイ作業中や、ごく普通のインフラ運用の最中に、こんなメッセージが出て手が止まった経験はありませんか? API Error: Claude Code is unable to respond to this request, which appears to violate our Usage Policy. This request triggered cyber-related safeguards. やっていたのは、自分のサーバー への SSH デプロイと、自社リポジトリへのコミット指示だけ。 攻撃的な操作は何ひとつ含まれていないはずなのに、ブロックされてしまう… そんな状況に心当たりのある方は、

By Qualiteg プロダクト開発部
個人情報検出の精度を、どう正しく語るか ― Recall、信頼区間、代表性から考える評価設計

個人情報検出の精度を、どう正しく語るか ― Recall、信頼区間、代表性から考える評価設計

こんにちは。Qualiteg研究部です。 私たちは、個人情報(PII)や機密情報、要配慮個人情報を含むセンシティブな情報を検出・マスキングする技術(https://pii-fi.com)の開発に取り組んでいます。 その中で日々向き合っているのが、 「精度の数字を、どうすれば正直に、正しく語れるのか」 という問題です。 たとえば、検出器の Recall(再現率)が 0.95 だったとします。 これは高い数字に見えます。しかし、その数字はどの種類の文書で測ったものなのか。正解データはどう作ったのか。サンプル数は十分なのか。別の業務文書にも同じ数字を当てはめてよいのか。 精度の数字は、単独ではほとんど意味を持ちません。 「何を、どの条件で、どう数えたか」とセットになって、はじめて実務で使える数字になります。 本記事では、私たちが PII 検出の精度評価に取り組む中で得た、精度を誠実に語るための考え方を紹介します。アルゴリズムの中身ではなく、評価のしかたに焦点を当てます。 1. はじめに:「Recall 0.95

By Qualiteg 研究部
一文の依頼で、調査から資料作成まで。AIエージェント「Bestllam」のデモ動画を公開しました

一文の依頼で、調査から資料作成まで。AIエージェント「Bestllam」のデモ動画を公開しました

こんにちは! 本日は当社の統合AIプラットフォーム "Bestllam®" の AIエージェント機能のデモをご紹介いたします! 「指示は出せても、AIが本当に仕事を仕上げてくれるのか」 生成AIを業務に取り入れる企業が増えています。 しかし現場からは、こんな本音も聞こえてきます。 「使い方を覚えるより、自分でやったほうが早い」 「指示を細かく出し直しているうちに、結局時間がかかる」 「便利なのは分かるが、機密情報を入力していいのか不安」 AIを"個人の便利ツール"の域から、"部門の成果"へと引き上げる。 これが当社の法人向け統合AIプラットフォーム Bestllam(ベストラム) が掲げるテーマです。 今回、そのAIエージェント機能を実際の操作画面とともに紹介する動画を公開しました。 たった一文の依頼が、7枚のレポートになるまで 動画のデモはシンプルです。エージェントに、こう入力します。 「先月の売上を年代別に分析し、資料にまとめてください」 これだけです。すると、エージェントはまず自分でTODOリストを組み立て、何をどの順番で進めるかという段取りを示します

By Qualiteg ビジネス開発本部 | マーケティング部
NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

こんにちは! Qualitegプロダクト開発部です! 今日は、Windows + WSL2 のマシンに RTX 4090 を2枚挿して、大規模なオープンモデルを vLLM で動かそうとしたら、NCCL の初期化で見事に詰まった話を書きます。 世の中に断片的にしか情報がなく、抜けるまでにかなり粘ったので、同じ構成で消耗している方の時間を少しでも節約できれば嬉しいです。 経緯 今回の目的は、次々と登場する最新のオープンモデル(オープンウェイトのLLM)を、手元で評価することでした。 オープンモデルは数週間単位で新しいものが出てきます。ベンチマークの数字だけでなく、自分たちのユースケースに対して実際にどう振る舞うのか——出力の質、速度、量子化したときの劣化具合、エージェント的なタスクの得手不得手——を、手を動かして確かめています 今回の環境は Windows + WSL2(Ubuntu) に RTX 4090 を2枚(各24GB)挿したマシンです。 nvidia-smi 上の CUDA Version は 12.8。 動かすのは大規模オープンモデルを

By Qualiteg プロダクト開発部