ChatStream Guide

[ChatStream] Web API エンドポイントの実装

Qualiteg プロダクト開発部

2023年11月13日 — 1 min read

こんにちは！ (株)Qualiteg プロダクト開発部です！

本稿では、 ChatStream を FastAPI の Web API として実装する方法についてご説明いたします！

エンドポイントの実装

/chat_stream という URL パスに、ストリーミングチャット用のWebエンドポイントをつくるには
以下のように handle_chat_stream_request を呼び出します。

これだけで、ユーザーからのリクエストは　文章生成の同時実行数を制御したストリーミングチャットの実装は完了です

@app.post("/chat_stream")
async def stream_api(request: Request):
    # handling FastAPI/Starlette's Request
    response = await chat_stream.handle_chat_stream_request(request)
    return response

メッセージインターセプト

FastAPI/Starlette を利用している場合、エンドポイントで await request.body() や await request.json() を実行すると、
リクエストストリームを消費(consume)してしまうため、 ChatStream にリクエストを委譲する前にリクエストをインターセプトをする場合は以下のように実装します

import json
from fastapi import FastAPI, Request

@app.post("/chat_stream")
async def stream_api(request: Request):

    # Request を インターセプトする場合
    request_body = await request.body()
    data = json.loads(request_body)
    
    user_input = data["user_input"]
    regenerate = data["regenerate"]

    print(f"user_input:{user_input} regenerate:{regenerate}")
    
    # インターセプトした場合は `request_body` を指定する
    response = await chat_stream.handle_chat_stream_request(request, request_body)

    return response

チャットストリームの送出完了のコールバックを受け取る

ChatStream では、ストリーミングレスポンスを行うため、エンドポイントで return reponse を行ったタイミングが文章生成処理の終了ではありません。

そこで、文章生成の完了のタイミングをキャッチしたい場合、
エンドポイントの実装で、 handle_chat_stream_request の引数 callback にコールバック関数を指定します。

文章生成が完了すると、指定したコールバック関数が呼び出されます

@app.post("/chat_stream")
async def stream_api(request: Request):

    def callback_func(request, message):
        # 文章生成が終了したとき
        
        # ここでは、セッションに格納されている ChatPrompt を取得して、これまでの会話履歴をもとにプロンプトを生成する例
        session_mgr = getattr(request.state, "session", None)
        session = session_mgr.get_session()
        chat_prompt = session.get("chat_prompt")
        print(chat_prompt.create_prompt())

    pass

    response = await chat_stream.handle_chat_stream_request(request, callback=callback_func)

    return response

文章生成終了時のコールバック関数のパラメータ message の取り得る値と意味

message の値	説明
success	ストリームがクライアントに向け正常に送出された
client_disconnected_while_streaming	ストリーム送出中にクライアントから切断された
client_disconnected_before_streaming	ストリーム送出前にクライアントから切断されていた
unknown_error_occurred	ストリーム送出中に予期せぬエラーが発生した

[ChatStream] Web API エンドポイントの実装

Qualiteg プロダクト開発部

エンドポイントの実装

メッセージインターセプト

チャットストリームの送出完了のコールバックを受け取る

文章生成終了時のコールバック関数のパラメータ message の取り得る値と意味

Read more

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回基本概念の理解

自治体総合フェア2025に出展いたしました

発話音声からリアルなリップシンクを生成する技術第3回：wav2vec特徴量から口形パラメータへの学習

AI時代のデータ漏洩防止の要諦とテクノロジー：第1回 AI DLPとPROXY

エンドポイントの実装

メッセージインターセプト

チャットストリームの送出完了のコールバックを受け取る

文章生成終了時のコールバック関数のパラメータ message の取り得る値と意味

Read more

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回 基本概念の理解

自治体総合フェア2025に出展いたしました

発話音声からリアルなリップシンクを生成する技術 第3回：wav2vec特徴量から口形パラメータへの学習

AI時代のデータ漏洩防止の要諦とテクノロジー：第1回 AI DLPとPROXY

大企業のAIセキュリティを支える基盤技術 - 今こそ理解するActive Directory 第1回基本概念の理解

発話音声からリアルなリップシンクを生成する技術第3回：wav2vec特徴量から口形パラメータへの学習