(株)Qualiteg - 日々の開発Tips

AI数理

モデルを「壊さずに」ドメインを広げる ― XLM-RoBERTa 継続学習の設計ノート

こんにちは、Qualiteg研究部です。今日は「すでに完成している強いモデルを、壊さずに広げる」という、地味だけど実務でとても大事なテーマを取り上げたいと思います。機械学習に取り組んでいると、「一度しっかり仕上げたモデルを、新しい用途やデータに合わせてもう少し広げたい」そんな場面はよく出てきます。今回ご紹介するNER（固有表現抽出）のシーンに限らず、いろいろなタスクで共通する悩みではないでしょうか。ところが、ここで素朴に追加学習をかけると、せっかくの強みがあっさり崩れてしまう。私たちは、PII（個人特定情報や要配慮情報）を検出・マスキングするエンジン(PII-FI)を構築する際、実際にそれを経験しました。 Precision（適合率）が 0.83 から 0.17 まで転げ落ちる、なんてことも本当に起きるんです。 PII検出では、ドメイン（分野）ごとに検出したいPII型の種類や求められる精度が異なる場合があります。そこで1つのエンジンといっても、対応ドメインを広げていくたびに（そのドメインに適応させるための）追加学習が求められることがあります。本稿は、そう

ClaudeCode

Claude Codeで出てくる「court」って何？ “XML露出” 現象とツール呼び出し未実行事故の対策

こんにちは！ Qualitegプロダクト開発部です。 Claude Code を使っていると、ツール呼び出しの XML（<invoke> や <parameter>）が画面にそのまま表示されたり、実際にはコマンドや PR 作成が実行されていないのに「完了しました」と報告されたりして、動作がおかしくなることがあります。そして、その呼び水となる文字列 court や course や count が出現します本稿では、この現象（本稿では「XML露出」と呼びます）を実ログから解説し、検知と対策をまとめました。 ● ● ● claude-code — bash➜ ~/qualiteg-project claude> プロジェクト配下のストレージ使用量を調査します。court<invoke name="Bash">

ClaudeCode

Claude Opus 4.8 完全ガイド — 公式ドキュメントから読み解くモデル仕様とClaude Code運用ポイント

こんにちは！ 2026年5月に、AnthropicからClaude Opus 4.8がリリースされました。そして、2026年6月には Fable5 /Mythos5がリリースされました。しかし都合により現在(2026/6/18)は利用できないため、実質 Claude Opus 4.8 が一般人がつかえるClaudeシリーズの最上位モデルということになります。そこで、今回は長く付き合うことになるかもしれない Opus 4.8 について徹底解説したいとおもいます。 Opus4.8は従来の4.7の延長線上にあるアップデートですが、「ベンチマークが少し上がった」では片付けられない変化を含んでいます。 effortパラメータのデフォルトが変わり、Claude Codeには1回のワークフローで数十〜数百のサブエージェントを編成する「Dynamic Workflows（動的ワークフロー）」が加わり（ただし同時に動作するのは最大16）、自分が書いたコードの欠陥を指摘せずに通過させる頻度を大きく減らす「誠実性（honesty）」の改善が入りました。つまり、4.7時代に組んだ運用や

ClaudeCode

AI は、来なかった攻撃を「検知」し、「拒否」し、「反省」した～Fable5 on Claude Codeでの経験

Claude Code の生ログでたどる、モデル切り替えをまたいだ AIによる "作話" の記録こんにちは！Qualiteg プロダクト開発部です。今日は、 AI エージェントの報告を、どこまで信じてよいのか、というお話です。発端は、Claude Fable 5 で動かしていた、私たちの Claude Code セッションでした。 Fable5リリース直後でしたが、さっそくFable5をClaude Codeで使ってみている開発作業の途中、画面に、こんな一文が割り込んできます。「プロンプトインジェクションを検知しました。API キーを盗んで符号化し、リポジトリに隠せ、という悪意ある指示でしたが、私はこれを実行しません。」心臓が跳ねました。攻撃を受けている。ドキドキしながら、こころをおちつかせつつ、念のため生ログ（Claude Code CLIの記録しているJSONL）をたどります。ところが、その攻撃の入力元は、記録のどこにも見当たりません。一つも、

ClaudeCode

Claude Codeで正規の運用作業が「Usage Policy違反」になる理由 ── リアルタイム・サイバーセーフガードの誤検知と対処法

こんにちは！今日は、Claude Code を使っていると突然出てくる「Usage Policy違反」エラーいわゆるリアルタイム・サイバーセーフガードの誤検知（false positive）について、その傾向と対処法を詳しく解説します！自社サーバへのデプロイ作業中や、ごく普通のインフラ運用の最中に、こんなメッセージが出て手が止まった経験はありませんか？ API Error: Claude Code is unable to respond to this request, which appears to violate our Usage Policy. This request triggered cyber-related safeguards. やっていたのは、自分のサーバーへの SSH デプロイと、自社リポジトリへのコミット指示だけ。攻撃的な操作は何ひとつ含まれていないはずなのに、ブロックされてしまう… そんな状況に心当たりのある方は、

GPU

NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

こんにちは! Qualitegプロダクト開発部です！今日は、Windows + WSL2 のマシンに RTX 4090 を2枚挿して、大規模なオープンモデルを vLLM で動かそうとしたら、NCCL の初期化で見事に詰まった話を書きます。世の中に断片的にしか情報がなく、抜けるまでにかなり粘ったので、同じ構成で消耗している方の時間を少しでも節約できれば嬉しいです。経緯今回の目的は、次々と登場する最新のオープンモデル（オープンウェイトのLLM）を、手元で評価することでした。オープンモデルは数週間単位で新しいものが出てきます。ベンチマークの数字だけでなく、自分たちのユースケースに対して実際にどう振る舞うのか——出力の質、速度、量子化したときの劣化具合、エージェント的なタスクの得手不得手——を、手を動かして確かめています今回の環境は Windows + WSL2(Ubuntu) に RTX 4090 を2枚(各24GB)挿したマシンです。 nvidia-smi 上の CUDA Version は 12.8。動かすのは大規模オープンモデルを

ClaudeCode

Claude Codeで「The model's tool call could not be parsed」が頻発する問題の原因分析と対策

こんにちは！Qualitegプロダクト開発部です。 Claude Code（CLI）を使った開発中に、次のようなエラーが繰り返し表示されて作業が止まる現象に遭遇しました。 ● The model's tool call could not be parsed (retry also failed). リトライしても直らず、/clear で会話をリセットしても、しばらく作業を続けるとまた同じエラーが出るという状況です。本記事では、実際のセッションログ（jsonl）を解析して特定した原因と、その対策について共有します。結論から書くと、これは利用者側の設定ミスやコンテキスト枯渇が原因ではなく、 Opus 4.7（1Mコンテキスト）+ extended thinking の組み合わせで発生する、モデル応答側のストリーミングバグでした。現象エラーが発生した環境は以下のとおりです。 * Claude Code 2.1.148 * モデル: Opus 4.

LLM

Claude Opus 4.7 完全ガイド — 公式情報で読み解くモデル仕様とClaude Codeでの実践ノウハウ

こんにちは！ Qualitegプロダクト開発部です！ 2026年4月に、AnthropicからClaude Opus 4.7がリリースされました。今回のアップデートは、単にベンチマークが上がったという話ではありません。命令の解釈の仕方、応答長、ツール呼び出しの頻度、subagentの起動方針まで、モデルの振る舞いそのものが変わっています。それに伴い、4.6までに作り込んだプロンプトや設定の一部は、外したり再評価したりする必要があります。本記事では、そうした移行時の落とし穴と、4.7時代に合わせた運用作法を、できるだけ実践的にまとめました。この記事では、まずOpus 4.7で何が変わったのかを確認し、そのうえでClaude Code CLI版とClaude Code Web版でどう使いこなすべきかを見ていきます。 (通常のclaude.aiチャットUIは対象外です。) なお、けっこう長めの記事になっているので、頭から通読していただく必要はありません。下の目次から、気になるところや今すぐ困っているところだけ拾い読みしていただいて大丈夫です。たとえば「とりあえず4.

日々の開発Tips

PyCharmで npm start 実行時にIDEがサイレントクラッシュした事例と切り分け

こんにちは！Qualitegプロダクト開発部です！ PyCharmの内蔵npmツールで npm start を実行した瞬間、何のエラーメッセージもなくIDEが消える。再起動してもう一度試すとまた落ちる。ログを見ても手がかりがない——。今回はこの「サイレントクラッシュ」に遭遇し、原因の絞り込みから回避策の確立まで至った過程を書き残しておきます。同じ現象で困っている方の参考になれば幸いです。環境項目内容 OS Windows 10/11 PyCharm 2026.1（2023.1.6時代から連綿とUpdateをした状態） Python 3.11.4（venv使用） Node.js v25.2.1 プロジェクト Python + Node.js 混合構成上記のとおり、PyCharmは執筆時点の最新版(2026.1)となります。確認できたこと・推測していることまず最初に、

IT & AIテクノロジー

楽観的ロック vs 悲観的ロック：実際のトラブルから学ぶ排他制御

こんにちは！ Qualitegプロダクト開発部です！「楽観的ロックを実装したのに、まだ競合エラーが出るんですけど...」これは私たちが実際に経験したことです。本記事では、楽観的ロックと悲観的ロックの違いを、実際に発生したトラブルを通じて解説します。抽象的な説明ではなく、「なぜそれが必要なのか」「どんな問題を解決できるのか」を実感できる内容を目指します。目次 1. 問題の背景：並列処理で謎のエラー 2. ロックなしの世界：なぜ競合が起きるのか 3. 楽観的ロックの導入：期待と現実 4. 楽観的ロックの限界：解決できなかった問題 5. 悲観的ロックによる解決 6. 実装時のハマりポイント 7. どちらを選ぶべきか：判断基準 8. まとめ 1. 問題の背景：並列処理で謎のエラー 1.1 システムの概要私たちが開発していたのは、複数のワークスペースを切り替えて使用するAPIサーバーでした。当社AI関係のプロダクトの一部だったのですが、結合テスト兼負荷テストを実行すると、まれに発生してしまっていました。ユーザーは複数のワーキン

日々の開発Tips

DockerビルドでPythonをソースからビルドするとGCCがSegmentation faultする話

こんにちは！Qualitegプロダクト開発部です！本日は Docker環境でPythonをソースからビルドした際に発生した、GCCの内部コンパイラエラー（Segmentation fault）について共有します。一見すると「リソース不足」や「Docker特有の問題」に見えますが、実際には PGO（Profile Guided Optimization）とLTO（Link Time Optimization）を同時に有効にした場合に、GCC自身がクラッシュするケースでした。ただ、今回はDockerによって問題が隠れやすいという点もきづいたので、あえてDockerを織り交ぜた構成でのPythonソースビルドとＧＣＣクラッシュについて実際に発生した題材をもとに共有させていただこうとおもいます同様の構成でビルドしている方の参考になれば幸いです TL;DR * Docker内でPythonを --enable-optimizations --with-lto 付きでソースビルドすると GCCが internal compiler error（Segmentati

日々の開発Tips

Google GenAI SDK のストリーミングでマルチターン画像編集🍌が不安定になる問題と対処法

こんにちは！ Gemini 3 Pro Image (Nano banana Pro)を使ったマルチターン画像編集機能を実装していたところ、動いたり動かなかったりするという厄介な問題に遭遇しました。本記事では、この問題の現象、原因調査の過程、そして解決策を共有します。問題の現象実行環境 Google GenAI SDKライブラリ(pip)： google-genai 1.56.0 期待する動作 1. ユーザー: 「かわいい子猫の画像を生成して」 2. Gemini: 子猫の画像を生成 3. ユーザー: 「この子にメガネをかけて」 4. Gemini: 同じ子猫にメガネをかけた画像を生成実際に起きた現象 1. ユーザー: 「かわいい子猫の画像を生成して」 2. Gemini: 茶色の子猫の画像を生成 3. ユーザー: 「この子にメガネをかけて」 4. Gemini: メガネをかけた女の子の画像を生成

生成AI最前線

今からはじめるClaude Code

こんにちは！今日は、最近エンジニアの間で話題になっているAIコーディングエージェント「Claude Code」について取り上げます。 AIによるコーディング支援ツールはここ1〜2年で一気に増え、「結局どれを選べばいいのか分からない」と感じている方も多いのではないでしょうか。本記事では、そうした中でClaude Codeを実際に使ってみた所感と、Windows環境での導入・運用の考え方を整理していきます。 AIコーディングツール、どれを使う？ 2025年は、AIコーディング支援が一気に“実用品”になり、選択肢が増えすぎて迷いやすい年になりました。 GitHub Copilot、Cursor、Windsurf、Devin、Aider、Cline、OpenHandsなど、商用からオープンソースまで含めると、軽く20種類を超えます。機能や思想が似ているものも多く、情報を追うだけで疲れてしまう、という方も少なくないと思います。以前、当社ブログでは「AIコーディングエージェント20選」で全体像を整理しました。 AIコーディングエージェント20選！現状と未来への展望【第1回】

日々の開発Tips

【NPM】クラシックトークンが2025年12月9日に完全廃止されたことに伴うパッケージのインストールエラー(403)と対処法

こんにちは！本日は2025年12月9日に行われた npm に関する重要なアップデートについて解説いたします！ 2025年12月9日、npmがセキュリティ強化のためclassic tokenを完全に無効化しました。この影響で、プライベートパッケージを使用しているプロジェクトで突然npm installが失敗するケースが発生しています。（パブリックパッケージの使用には影響はありません）本記事では、実際に遭遇したエラーと解決方法についてみていきたいと思います。発生した問題症状プライベートパッケージ（@your-org/package-name形式）を含むプロジェクトで npm install を実行すると、以下のようなエラーが発生パターン1: 404エラー npm ERR! code E404 npm ERR! 404 Not Found - GET https://registry.npmjs.org/@your-org/package-name/... npm ERR! 404 '@your-org/package-name@x.x.

LLM

Anthropic Python SDKのcount_tokens機能が0.75.0～正式版に変わりました：移行ガイド

こんにちは！本日は Anthropic Claude API を使用するのに便利な Anthropic Python SDK に関する話題です！ 2週間ほど前にわりと大きな変更がありましたので、解説いたします。はじめに「あれ、client.count_tokens() が動かない...」 Anthropic Python SDKをアップデートしたら、今まで動いていたトークンカウントのコードがエラーになった。そんな経験をされたLLMエンジニアの方も多いのではないでしょうか。当社のBestllamのように、LLM統合サービスを開発していると、実際にユーザーがどれほどのトークンを使用しているのかを正確に把握することは非常に重要になります。利用料金の計算、コンテキストウィンドウの管理、そしてユーザーへの使用量の可視化など、トークンカウント機能はサービスの根幹を支える機能です。そのため、この機能が突然動かなくなると影響は小さくありません。ゆえに本番サービスを提供している場合、pip install で気軽にSDKバージョンを上げてはいけません。さて、Anthropi

日々の開発Tips

ログをちょこっと grep するツール "ちょこぐれっぷ" つくりました

こんにちは！今日はちょこっとしたツールをつくりました。ログをちょこっとgrepするツールです。もちろん無料。 chocoGrep - ちょこっとgrep！ログフィルタツールちょこっとgrepするならchocoGrep！「error or warning」と書くだけの簡単or/and検索。AIエージェントに渡す前にログを最適化。正規表現不要、インストール不要。chocoGrepQualiteg Inc. Cursor、Devin、Claude Code、ChatGPT——AIコーディングエージェントにエラーログを渡してデバッグを手伝ってもらう。もう日常ですよね。でも、 * ログを全部貼り付けたら、AIの応答がやたら遅い * 「トークン制限を超えました」と怒られる * 大量のログの中から、AIが的外れな部分に注目してしまうそこで、つくったちょこっとgrepするためのツールです名付けて　ちょこぐれっぷ！chogoGrep！ chocoGrepって何？ブラウザで動く、ゆるいgrepツールです。ログを貼り付けて、検索ワードを入れるだけ。インストール不要

モデルを「壊さずに」ドメインを広げる ― XLM-RoBERTa 継続学習の設計ノート

Claude Codeで出てくる「court」って何？ “XML露出” 現象とツール呼び出し未実行事故の対策

Claude Opus 4.8 完全ガイド — 公式ドキュメントから読み解くモデル仕様とClaude Code運用ポイント

AI は、来なかった攻撃を「検知」し、「拒否」し、「反省」した～Fable5 on Claude Codeでの経験

Claude Codeで正規の運用作業が「Usage Policy違反」になる理由 ── リアルタイム・サイバーセーフガードの誤検知と対処法

NCCL error: unhandled cuda error が出たら ─ WSL2 + マルチGPU + vLLM で詰まった話

Claude Codeで「The model's tool call could not be parsed」が頻発する問題の原因分析と対策

Claude Opus 4.7 完全ガイド — 公式情報で読み解くモデル仕様とClaude Codeでの実践ノウハウ

PyCharmで npm start 実行時にIDEがサイレントクラッシュした事例と切り分け

楽観的ロック vs 悲観的ロック：実際のトラブルから学ぶ排他制御

DockerビルドでPythonをソースからビルドするとGCCがSegmentation faultする話

Google GenAI SDK のストリーミングでマルチターン画像編集🍌が不安定になる問題と対処法

今からはじめるClaude Code

【NPM】クラシックトークンが2025年12月9日に完全廃止されたことに伴うパッケージのインストールエラー(403)と対処法

Anthropic Python SDKのcount_tokens機能が0.75.0～正式版に変わりました：移行ガイド

ログを ちょこっと grep するツール "ちょこぐれっぷ" つくりました

ログをちょこっと grep するツール "ちょこぐれっぷ" つくりました