LLM-Audit

LLM活用における段階的PIIマスキング

LLM-Audit

LLM活用における段階的PIIマスキング

こんにちは、Qualitegプロダクト開発部です! 前回の技術解説では、「三沢」が人名なのか地名なのか判断できない日本語の曖昧性から始まり、正規表現からLLM統合まで5段階のPII検出アプローチをご紹介しました。今回は、これらの技術を搭載した LLM-Audit™ PII Protector が実際のLLM活用シーンでどのように動いているのか、実際のプロダクト処理の観点で、もう一歩踏み込んで解説します。 ファイルの中に潜む、見えないPII LLM Audit™ PII Protectorをご紹介した際、多くの方から「テキスト入力のPII検出は分かったけど、ファイルをまるごとLLMに投げる場合はどうなるの?」というご質問をいただきました。 確かに現在のLLM活用は、単純なテキスト入力から、PowerPoint、Excel、PDF、画像ファイルなど、様々な形式のファイルを直接処理する段階に進化しています。「この提案書を要約して」「このExcelから傾向を分析して」といった使い方が当たり前になってきました。 PowerPointの「スピーカーノート」を見たことがありますか?

By Qualiteg プロダクト開発部
PIIの高精度検出を支える技術~日本語という言語の奥深さに寄り添う~

LLM-Audit

PIIの高精度検出を支える技術~日本語という言語の奥深さに寄り添う~

こんにちは、Qualiteg研究部です! 本日はPII(個人識別情報)検出技術について解説いたします。 グローバルツールと日本語特化ツールの共存 個人情報保護は世界共通の課題です。 GDPR、CCPA、そして日本の改正個人情報保護法など、世界中で規制が強化される中、多くの優れたPII(個人識別情報)検出ツールが研究・開発されていますが、日本語を中心としたビジネスシーンで利用しようとすると「おや?」っとなることが多く割と無視できない規模の追加開発、特別対応による追加工数が発生することがあります。なぜなら、それらツールは英語(および英語文化圏)を中心に設計されており、スペック上は日本語も対応言語の1つとして挙げられておりますがきめ細やかな対応が後手にまわることが多いです。 当然ですが言語には固有の文化と構造があり日本語は、その独特な文字体系と文化的背景により、特別なアプローチが必要となるシーンが存在しています。 私たちが開発している日本語特化型PII検出技術は、グローバルに採用されている優れた基盤技術も活かし共存ながら、日本語の特性に深く寄り添うことで、日本企業により実用的なソリュ

By Qualiteg 研究部
LLM時代の企業情報防衛:PIIセキュリティの新たな挑戦

LLM-Audit

LLM時代の企業情報防衛:PIIセキュリティの新たな挑戦

はじめに なぜ今、PIIセキュリティが重要なのか 私たちは大規模言語モデル(LLM)が業務の隅々まで浸透した時代を生きています。ChatGPT、Claude、Geminiなどの生成AIツールは、もはや実験的な技術ではなく、日常業務に欠かせないインフラとなりました。しかし、この便利さの裏側で、企業の個人識別情報(PII)は前例のない脅威にさらされています。 従来のセキュリティ対策では想定していなかった「AIへの情報漏洩」という新たなリスクが生まれ、企業は情報防衛戦略の根本的な見直しを迫られています。 PIIとは何か ~生成AI&LLM時代の再定義~ 従来のPII定義 個人識別情報(Personal Identifiable Information)は、単独または他の情報と組み合わせることで特定の個人を識別できる情報を指します。 たとえば、従来は以下のような情報が主な対象でした * 直接識別子:氏名、住所、電話番号、メールアドレス、マイナンバー * 間接識別子:生年月日、職業、勤務先、IPアドレス * 機密情報:医療記録、金融情報、生体認証データ LLM時

By Qualiteg プロダクト開発部