BUILD: 202631-AR
オートリダクター
自然言語処理アルゴリズムを用いて、日本語テキスト内に含まれる個人情報(PII)を自動検出し、指定の文字でマスク処理を行う墨消しエンジンです。
電話番号、メールアドレス、マイナンバー、クレジットカード情報など、改正個人情報保護法(APPI)に対応した8種類のPII要素を検知。処理は全てクライアント側のWASMサンドボックス内で完結するため、入力データの外部流出リスクはゼロです。
包括的なPII検知アルゴリズム
電話番号、メール、マイナンバー、クレジットカード、郵便番号、口座番号、IPアドレス等の主要な個人情報フォーマットを網羅的に検知します。
APPI (改正個人情報保護法) 準拠サポート
法人のセキュリティ要件を満たすため、重要情報を含むログやテキストデータを安全な形でサニタイズ(無害化)し、法令順守を強力に支援します。
究極のゼロトラスト・アーキテクチャ
全てのテキスト解析・マスキング処理はブラウザのローカルWASM環境で完結。サーバー側へのデータ送信が物理的に発生しないため、情報漏洩リスクは0%です。
人工知能・自動文脈マスキングツール:利用ガイドと技術仕様
本ツール(Contextual Auto-Redactor・自然言語対応・自動墨消しエンジン)は、単なる正規表現のパターンマッチングを超え、フリーフォーマットの長文テキスト(議事録、チャットログ、アンケート自由記述欄など)から、文脈的に「氏名」「地名」「組織名」などの固有名詞を自動的に推論・抽出し、安全なアスタリスク(*)記号等へ、ブラウザのローカル環境だけで瞬時に自動置換するエンタープライズ向けのNLP(自然言語処理)セキュリティ・ユーティリティです。 (一般ユーザー向け)のユースケースとしては、対話型AIや対話型AI等の生成人工知能に対してプロンプトを投げる際、自社の社外秘プロジェクト名や顧客の特定の名前を誤って人工知能の学習データとして送信してしまう(データ漏洩)事故を防ぐための「人工知能プロンプト送信用・前処理フィルター」として極めて有効に機能します。コピペでワンクッション挟むだけで、機微なエンティティのみを匿名化できます。
そして、エンタープライズ領域(法務・カスタマーサポート)においては、これが「非構造化データ(非構造化データ)の安全な社内共有・分析インフラ」の要となります。例えば、コールセンターに蓄積された数十万行の「顧客とのチャットサポート履歴(テキスト)」を、社外のデータサイエンティストやプロダクト開発チームへ共有して人工知能分析(センチメント分析等)にかける際、テキスト群の中に散在する「顧客の氏名」「担当者の名前」といった個人情報(個人情報)を手作業で検閲・削除することは物理的に不可能です。 Zoryntoの自動墨消しエンジンを用いれば、高速処理技術ベースの軽量化された形態素解析・エンティティ抽出パイプラインが大量のテキストデータを舐め尽くし、文脈から個人を特定する固有表現のみを数秒でマスキング(サニタイズ)します。人力による検閲コストをゼロにしつつ、安全な分析用コーパスを作り出すことが可能です。
このコンテキスト解析技術の最大の革新性は、処理がすべて「100%クライアントサイド(ゼロトラスト ローカル NLP)」で完結し、Open人工知能のシステム連携(外部通信)や外部のクラウドNLPサーバーへテキストを1バイトも通信送信しない点にあります。企業の機密議事録や顧客の生の声を、外部のクラウドシステム連携(外部通信)に判定させること自体が、情報セキュリティマネジメントシステム(国際セキュリティ基準)や買掛金管理PI(改正個人情報保護法)で重大な規約違反・情報漏洩リスクとなるからです。Zorynto環境下では、完全なオフライン状態でも人工知能ライクな文脈マスキングがセキュアに機能します。
セキュリティ・技術スタック
- - 高速システム言語 (高速処理技術32-高速処理技術 Morphological)
- - ローカル NER
- システム構成 -
- 処理速度 > 20k 文字/秒
- コンプライアンス準拠 買掛金管理PI, GDPR, 国際セキュリティ基準
- 通信ルール 完全オフライン (ゼロ システム連携(外部通信)/大規模言語モデル Call)
1. 個人・開発者利用:対話型AI等の大規模言語モデルプロンプトの安全な匿名化
仕事のメール文面を対話型AIに添削してもらったり、議事録の要約を対話型AIに依頼する際、そのままのテキストを大規模言語モデルのチャット窓にペーストしていませんか?企業向けプランではない一般の人工知能サービスを利用する場合、入力した機密情報(取引先の名前や担当者名等)が人工知能の学習データとして吸収され、将来的に他者への回答として漏洩してしまうリスクがあります。
本ツールは、あなたが人工知能に投げたい長文のプロンプトを、事前にブラウザ内で安全な形へ「無害化」します。「株式会社佐藤商事の鈴木様からは~」という文章に対し、本ツールは文脈から組織名と氏名を推論し「株式会社***の***様からは~」という形へローカルで瞬時に置換します。人工知能が要約・生成を完了させた後、手元でマスキング箇所を元に戻せば、機密情報を一切外へ出さずに生成人工知能の恩恵をフルに受けることが可能です。
2. 法人利用:VOC分析・法務文書のコンプライアンス自動検閲
マーケティング部門が実施した「NPSアンケートの自由記述欄」や、カスタマーサクセス部門が保有する「Zendeskのチケットチャット履歴」には、顧客の生の声(VOC: Voice of Customer)という宝の山が眠っています。しかし、そこには高確率で「顧客の家族の名前」「居住する具体的な地域名」「クレーム対象の社員の個人名」が含まれており、法務部門やコンプライアンス基準によって、他部署でのデータ活用(Tableau等での分析)が厳しく制限されてしまいます。
Zoryntoの自動墨消しエンジンは、このような非構造化データの壁を突破します。何万ファイルものテキストデータをツールに取り込ませることで、固定の正規表現(マイナンバーや電話番号フォーマット等)では検知不可能な「山田太郎といった一般的な人名ベースのエンティティ」までも形態素解析により推論・抽出し、すべて不可逆的にマスキングします。データアナリストは個人情報保護の制約を法的にクリアした「クリーンな分析用テキストコーパス」を自ら安全に生成し、すぐにテキストマイニング業務へ移行することができます。
3. 大規模言語モデル システム連携(外部通信)に依存しない「真のゼロトラスト」NLPマスキング
世の中に存在する「人工知能マスキングツール」の多くは、裏側でOpen人工知能のシステム連携(外部通信)(GPT-4等)へ平文のテキストを送信し、「文章の中の個人情報をアスタリスクに変えてください」と指示(プロンプト)を投げるアーキテクチャを採用しています。これはセキュリティの観点から本末転倒です。外部のテキスト人工知能を信用できないからマスキングしたいのに、そのマスキングを外部の人工知能 システム連携(外部通信)へ依存しているため、結局データはネットワークを通過して自社のコントロール外へ出ています。
本システムは、高速処理技術技術によって「ブラウザのメモリ内だけで動作する軽量・高速なローカル言語解析エンジン」を組み込んでいます。データの入力から解析、結果の出力に至るまで、通信パケットは1バイトすら発生しません(True ゼロトラスト)。LANケーブルを物理的に切断したノートパソコン上でも、社外秘の取締役会議事録や法務契約書草案の墨消し処理を、最高レベルの機密性を維持したままミリ秒単位で完了させることができます。
次に使うと便利な関連セキュリティツール
テキストや非構造化データの文脈マスキングが完了したら、さらなるデータ保護や業務効率化のために以下のツール群をお試しください。いずれもネットワーク送信ゼロのローカルで安全に稼働します。
特定フォーマット(マイナンバー・カード)墨消し
自然言語の文脈推論(氏名や地名)だけでなく、12桁のマイナンバーフォーマットやクレジットカード等の「確固たる構造化ルール」を持つ機密情報を、専用の正規表現エンジンで確実かつ強力にマスキングします。
Explorer Privacy ToolPDFファイル 透かし(ウォーターマーク)付与
文脈の墨消しを済ませた機密文書(議事録や契約書)をPDFファイル化して社外へ共有する際、印刷時の不正流出や写真撮影リスクを低減するため、「STRICTLY CONFIDENTIAL」等の電子すかしを安全に刻印します。
Explorer Secure Tool議事録・マークダウンジェネレーター
個人情報をマスキングした後のプレーンなテキストから、決定事項やTODOリストなどを含む「美しい構造化されたマークダウン形式の議事録」へローカル環境で即座にフォーマット生成(整形)します。
Explorer Document Tool自然言語マスキングの技術FAQと仕様
外部の大規模言語モデル(対話型AI システム連携(外部通信)等)は本当に使用していないのですか?
はい、100%使用していません。クラウドへのデータ流出を防ぐため、当ツールはブラウザにダウンロードされた高速処理技術バイナリ内部の「軽量なローカル形態素解析器と固有表現抽出モデル」のみを利用してエンティティの推論を行っています。そのため課金システム連携(外部通信)の制限もネットワーク依存もありません。
対応している言語や精度(推論の正確さ)はどの程度ですか?
現行バージョンは日本語の文脈解析に最適化されています。形態素ベースのアプローチを採用しているため、標準的な敬称(様・氏・社長など)や代表的な地名が続く文脈において極めて高いPrecision(適合率)を発揮します。ただし、クラウドの巨大大規模言語モデルに比べてRecall(再現率)には限界があり、完全な墨消しを担保するためには出力結果の最終的な目視検証を推奨します。
長文や複数ファイルのバッチ処理時のデータロードはどうなりますか?
入力された長文テキストやファイル群は、現在ユーザーが開いているブラウザのタブ内(RAMの隔離されたヒープ領域)でのみ一時的に展開・処理されます。処理が完了し、タブを閉じるかリロードした瞬間にすべてのデータは消滅します。ログや抽出履歴がブラウザのローカルStorage等に恒久的に残ることもありません。
推論されなかったテキスト(漏れ)を後から手動で指定できますか?
もちろんです。画面上で「抽出されたエンティティ候補」がリスト表示され、マスキング対象から除外(ホワイトリスト化)したり、独自のカスタム文字列(例: 社内独自の極秘プロジェクト名)を追加の置換ルールとしてマニュアル指定することが可能です。