Tonic TextualとPineconeを使って匿名化された埋め込みを作成する方法 from securityboulevard.com

Tonic Textualを使用すると、非構造化文書からテキストを抽出し、正規化することができます。
機密情報を含むチャンクは、プラットフォームの固有表現抽出（NER）モデルを用いて編集または合成されます。
このNERモデルは、Pineconeと呼ばれる目的ベースの検索プロセスに使用されます。
これにより、個人を特定できる情報（氏名など）を公開することなく、ベクトルを取得できます。
Pineconeを使用してチャンクを保存し、データに対してセマンティック検索を実行します。