
Tonic Textualを使用すると、非構造化文書からテキストを抽出し、正規化することができます。
機密情報を含むチャンクは、プラットフォームの固有表現抽出(NER)モデルを用いて編集または合成されます。
このNERモデルは、Pineconeと呼ばれる目的ベースの検索プロセスに使用されます。
これにより、個人を特定できる情報(氏名など)を公開することなく、ベクトルを取得できます。
Pineconeを使用してチャンクを保存し、データに対してセマンティック検索を実行します。
security summary
コメント