ルール
|
|
任意のキーワード |
キーワードリストの1つ以上のキーワードがファイルに含まれる必要があります。
|
すべてのキーワード
|
キーワードリストのすべてのキーワードがファイルに含まれる必要があります。 |
<x>文字以内のすべてのキーワード
|
キーワードリストのすべてのキーワードがファイルに含まれる必要があります。さらに、最初のキーワードの先頭から最後のキーワードの先頭までの文字数が、<x>文字以内である必要があります。
たとえば、3つのキーワードがWEB、DISK、およびUSBで、指定した文字数が20であるとします。
すべてのキーワードがDISK、WEB、およびUSBの順に検出される場合、「D」 (DISKのD) から「U」 (USBのU) の間の文字数は20文字以内である必要があります。
文字数を決定する際は、通常、10などの小さな数では検索速度が速くなりますが、対象範囲が比較的小さくなることに注意してください。これにより、特に大きなファイルでは、機密データの検出率が低下する可能性があります。数字が大きくなるほど対象範囲も広くなりますが、検索速度が低下することがあります。
|
合計スコアがしきい値を超えているキーワード
|
キーワードリストの1つ以上のキーワードがファイルに含まれる必要があります。キーワードが1つだけ検出された場合は、そのスコアがしきい値を超えている必要があります。キーワードが複数ある場合は、その合計スコアがしきい値を超えている必要があります。
各キーワードに1~10のスコアを割り当てます。人事部の「昇給」など、機密性の高い単語やフレーズには比較的高いスコアを指定する必要があります。単体では重要度がそれほど高くない単語や語句には、比較的低いスコアを指定できます。
しきい値を設定する際は、キーワードに割り当てたスコアを考慮します。たとえば、キーワードが5つあり、そのうち3つのキーワードの優先度が高い場合、しきい値は、優先度が高い3つのキーワードの合計スコア以下に設定できます。これは、これらの3つのキーワードが検出されることで、そのファイルは十分に機密であるといえるためです。
|