INTERVIEW
膨大なファイルの中から「速く」「正確に」個人情報を見つけ出すには 組織内の個人情報の把握、
本当にできていますか?
すみずみ君

すみずみ君は、クライアントPCや共有サーバー内のすみずみまで「個人情報」「マイナンバー」「機密情報」に該当するファイルを「簡単」「高速」「高精度」に検出する個人情報ファイル検出ツールです。ファイル名を検出するのみではなく、そのファイル内のどこに「個人情報」「マイナンバー」「機密情報」があるかを簡単にチェックすることができます。

Webサイト

間近に迫っているマイナンバー制度の導入や近年発生しているさまざまな情報漏洩事故により、個人情報漏洩対策への関心が非常に高まっています。
個人情報や機密情報ファイルの検出ツールとして、クライアントPC / 共有サーバー内のすみずみまで該当するファイルを検出できることで高く評価されている「すみずみ君」について、三菱スペース・ソフトウエア株式会社様に開発の経緯や特長、活用例などを伺いました。

「検査速度が非常に速い」ことが
「すみずみ君」の最大の特長です

「すみずみ君」を開発された経緯についてお聞かせください。

三菱スペース・ソフトウエア株式会社

当社は「三菱スペース・ソフトウエア」という社名のとおり、創業以来、宇宙分野を事業の大きな柱としています。ロケットの制御システム開発をはじめ、人工衛星のシステム開発や運用支援、宇宙ステーション補給機「こうのとり(HTV)」の運用管制システムの開発などに携わっており、災害時には宇宙航空研究開発機構(JAXA)を通じて衛星画像データの解析結果を提供したこともあります。

また、宇宙分野で蓄積した技術を基に、レーダーや通信機器システムなどのソフトウェア開発で防衛分野に参入し、以降、「航空」「防衛」「情報通信」「防災・環境」など8分野の事業を展開しています。航空分野では国産ジェット旅客機「MRJ」の開発支援、防災・環境分野では鉄道地震防災システム開発にも参画しています。

このような事業を展開していく中で、特に宇宙や防衛分野の国家プロジェクトでは、機密情報を扱うことが多く、厳重なセキュリティ対策が絶対の条件であったことが、「すみずみ君」開発の礎となっています。1990年代後半からセキュリティ製品の開発を進め、2003年から汎用コンピューター上で動作する、高速な検索エンジンの開発に取り組むことになりました。そして、2005年の個人情報保護法施行を機に、個人情報ファイル検出ツール「すみずみ君」を開発し、2005年1月に発売を開始しました。

「すみずみ君」の特長についてお聞かせください。

① 検査速度が速い

「すみずみ君」には、三菱電機株式会社情報技術総合研究所が開発した高速ストリーム型検索エンジン「SP-Filter」を搭載しており、「検査速度が非常に速い」のが最大の特長です。一般的な検索エンジンでは、データを検索しやすくするため検査対象のファイルをあらかじめインデックス(索引)化しておく工程が必要になります。しかし、「SP-Filter」はその工程なしにファイル内のテキストデータを一気に高速検索することが可能です。

実際に「すみずみ君」をご利用頂いているお客様から、自社環境でほかの個人情報ファイル検出ツールと検査速度の比較・検証を行った結果、「すみずみ君」の方が4~7倍速かったことが、導入の決め手になったとお聞きしたことがあります。この検査速度の違いは検索エンジンの性能の差によるところが大きいと思います。「SP-Filter」は、研究所で開発された高速エンジンですので、性能には自信を持っています。

「すみずみ君」の個人情報ファイル検出は、ExcelファイルやWordファイル、PDFファイルなどの検査対象ファイルからテキストのみを抽出した上で、「個人情報」だと特定できる項目が含まれるかどうかを「SP-Filter」で検索し、判定します。「すみずみ君」の検査で個人情報だと特定するための項目は「名字(漢字)」「名字(カナ)」「名字(英字)」「住所」「電話番号」「メールアドレス」「マイナンバー」「クレジットカード番号」「口座番号」「生年月日」の10項目です。これらの項目に、例えば「ファイルの中に名字が何個以上含まれていて、かつ電話番号が何件含まれている」といった判定条件をあらかじめ設定しておけば、条件に該当したファイルが検出されます。仮に個人情報の項目が一つでも含まれていれば検出されるような条件を設定してしまうと、ほとんどのファイルが個人情報ファイルとして検出されてしまいますので、実際には「名字が10個以上、かつ、電話番号が10件以上含まれる場合」といったような設定をされていることが多いようです。

すみずみ君の個人情報チェック工程

  • 検査対象ファイルをオープン
  • ファイル内からテキストデータを摘出
  • 摘出されたテキストデータ内を「SP-Filter」で高速検索(設定した検査項目)

ファイル検査は、検査する項目が増えるにしたがって所要時間も増えていくものです。特に個人情報の検査に使用する「名字」や「住所」などを識別するための辞書には、たくさんのキーワードが登録されていますので、それらをすべて検査対象とすると相当な時間がかかります。しかし、「すみずみ君」はファイルの中にある「名字」だけを検査する場合と、「住所」や「電話番号」など10項目すべてを検査した場合とで、検査時間にほぼ違いがないのが特長です。

更新されたファイルのみ検査する
差分検査により、検査時間を大幅に短縮

② 差分検査で検査がさらに速い

また、「すみずみ君」が搭載している差分検査機能が検査速度を更に向上させています。一度検査したファイルが次の検査時までに更新されていなければ、あらためて検査しても結果は同じです。そこで、不要な検査をスキップして前回の検査時以降に更新されたファイルだけを検査するのが「差分検査」です。例えば、保存されているファイルが全部で1万ファイルある場合、1回目の検査では1万ファイルをすべて検査します。ファイルの更新頻度はお客様により異なるので一概には言えませんが、1か月後に1万ファイルのすべてが更新されているということは、極めて少ないと思われます。一般的には1か月間で更新されるのは、せいぜい1,000ファイル程度と推測されます。この更新された1,000ファイルだけを検査することによって、更新されていない9,000ファイルの検査時間分が大幅に短縮されます。この差分検査機能を搭載していることも「すみずみ君」の大きな特長の一つとなっています。図1

図1新規作成、更新されたファイルのみを検査し検査時間を大幅に短縮

ページのトップへ
ささいなご質問にも専門スタッフがお答えします!導入相談Cafe 詳しくはこちら