模倣音声による詐称攻撃に対して頑健な話者照合の研究

研究の概要

 近年,音声による個人認証(話者照合)が注目され,世界的に研究が進められている. しかし,これまでの研究で用いられているデータには,他者が申告者の音声を「模倣」したものが含まれておらず, このような攻撃に対する話者照合システムの頑健性・脆弱性は明らかになっていない. 本研究では,模倣音声を含むデータベースの構築を行い,その話者照合に及ぼす影響の分析と評価を行うことで, セキュリティに関する基盤知見の獲得を目指す. また,このような攻撃に対して頑健な話者照合手法の提案に向けての検討を行う.

研究組織

研究代表者 岩野公司(東京都市大学)
研究分担者 篠田浩一(東京工業大学)

研究の背景

 近年,生体情報を利用した個人認証は,認証子の紛失や忘却の危険性が少ないため, セキュリティシステムへの積極的な導入,実用化が進められている. その中でも声による個人認証(話者照合)は,特殊な入力装置が不要で, 安価・簡易な導入が可能であることから,様々な情報システムの手軽な認証方式として注目され, 世界的に研究が進められている.
 話者照合システムの構築と性能評価は,多数の話者による,複数時期の発声データを利用して行われる. 従来の話者照合用の音声データベースでは,各話者の音声は「システムに受理されるべき申告者本人の声」として収録されている. 一方,話者照合性能を求める際には,「申告者本人の発声が他人として棄却される(本人棄却)誤り」だけでなく 「他人が申告者に成りすまして(詐称して)行った発声が申告者として受理される(詐称者受理)誤り」を評価する必要がある. しかし,これまでのデータベースを使用した話者照合の研究では,それぞれの話者が申告者本人の声として発声したデータを, 他人が申告者であったときの詐称者発声として便宜的に使用しているため,詐称者受理誤りを 「詐称・偽造の意図を持っていないデータ」で評価している,という問題があった.
 意図を持った詐称に対する生体認証性能の検証は非常に重要な課題であり,例えば,音声については, 音声合成器を利用した詐称に対する脆弱性の指摘とその対策手法が検討されているが, もっとも単純な詐称手段である「模倣(声真似・声帯模写)」という攻撃に対する照合の脆弱性についてはほとんど研究が進められていない.
 そこで本研究では,「本人としてシステムに受理されようとする発声」の他に, 「他人に成りすます(模倣する)ことで,システムを攻撃しようとする発声」を収録したデータ ベースの構築を行い,それを用いて模倣発声による攻撃によって照合性能の劣化がどの程度生じるかを明らかにし,その対策手法について検討を行う. また,GMM(GaussianMixture Model)に基づく発声のモデル化と分析を行い,模倣によって話者内の音響特徴量空間がどの程度変動するか, 「模倣のうまさ」と特徴量空間の変動度合いに関係性はあるか(図1),などを明らかにする.

fig1

研究実績の概要

 GMM-UBM法に基づく照合システムを構築し,物真似による詐称攻撃が照合性能に与える影響を分析した結果,
     
  1. 素人の物真似であっても,模倣による詐称攻撃は話者照合システムの詐称者受理率の数%の上昇に繋がり,実用上無視できない影響を与えること  
  2. プロの物真似タレントの模倣の攻撃力は,素人に比べ有意に大きいこと  
  3. 素人であっても継続的な訓練を行うことでその攻撃力が向上すること
が明らかになった.また,模倣音声のケプストラム特徴量の変動を,カルバック・ライブラー情報量に基づくモデル間距離を利用して分析した結果,
  1. 素人は声真似によって自身の声を大きく変動させることはできても,対象者の声質には近づかないこと
  2. プロの物真似タレントは素人ほど声質を変化させてはいないが,対象者には確実に近づくこと
が明らかになった.特に,素人による模倣の攻撃力を明らかにしたこと,物真似の対象者を同一として, 素人とプロの攻撃力の比較を実施したことは本研究の独自の成果といえる.

成果発表