전화 목소리, 약하고 발음 씹힌다…그렇다면 '딥보이스'

조동욱 충북도립대 교수, 비교 연구 결과
딥보이스는 에너지(㏈)값 낮고 발음도 부정확

범죄에 악용되는 가짜목소리 '딥보이스(Deep Voice)'와 실제 목소리를 구분할 수 있다는 연구 결과가 나왔다.



충북도립대학교 생체신호분석연구실 조동욱 교수는 12일 실제 음성과 딥보이스 합성음성를 비교한 실험 결과를 제시했다.

조 교수는 피실험자가 녹음한 문장 샘플 2개(단음절형태 문장, 길고 받침이 많은 문장)를 전문업체에 보내 딥보이스를 생성하게 한 뒤 실제 얼마나 차이가 있는지를 비교했다.

비교 결과, 목소리 음높이(㎐)에서는 다른 점을 찾기 힘들었다.

차이점은 음성에 실리는 에너지(㏈)값에서 나왔다.

실제 목소리는 단음절 형태 문장에서 65.51㏈, 길고 받침이 많은 문장에서 71.50㏈의 에너지값을 나타냈다. 반면, 딥보이스 에너지값은 각각 60.02, 53.14㏈로 낮은 수치를 보였다.

문장이 길어지면 일부 단어들의 발음이 씹히면서 정확한 소리가 나지 않는 점도 확인됐다.

조 교수는 "지인의 목소리가 평소보다 약하게 들리고 일부 단어들의 발음이 씹히게 들린다면 딥보이스피싱을 의심해 봐야 한다"고 조언했다.

딥보이스란 AI의 딥러닝기술로 만든 목소리 바꿔치기 기술이다. 최근 보이스피싱에 악용되면서 검찰청은 딥보이스 가짜 음성 탐지 기술 개발에 착수했다.

<저작권자 ⓒ KG뉴스코리아, 무단 전재 및 재배포 금지>

충청본부장 / 유상학 기자 다른기사보기