‘음성인터페이스 기술 강자’ 파워보이스, 기술력으로 세계 시장 제패 노린다
  • 최기창 기자
  • 승인 2019.11.25 08:15
  • 댓글 0
이 기사를 공유합니다

파워보이스 정희석 대표 “다양한 레퍼런스로 글로벌 생체 인식 분야 리더 되겠다”

[인더스트리뉴스 최기창 기자] 2002년 설립한 파워보이스는 음성인식과 화자인식이라는 음성인터페이스 기술 분야에서 두각을 드러낸 기술벤처기업이다. 파워보이스의 기술은 저가의 칩이나 DSP(Digital Signal Processor)에 원거리 음성인식기술을 내재화해 국내외 많은 기업으로부터 인정을 받았다. 이미 로봇과 자동차를 비롯해 가전, 홈오토메이션 등 생활 곳곳에서 찾아볼 수 있다.

특히 파워보이스의 자랑인 화자인식기술은 음성에 담겨있는 생체특성과 독특한 개인성을 통해 발화자 개개인을 구별하는 생체인식기술이다. 파워보이스는 이 분야에서 독보적인 기술력을 보유한 기업이며, 세계 최초로 음성보안기술 상용화에도 성공했다. 최근 파워보이스의 기술은 핀테크와 접목해 금융 인증기술로 적용하기도 했다.

파워보이스 정희석 대표는 “최근 음성인식기술을 AI와 연동하는 등 기술이 점점 진화하고 있다”며, “이를 바탕으로 다양한 서비스들도 함께 증가하고 있다. 앞으로도 음성인식기술의 활용이 점점 많아질 것”이라고 소개했다.

파워보이스 정희석 대표 [사진=인더스트리뉴스]
파워보이스 정희석 대표 [사진=인더스트리뉴스]

Q. 최근 파워보이스가 집중하고 있는 사업 부문은 무엇인가?

우선 임베디드 분야의 Smart Voice Module이다. 최근 인공지능 기반 음성인식서비스들이 확대되면서 Smart Speaker 등 다양한 음성인식 기기들이 개발되고 있다. 여기에는 스피커 자체의 출력사운드나 주변 소음으로부터의 간섭과 잡음을 효과적으로 제거하는 기술이 필요하다. 다시 말하면, 원거리에서 음성인식 성능을 향상할 수 있는 Smart Voice Module이 필요한 셈이다. 현재 파워보이스의 Smart Voice Module은 국내외 다양한 Smart Speaker와 홈오토메이션 분야에 적용된다. 두 번째는 딥러닝 기반의 무제한 비정형자연어 음성인식기술이다. 이는 자연어처리기술과 응용해 다양한 모바일서비스 및 컨텍 센터 인공지능 에이전트기술에 활용된다. 더불어 화자인식기술과 융합해 발화자를 구분하거나 발화자 맞춤형 음성인식서비스를 제공하게 된다.

사실 이 분야의 시장은 예전보다 커졌다. AI와 연동한 음성 기술 접목 서비스가 늘어나고 있다. 과거에는 단순히 명령어 제어 중심 인터페이스였다면, 지금은 정보를 검색하거나 복잡한 서비스를 음성으로 다루는 등 더욱더 난이도가 있다. 또한 딥러닝과 클라우드 컴퓨팅 등 빅데이터 기반 딥러닝을 통해 비정형적인 음성 데이터를 인식할 수도 있다. 음성 언어를 자연스레 텍스트로 바꾼 뒤 의미를 분석하거나 추론하는 등의 영역도 발전돼 있다. 이러한 진화 배경에는 음성인식기술과 인공지능기술, 클라우드 등 인프라 서비스 기술 등의 발전이 바탕에 깔려있다.

Q. 음성인식 관련 핵심 자원은 무엇이며, 타사 대비 경쟁우위는 무엇인가?

파워보이스는 음성신호처리기술을 기반으로 HMM(확률통계모델)기법과 DNN(심층신경망)기법이라는 음성인식 원천기술을 두루 겸비하고 있다. 이는 무제한적인 비정형 자연어의 음성인식기술은 물론 이를 기반으로 한 연산량과 메모리를 최소화할 수 있는 효과가 있다.

현재 많은 음성인식기업들이 클라우드나 서버 음성인식기술에 의존하고 있다. 하지만 파워보이스는 앞서 언급한 원천기술을 바탕으로 저가의 칩이나 하드웨어에 내재화할 수 있는 임베디드 음성인식기술이 있다. 이는 엣지컴퓨팅 음성인식시장에서 파워보이스가 갖춘 장점이다. 이 밖에도 주변이 시끄럽거나 노이즈가 있는 경우 음성 인식률을 높일 수 있는 잡음 처리 기술, 다중 채널 멀티 마이크를 활용한 기술 등도 보유하고 있다. 더불어 노이즈를 제거한 뒤 사람의 개인 정보를 정확하게 분석할 수 있는 원천 기술도 보유했다.

정희석 대표가 파워보이스의 음성인식기술을 시연하고 있다. [사진=인더스트리뉴스]
정희석 대표가 파워보이스의 음성인식기술을 시연하고 있다. [사진=인더스트리뉴스]

Q. 파워보이스가 보유한 상시 대기 음성인식의 특징은 무엇인가?

최근 음성인식을 지원하는 기기들이 다양해지고 있다. 음성인식에 대한 사용자의 경험도 확대되고 있다. 하지만 많은 사람들은 주변 소리로 인한 오인식과 오작동에 불편함을 호소한다. 파워보이스의 Deep KWS 기술은 이러한 기존 음성인식의 문제를 해소할 수 있는 열쇠다. 특히 생활 속에서 음성과 잡음을 효과적으로 분리하거나 음성에 섞인 잡음 성분을 제거하는 음성전처리기술과 결합했기에 높은 인식률을 자랑한다.

Q. 파워보이스의 화자인식 기술의 특징은?

음성은 지문이나 안면처럼 독특한 개인성과 생체특성이 반영돼 있다. 파워보이스의 화자인식기술은 개인의 음성으로부터 내재된 생체특성(성도모델)과 독특한 개인성을 딥러닝으로 학습하고 벡터화한다. 이를 통해 특정인의 음성을 타인의 것으로부터 분리할 수 있다. 특히 VFP 기술을 내장해 실 발화음성과 녹음된 음성도 구분한다. 이는 생체인식의 문제 중 하나인 생체정보 도용이라는 문제를 원천적으로 차단한다. 현재 파워보이스의 화자인식기술은 FIDO 기술에 접목해 각종 금융서비스에 Voice Authenticator로 활용되고 있고, IVR기반의 전화 서비스에도 적용하고 있다. 이를 바탕으로 고객의 전화 음성을 분석해 본인인증과 고객식별에 이용하고 있다.

파워보이스 정희석 대표가 글로벌 시장에서 리더가 되겠다는 포부를 밝히고 있다. [사진=인더스트리뉴스]
파워보이스 정희석 대표가 글로벌 시장에서 리더가 되겠다는 포부를 밝히고 있다. [사진=인더스트리뉴스]

Q. 시장동향과 업계현황 등 주요 이슈는 무엇인가?

음성인식시장은 최근 인공지능기술과 더불어 폭발적인 성장을 거듭하고 있다. 스마트스피커의 경우 불과 몇 년 사이 연간 1억대의 시장으로 성장했고, 모든 가전과 IoT 제품에 음성인식기술을 적용하고 있다. 아마존과 구글 등 글로벌 플랫폼기업들이 음성인식에 대한 사용자의 경험을 더욱 확대하고 있다. 음성인식기술의 보편적 편리성을 기반으로 사용자들의 행동양식과 습관을 형성하고 있다. 그러나 실생활 환경에 따른 부정확한 인식률, 서비스 제약 등 어려움도 존재한다. 결국 실생활 환경에서 음성인식의 정확도를 높이는 것이 이슈다. 파워보이스는 이러한 부분을 극복하기 위해 음성전처리기술과 음성문자전환기술(STT), 다양한 서비스 도메인 확장을 위한 자연어이해(NLU)기술에 대한 연구에 꾸준히 투자하고 있다.

Q. 올해의 성과는 무엇이며, 내년 목표는 무엇인가? 또한 앞으로의 꿈은?

2019년은 기존의 음성인식기술 및 화자인식기술의 사업화 관점에서 많은 문제점을 극복한 해였다. 딥러닝 기반 음성인식기술과 화자인식기술을 고도화했고, 고성능의 다채널 음성전처리기술을 개발하는 데 성공했다. 이러한 연구 성과를 바탕으로 임베디드 음성인식을 위한 저가의 모듈 개발과 다양한 고객의 요구에 맞는 커스터마이징 프로세스를 크게 개선할 수 있었다. 기술사업화의 측면에서 높은 성과를 달성한 셈이다. 특히 화자인식기술은 최근 멕시코 등 중남미에 금융서비스를 중심으로 한 플랫폼 구축에 참여할 수 있었다. 2020년에도 파워보이스는 지속해서 연구개발에 투자할 예정이다. 하지만 무엇보다 인공지능 음성인식 인터페이스 기술의 모듈화를 통해 대량생산체제를 갖추고, 이를 더욱더 다양한 스마트기기들과 제품에 적용하는 것이 목표다. 최종적으로는 다양한 레퍼런스를 쌓아 글로벌 시장에 진출해서 생체 인식 분야의 글로벌 리더가 되는 것이 파워보이스의 비전이다. 기술력을 발판으로 세계무대에서 활동할 파워보이스를 앞으로 지켜봐 줬으면 한다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.