음성 생체 인식 솔루션 대상 인증

인공 지능의 발전은 이제 음성 생체 인식에서 충분한 정확성을 가능하게 하여 식별 및 개인화뿐만 아니라 결제 인증과 같은 애플리케이션에도 사용할 수 있습니다. Synaptics 및 ID R&D의 새로운 솔루션은 에지 장치의 Synaptics SoC에서 실행할 수 있는 AI 기반 음성 생체 인식 및 스푸핑 방지 알고리즘을 제공합니다. 특히, 소프트웨어는 셋톱 박스(STB), 스마트 스피커 및 보안 시스템과 같은 스마트 홈 장치용 Synaptics의 VS600 시리즈에서 신경 처리 장치(NPU)에 최적화되었습니다.

Synaptics는 AI 지원 SoC를 비디오 스트리밍, 오디오 스트리밍 및 이미징을 처리해야 하는 스마트 홈 제품에 판매합니다. 일반적인 사용 사례는 예를 들어 화상 회의용 카메라를 통합한 STB일 수 있습니다.

음성 생체 인식은 이제 스마트 홈 기기에서 결제 인증을 가능하게 할 만큼 정확합니다.

Synaptics의 마케팅 부사장 Vineet Ganju는 EE Times에 "셋톱 박스 애플리케이션 전반에 걸쳐 공통되고 시간이 지남에 따라 점점 더 일반화되고 있는 것은 음성을 인터페이스로 사용하는 기능입니다."라고 말했습니다. . "리모컨을 음성으로 사용할 수 있으므로 리모컨으로 말하여 Netflix 계정을 탐색하고 영화를 검색할 수 있습니다. 이러한 애플리케이션에서는 인터페이스로서의 음성이 거의 표준이 되고 있습니다."

STB에서 Netflix를 실행할 때 사용자가 가장 먼저 해야 할 일은 사용할 프로필을 선택하는 것입니다. 음성 생체 인식을 통해 STB는 누가 보고 있는지 즉시 알 수 있어 프로세스에서 한 발짝 더 나아갔습니다.

"예를 들어, 유료 콘텐츠를 사용하면 음성으로 검색하고 구독에 포함되지 않은 특정 영화를 찾을 수 있을 뿐만 아니라 보기 위해 5달러를 지불할 용의가 있습니다"라고 Ganju가 말했습니다. “그러면 [운영자들]은 즉시 인증할 수 있고 당신이 그 자리에서 그 영화를 구매할 수 있기를 원합니다. 그들은 사용자가 자신에게 맞춤화된 콘텐츠를 찾는 데 도움이 될 뿐만 아니라 해당 콘텐츠에 대한 비용을 지불하고 시청할 수 있도록 하여 마찰을 크게 줄이는 것으로 보고 있습니다."

기기 등록

ID R&D의 음성 생체 인식 AI는 주파수/음높이 및 발음 및 억양과 같은 기타 항목과 관련된 매개변수의 조합을 포함하여 음성에서 400개 이상의 기능을 추출합니다.

ID R&D의 영업 수석 부사장인 John Amein은 EE Times에 "이는 이전 세대의 음성 생체 인식 방식에 국한되지 않습니다."라고 말했습니다. , AI 음성 생체 인식이 결제 인증과 같은 애플리케이션에 필요한 정확도를 달성한 것은 불과 1년 전 정도라고 덧붙였습니다.

알고리즘은 사용자가 문구를 세 번 반복하는 "등록"이라는 프로세스를 통해 사용자의 음성을 인식하는 방법을 학습합니다. 모든 구문을 사용할 수 있으며 기본적으로 모든 언어에서 작동합니다. 에지 장치에서 등록이 처리됩니다.

ID R&D의 AI 알고리즘은 1/10,000 미만의 잘못된 수락률로 등록된 사용자를 식별할 수 있습니다. Amein은 이를 누군가가 귀하의 PIN을 추측할 확률과 비교합니다. 허위 거부율(등록된 사용자의 음성이 잘못 거부되는 비율)은 5%에 가깝습니다. 그리고 시스템에 재생되는 사용자의 음성 녹음과 같은 스푸핑 공격에 대한 스푸핑 허용률(SAR)은 Android 기기의 생체 인식 잠금 해제에 대한 표준 제한인 7% 이상입니다.

"생체 인식 일치가 10,000분의 1의 잘못된 승인 비율이고 Android 표준에서 요구하는 7% 비율보다 더 나은 스푸핑 방지 사이에서 우리는 실제로 음성 생체 인식이 승인되는 데 필요한 두 가지를 모두 충족하고 있습니다. 지불 승인을 위해 충분히 안전합니다.”라고 Amein은 말했습니다.

스푸핑 방지

ID R&D의 스푸핑 방지 기술도 AI를 기반으로 합니다.

Amein은 "말하는 음성은 최대 3500Hz의 대역폭을 가지고 있으며 우리는 그보다 훨씬 더 빠른 속도로 샘플링하고 있습니다"라고 말했습니다. “그래서 우리는 말하는 목소리보다 더 높은 주파수를 듣습니다. 우리는 다양한 특성을 위해 이러한 더 높은 범위에서 듣습니다.”

우리의 관형 성대를 통해 말함으로써 생성된 인간의 목소리는 확성기와 같은 평평한 표면의 진동에 의해 생성되는 소리와 매우 다른 특성 주파수를 생성합니다. 이것은 스푸핑 방지 AI가 실제 음성과 녹음을 구별하는 데 사용하는 요소 중 하나입니다.

Amein은 "텍스트를 음성으로 변환하는 응용 프로그램과 같이 합성된 음성도 감지할 수 있습니다."라고 말했습니다. “많은 것들이 그렇게 훌륭하지는 않지만 점점 더 실물처럼 되고 있습니다. 그리고 그 시나리오에서는 신호에 여전히 이상이 있습니다. 어떤 경우에는 너무 완벽하거나 귀가 들을 수 없지만 [AI]는 들을 수 있는 전환 또는 위상 차이가 있을 수 있습니다."

신경 처리 장치

Synaptics의 VS600 시리즈 SoC에는 신경 처리 장치(NPU)가 있습니다. VS680의 NPU는 6.75 TOPS를 제공하는 반면 새로 발표된 VS640은 1 TOPS를 제공하며 "더 많은 주류 비용, 성능 및 파워 포인트"를 목표로 한다고 Synaptics의 Vineet Ganju가 말했습니다. 어느 쪽의 NPU가 ID R&D의 음성 생체 인식 알고리즘과 스푸핑 방지를 동시에 실행할 수 있는 "충분한 것 이상" 컴퓨팅을 가지고 있다고 그는 말했습니다. NPU는 활용도가 3배 감소한 칩의 CPU를 사용하는 것과 비교하여 음성 생체 인식 추론 속도를 10배까지 높일 수 있었습니다.

Synaptics는 ID R&D와 같은 회사가 NPU에 대한 기술을 최적화할 수 있도록 하는 도구 세트를 제공하며 ID R&D는 이와 관련하여 Synaptics의 첫 번째 파트너이지만 회사는 향후 음성 생체 인식 이외의 응용 프로그램에 대해 더 많은 파트너와 협력할 것입니다.

Ganju는 "음성 인식 회사와 논의한 결과 NPU의 1 TOPS 기능 내에서 실제로 장치에서 완전한 영어 어휘 음성 인식 엔진을 수행할 수 있습니다."라고 말했습니다. "따라서 음성 인식과 관련하여 완전한 오프라인 제품을 가질 수 있습니다. 예를 들어 사용자가 WiFi에 즉시 연결하지 않는 제품의 경우 온보드 음성 인식을 사용하면 이전에도 즉시 사용 가능한 경험을 얻을 수 있습니다. 연결되었습니다.”

ID R&D의 첫 번째 소프트웨어 빌드는 이번 달 말에 Synaptics의 VS600 개발 키트에서 사용할 수 있습니다.

>> 이 기사는 원래 다음 날짜에 게시되었습니다. 자매 사이트인 EE Times.

IoT 보안법은 표준을 요구합니다 가성비와 확장성이 스마트 홈 성공의 핵심인 이유

사물 인터넷 기술