개발 키트로 Alexa 통합 속도 향상

설계 엔지니어는 하드웨어 모듈 및 소프트웨어 서비스를 사용하여 AVS(Alexa Voice Service)를 스마트 홈, 자동차 및 웨어러블 장치에 통합할 수 있습니다. 클라우드 기반 Alexa 경험을 휴대용 스피커에서 스마트 기기, 차량 내 인포테인먼트에 이르는 제품에 제공합니다. 개발자는 Alexa를 음성 기반 제품에 통합하고 컴패니언 앱을 작성하여 제품을 연결된 제품으로 전환할 수 있습니다.

Amazon이 2014년에 원래 Alexa 장치를 출시한 이후로 Amazon Web Services(AWS)와 여러 칩 제조업체는 사전 구축 및 사전 테스트를 거친 설계를 제공하여 엔지니어가 Amazon의 음성 인식 기술과 AVS 인터페이스를 통합하는 데 도움이 되는 참조 설계를 공개했습니다.

따라서 회사에 하드웨어 및 소프트웨어 개발을 담당할 엔지니어가 많지 않은 경우 참조 설계를 사용하면 Alexa 기반 설계를 위한 간단하고 비용 효율적인 자연어 이해 및 음성 인터페이스 개발이 쉬워집니다. 그렇지 않으면 고품질 오디오 처리의 통합으로 인해 음성 지원 장치의 개발이 길고 복잡해집니다.

그림 1. AVS 기반 음성 애플리케이션을 위한 참조 설계는 Amazon의 음성 인식 기술을 음성 제어 장치에 원활하게 통합하도록 구축되었습니다. 출처:STMicroelectronics

깨우기 단어 감지

이 모든 것은 시스템이 조치를 취하기 전에 키워드 "Alexa"를 수신하는 강력한 깨우기 엔진(WWE)으로 시작됩니다. 컨텍스트를 확인하고 사용자가 Alexa를 정말로 원하는지 확인하는 클라우드 기반 깨우기 단어 확인이 있습니다. 여기에서 참조 설계의 음성 캡처 부분은 실제 조건에서 오디오 캡처를 수행하여 "Alexa" 깨우기 단어 감지를 향상시킵니다. 따라서 설계자는 적당한 거리에서도 시끄러운 환경을 방해할 수 있습니다.

Amazon AVS 애플리케이션용 Cirrus Logic의 음성 캡처 개발 키트를 예로 들어 보겠습니다. 검증된 하드웨어 및 소프트웨어 구성 요소로 음향 튜닝을 제공합니다. 이 키트는 사용자가 장치에서 몇 미터 떨어져 있는 경우에도 조용하고 시끄러운 환경 모두에서 "Alexa" 깨우기 단어 감지를 개선합니다. 보다 정확하고 안정적인 음성 상호 작용을 위해 소음 및 기타 실제 간섭을 억제하여 이를 수행합니다.

그림 2. 원거리 AVS 참조 설계는 스마트 스피커 및 기타 음성 제어 스마트 홈 장치를 대상으로 합니다. 출처:Cirrus Logic

위에 표시된 것처럼 키트에는 2개의 마이크 어레이가 있는 음성 캡처 보드, Raspberry Pi 3(RPi3), 스피커 및 즉각적인 생산성을 위해 필요한 펌웨어가 미리 로드된 microSD 카드가 포함됩니다. 제어 콘솔은 다양한 RPi3 애플리케이션의 작동을 단순화하고 음향 튜닝 및 진단 기능을 수행하기 위한 사용자 친화적인 인터페이스를 제공합니다.

음성 캡처 보드에는 Cirrus Logic의 CS47L24 스마트 코덱, CS7250B 디지털 MEMS 마이크 및 음성 제어, 소음 억제 및 반향 제거를 위한 SoundClear 알고리즘이 있습니다. 여기에서 스마트 코덱은 하이파이 DAC, 스테레오 헤드폰 앰프, 모노 스피커 앰프를 통합하여 보드 공간과 BOM(Bill-of-Materials)을 줄입니다.

다음으로, 초저잡음 플로어와 103dB의 넓은 다이내믹 레인지를 특징으로 하는 MEMS 마이크는 까다로운 소음 조건에서도 정확한 음성 캡처를 보장합니다. 마지막으로 SoundClear 알고리즘은 Alexa 깨우기 단어를 방해할 수 있는 노이즈를 차단합니다.

이를 통해 키트는 실제 조건에서 "Alexa" 깨우기 단어 감지 및 오디오 캡처를 효율적으로 수행할 수 있으며, 시끄러운 환경의 적당한 거리에서도 사용자가 시끄러운 음악 또는 Alexa 응답 재생을 안정적으로 중단할 수 있습니다.

오디오 프런트 엔드

AVS 기반 설계의 기본 하드웨어는 조용하고 시끄러운 환경 모두에서 "Alexa" 웨이크 워드 감지를 보장하는 여러 개의 마이크와 오디오 프런트 엔드(AFE)로 구성됩니다. 이는 오디오 프론트 엔드를 모든 AVS 참조 디자인의 중요한 구성 요소로 만듭니다.

오디오 프론트 엔드는 사용자의 음성을 포착하여 증폭하고 배경 소음을 줄이고 클라우드로 보냅니다. 하기 어렵기 때문에 개발 키트를 사용하는 것이 오디오 프론트 엔드를 만드는 좋은 방법입니다.

AVS 인증 통합 음성 처리 기능을 갖춘 DSP Concepts의 오디오 프런트 엔드인 TalkTo의 경우를 살펴보십시오. 이 칩 제조업체의 STM32 MCU를 기반으로 하는 STMicroelectronics의 AWS IoT Core 참조 설계를 위해 출시되었습니다. TalkTo 오디오 프런트 엔드는 원거리 오디오 감지를 위한 고급 빔포밍을 기반으로 하는 노이즈 감소, 에코 제거 및 신호 처리 기능을 제공합니다. 개발자가 AVS 디자인을 미세 조정하는 데 도움이 되는 무료 도구인 Audio Weaver를 통해 제공됩니다.

그림 3. 오디오 프런트 엔드 처리, 로컬 웨이크 워드 감지, 통신 인터페이스, RAM 및 플래시를 포함한 메모리 콘텐츠로 구성된 단일 칩 솔루션은 BOM 비용을 줄이고 레이아웃을 단순화합니다. 출처:STMicroelectronic

ST의 36×65mm 기판은 단일 칩에 오디오 프런트 엔드 처리, 로컬 웨이크 워드 감지, 통신 인터페이스 및 메모리를 통합하는 STM32H743 MCU와 Wi-Fi 모듈을 결합합니다. 또한 레퍼런스 디자인 하드웨어에는 개발 및 프로토타입 제작을 더욱 단순화하기 위해 별도의 모듈로 오디오 도터보드가 포함되어 있습니다.

도터보드는 FDA903D 오디오 코덱, 사용자 LED 및 버튼, 그리고 크기가 제한된 설계를 위해 36mm 간격으로 두 개의 MP23DB01HP MEMS 마이크로 구성됩니다. 이를 통해 개발자는 마이크를 끄는 개인 정보 보호 모드를 통합할 수 있으므로 빨간색 LED가 사용자에게 Alexa가 음성 명령을 들을 수 없음을 알릴 수 있습니다.

원거리 음성 인식

다른 칩 제조업체들도 Amazon의 원거리 음성 인식 기술을 통합하는 참조 설계에 참여했습니다. 예를 들어 NXP는 시끄러운 음악이 재생되는 경우에도 방 건너편에서 사용자의 요청을 인식한다고 주장하는 참조 플랫폼을 공개했습니다.

Amazon Alexa용 NXP의 참조 플랫폼은 7-마이크 어레이 설계, 오디오 처리 알고리즘 및 빔포밍 기술로 구성됩니다. Amazon의 원거리 음성 인식 기술을 NXP의 i.MX 애플리케이션 프로세서와 통합하는 동시에 음성 제어 장치의 생성을 단순화하는 것을 목표로 합니다.

Alexa와 같은 음성 지원 설계는 사용자가 토스터에서 밥솥, 온도 조절 장치, 블라인드에 이르기까지 다양한 스마트 사물과 상호 작용하는 방식을 변화시킵니다. 여기에서 레퍼런스 보드와 음성 캡처 키트는 다양한 Alexa 지원 제품을 가장 빠르게 출시할 수 있는 경로를 제공하는 동시에 시끄러운 환경에서도 매우 정확한 웨이크 워드 트리거링 및 명령 해석을 보장합니다.

우리는 음성 지원 장치 혁명의 시작 단계에 있으며 이러한 애플리케이션의 다양성은 사전 설계되고 사전 테스트된 참조 보드 및 키트가 중요한 역할을 할 가능성이 있음을 의미합니다. 음성 지원 제품을 더 빨리 시장에 출시하고 설계 복잡성을 우회하는 데 이들의 역할이 중요할 것입니다.

>> 이 기사는 원래 다음 날짜에 게시되었습니다. 자매 사이트인 EDN.

Edge와 Endpoint AI가 클라우드를 만나는 곳 대규모 IoT 프로비저닝 촉진

사물 인터넷 기술