임베디드
뉴로모픽 컴퓨팅 IP 공급업체인 BrainChip은 최근 Linley Fall Processor Conference에서 Akida 뉴로모픽 프로세서를 위한 두 가지 개발 키트를 출시했습니다. 두 키트 모두 회사의 Akida 뉴로모픽 SoC인 x86 Shuttle PC 개발 키트와 Arm 기반 Raspberry Pi 키트를 특징으로 합니다. BrainChip은 IP 라이선스를 희망하는 스파이크 신경망 프로세서로 작업하는 개발자에게 도구를 제공하고 있습니다. 아키다 실리콘도 있습니다.
BrainChip의 뉴로모픽 기술은 초저전력 실시간 센서 데이터 처리가 필요한 에지 시스템의 데이터 분석을 위한 초저전력 AI를 가능하게 합니다. 이 회사는 주류 딥 러닝 접근 방식과 다른 뇌에서 영감을 받은 신경망인 스파이크 신경망(SNN)을 처리하도록 설계된 신경 처리 장치(NPU)를 개발했습니다. 뇌와 마찬가지로 SNN은 정보를 공간적, 시간적으로 전달하는 "스파이크"에 의존합니다. 즉, 뇌는 시퀀스와 스파이크의 타이밍을 모두 인식합니다. "이벤트 도메인"이라고 하는 스파이크는 일반적으로 센서 데이터의 변경(예:이벤트 기반 카메라의 픽셀 색상 변경)으로 인해 발생합니다.
SNN과 함께 BrainChip의 NPU는 컴퓨터 비전 및 키워드 탐지 알고리즘에 일반적으로 사용되는 것과 같은 합성곱 신경망(CNN)을 다른 에지 구현보다 낮은 전력으로 처리할 수도 있습니다. 이것은 CNN을 SNN으로 변환하고 이벤트 도메인에서 추론을 실행하여 수행됩니다. 이 접근 방식은 또한 변환된 CNN으로 확장될 SNN의 품질인 에지에서 온칩 학습을 허용합니다.
BrainChip의 개발 보드는 x86 셔틀 PC 또는 Raspberry Pi에서 사용할 수 있습니다. (출처:BrainChip)
BrainChip의 공동 설립자이자 최고 개발 책임자인 Anil Mankar는 EE Times에 "Akida는 미래의 뉴로모픽 기술에 대한 준비가 되어 있지만 에지 및 IoT 장치에서 신경망 추론을 가능하게 하는 오늘날의 문제를 해결합니다"라고 말했습니다. .
CNN에서 이벤트 도메인으로의 변환은 BrainChip의 소프트웨어 도구 흐름인 MetaTF에 의해 수행됩니다. 데이터는 스파이크로 변환될 수 있고 훈련된 모델은 BrainChip의 NPU에서 실행되도록 변환될 수 있습니다.
Mankar는 "우리 런타임 소프트웨어는 'SNN이란?' 및 '이벤트 도메인이란?'에 대한 두려움을 없애줍니다. “우리는 그것을 숨기기 위해 최선을 다합니다.
"TensorFlow 또는 Keras API에 익숙한 사람들은... 양자화 인식 교육을 통해 [다른 하드웨어], 동일한 네트워크, 동일한 데이터세트에서 실행 중인 애플리케이션을 우리 하드웨어에서 실행하고 자체적으로 전력을 측정하고 정확도가 어느 정도인지 확인하십시오.”
CNN은 대규모 데이터 세트에서 특징을 추출하는 데 특히 뛰어나며 이벤트 도메인으로의 변환은 이러한 이점을 유지한다고 Mankar는 설명했습니다. 컨볼루션 연산은 대부분의 레이어에 대해 이벤트 도메인에서 이루어지지만 최종 레이어가 대체됩니다. 들어오는 스파이크를 인식하는 레이어로 교체하면 일반 CNN이 에지에서 스파이크 타이밍 종속 가소성을 통해 학습할 수 있으므로 클라우드에서 재훈련이 필요하지 않습니다.
네이티브 SNN(이벤트 도메인용으로 처음부터 작성된 것)은 1비트 정밀도를 사용할 수 있지만 변환된 CNN에는 1비트, 2비트 또는 4비트 스파이크가 필요합니다. BrainChip의 양자화 도구는 디자이너가 레이어별로 양자화하는 방법을 적극적으로 결정할 수 있도록 도와줍니다. Brainchip은 4비트로 양자화한 후 93.1%의 예측 정확도로 10개 개체 분류를 위해 MobileNet V1을 양자화했습니다.
이벤트 도메인으로 변환하는 부산물은 희소성으로 인한 상당한 전력 절감입니다. 0이 아닌 활성화 맵 값은 1~4비트 이벤트로 표시되며 NPU는 전체 활성화 맵이 아닌 이벤트에 대해서만 계산을 수행합니다.
Mankar는 "개발자는 가중치를 보고 0이 아닌 가중치를 보고 0 가중치를 곱하는 것을 피하려고 할 수 있습니다."라고 말했습니다. "하지만 이는 0이 어디에 있는지 알아야 하고 해당 작업에 필요한 계산이 있음을 의미합니다."
일반적인 CNN의 경우 ReLU 기능이 0을 중심으로 하기 때문에 활성화 맵은 모든 비디오 프레임과 함께 변경됩니다. 일반적으로 활성화의 절반은 0입니다. 이러한 0에서 스파이크를 만들지 않음으로써 이벤트 도메인의 계산은 0이 아닌 활성화로 제한됩니다. CNN을 이벤트 도메인에서 실행하도록 변환하면 희소성을 활용할 수 있으므로 추론에 필요한 MAC 작업 수를 빠르게 줄여 전력 소모를 줄일 수 있습니다.
이벤트 영역으로 변환할 수 있는 함수로는 convolution, point-wise convolution, depth-wise convolution, max pooling, global average pooling 등이 있습니다.
객체 분류 추론에 필요한 MAC 작업(진한 파란색은 비 이벤트 도메인의 CNN, 밝은 파란색은 이벤트 도메인/Akida, 녹색은 추가 활동 정규화가 있는 이벤트 도메인). (출처:BrainChip)
한 가지 예에서 4비트 양자화 후 Akida 개발 보드에서 실행되는 키워드 탐지 모델은 추론당 37μJ(또는 와트당 초당 27,336개의 추론)만 소비했습니다. 예측 정확도는 91.3%였으며 칩은 관찰된 성능을 달성하기 위해 5MHz로 느려졌습니다. (아래 그래프 참조).
그림>센서 불가지론
BrainChip의 NPU IP와 Akida 칩은 네트워크 유형에 구애받지 않으며 대부분의 센서와 함께 사용할 수 있습니다. 동일한 하드웨어에서 CNN 변환 또는 후각, 미각 및 진동/촉각 감지를 위한 BrainChip의 SNN을 사용하여 이미지 및 오디오 데이터를 처리할 수 있습니다.
NPU는 메시 네트워크를 통해 통신하는 4개의 노드로 클러스터링됩니다. 각 NPU에는 매개변수, 활성화 및 내부 이벤트 버퍼를 위한 처리 및 100kB의 로컬 SRAM이 포함됩니다. CNN 또는 SNN 네트워크 계층은 여러 NPU의 조합에 할당되어 CPU 지원 없이 계층 간에 이벤트를 전달합니다. (CNN 이외의 네트워크는 이벤트 도메인으로 변환할 수 있지만 Mankar는 Akida에서 실행하려면 CPU가 필요하다고 말했습니다.)
BrainChip의 NPU IP는 최대 20개의 노드로 구성할 수 있으며 더 적은 수의 노드로 설계에서 더 큰 네트워크를 여러 패스로 실행할 수 있습니다.
4개의 BrainChip NPU의 노드는 메쉬 네트워크로 연결됩니다. (출처:BrainChip)
BrainChip 비디오는 운전자를 감지하고 운전자의 얼굴을 인식하며 음성을 동시에 식별하는 데 사용되는 하나의 칩이 있는 차량 내 시스템에 배치된 Akida 칩을 보여주었습니다. 키워드 발견에는 600μW, 얼굴 인식에는 22mW, 운전자를 감지하는 데 사용되는 시각적 깨우침 단어 추론은 6-8mW가 필요했습니다.
이러한 자동차 플랫폼의 저전력 소비는 다른 분야의 자동차 제조업체에 유연성을 제공한다고 BrainChips의 전 세계 판매 담당 부사장인 Rob Telson은 말했습니다. Akida 칩은 Taiwan Semiconductor Manufacturing Co.의 28nm 공정 기술을 기반으로 한다고 덧붙였습니다. IP 고객은 더 많은 전력을 절약하기 위해 더 미세한 프로세스 노드로 이동할 수 있다고 Telson은 덧붙였습니다.
한편, 얼굴 인식 시스템은 클라우드로 전환하지 않고도 칩에서 새로운 얼굴을 학습할 수 있습니다. 예를 들어 스마트 초인종은 원샷 학습에서 로컬로 사람의 얼굴을 식별할 수 있습니다. 네트워크의 마지막 레이어에 충분한 수의 뉴런이 할당된다면 인식되는 총 얼굴 수는 10개에서 50개 이상으로 증가할 수 있다고 Mankar는 말했습니다.
조기 액세스 고객
BrainChip은 캘리포니아 알리소 비에호(Aliso Viejo), 프랑스 툴루즈, 인도 하이데라바드, 호주 퍼스에 본사 및 디자인 사무소에 55명의 직원을 두고 있습니다. 이 회사는 14개의 특허를 보유하고 있으며 호주 증권 거래소와 미국 장외 거래소에서 공개적으로 거래되고 있습니다.
Telson은 NASA를 포함하여 약 15명의 초기 액세스 고객이 있다고 말했습니다. 기타에는 자동차, 군사, 항공 우주, 의료(후각 코비드-19 감지) 및 소비자 전자 회사가 포함됩니다. BrainChip은 스마트 건강, 스마트 시티, 스마트 홈 및 스마트 교통과 같은 소비자 애플리케이션을 대상으로 합니다.
Telson에 따르면 또 다른 초기 고객은 마이크로컨트롤러 전문업체 Renesas로, 2노드 Akida NPU IP를 IoT 배포의 센서 데이터 분석을 목표로 하는 미래 MCU와 통합할 수 있도록 라이선스를 부여했습니다.
Akida IP와 실리콘을 지금 사용할 수 있습니다.
>> 이 기사는 원래 자매 사이트인 EE Times에 게시되었습니다.엠>
관련 콘텐츠:
더 많은 Embedded를 보려면 Embedded의 주간 이메일 뉴스레터를 구독하세요.
임베디드
사물 인터넷(IoT)은 유행어가 되었고 너무 과도하게 사용되어 배포하기에 너무 복잡할 수 있습니다. 그러나 간단히 말해서 프로세스에 특정한 매개변수를 감지 및 측정하고 데이터로 작업을 수행한 다음 피드백 및 제어 메커니즘을 제공하여 수정 조치를 가능하게 하는 것입니다. 이것은 충분히 간단하게 들릴 수 있습니다. 그러나 많은 최종 사용자는 시스템 설계, 네트워크, 데이터 분석 및 보안에 정통하지 않기 때문에 어디서부터 시작해야 할지 잘 모르는 경우가 많습니다. 칩 제조업체와 임베디드 보드 및 모듈 제공업체는 이를 인식하고 신속하게
포그 컴퓨팅을 설명하기 전에 사전에서 공통 용어가 된 개념인 클라우드 컴퓨팅에 대해 확실히 이해하고 있는지 확인해야 합니다. 클라우드 컴퓨팅 온프레미스 하드웨어나 사용자의 적극적인 관리 없이 주문형 컴퓨팅 리소스, 컴퓨팅 성능 및 데이터 스토리지에 대한 액세스를 말합니다. 아래 그림 1은 다중 사이트 기업이 산업용 클라우드 솔루션을 배포하는 방법에 대한 매우 일반적인 아키텍처 표현을 보여줍니다. 그림 1:클라우드 컴퓨팅 아키텍처. 저자의 의례. 클라우드 아키텍처 내에서 IaaS(Infrastructure-as-a-Serv