산업 제조
산업용 사물 인터넷 | 산업자재 | 장비 유지 보수 및 수리 | 산업 프로그래밍 |
home  MfgRobots >> 산업 제조 >  >> Industrial Internet of Things >> 임베디드

Processor-in-memory 칩은 AI 계산 속도를 높입니다.

Imec과 GlobalFoundries는 최대 2900 TOPS/W의 에너지 효율성을 달성할 수 있는 프로세서-인-메모리 칩을 시연했으며, 이는 오늘날의 상용 프로세서-인-메모리 칩보다 약 20배 높은 수치입니다. 이 칩은 GlobalFoundries의 22nm 완전 공핍 실리콘 온 인슐레이터(FD-SOI) 공정 기술의 SRAM에 구현된 기존 아이디어인 아날로그 컴퓨팅을 사용합니다. Imec의 AiMC(아날로그 인메모리 컴퓨팅)는 회사의 22FDX 플랫폼에서 구현할 수 있는 기능으로 GlobalFoundries 고객에게 제공됩니다.


측정 및 특성화에 사용되는 PCB에 장착된 여기에서 볼 수 있는 Imec의 AnIA 테스트 칩은 최대 2900TOPS/W(이미지:Imec)를 달성할 수 있습니다.

아날로그 컴퓨팅

아날로그 컴퓨팅 또는 프로세서 인 메모리는 신생 기업인 Mythic, Syntiant, Gyrfalcon 등의 상용 AI 가속기 칩에 이미 사용된 확립된 기술입니다.

신경망 모델에는 수천만 또는 수억 개의 가중치가 있을 수 있으므로 메모리와 프로세서 간에 데이터를 주고받는 것은 비효율적입니다. 아날로그 컴퓨팅은 메모리 어레이를 사용하여 가중치를 저장하고 MAC(multiply-accumulate) 연산도 수행하므로 메모리에서 프로세서로의 전송이 필요하지 않습니다. 각 멤리스터 요소(ReRAM 셀)에는 필요한 무게에 비례하는 아날로그 수준으로 프로그래밍된 전도도가 있습니다.

입력 활성화에 비례하는 전압을 적용하면(아래 다이어그램 왼쪽에 있는 디지털-아날로그 변환을 통해) 각 요소를 통과하는 전류가 활성화와 무게의 곱에 비례한다는 것을 의미합니다. 각 수직 비트 라인(아래 다이어그램의 수직 라인)을 통과하는 전류는 아날로그-디지털 변환기를 통해 공급될 수 있는 이러한 활성화 가중치 곱의 합계입니다. 이 활성화 가중치 곱의 합은 신경망 알고리즘 계산에 중요합니다.


아날로그 컴퓨팅은 메모리와 프로세서 간에 데이터를 보낼 필요 없이 멤리스터 셀 배열을 사용하여 행렬 벡터 곱셈을 계산합니다(이미지:Imec)

프로그램의 Diederik Verkest는 "실제로 ReRAM 외에도 많은 옵션이 가능합니다. MRAM, Flash, DRAM을 사용할 수 있습니다... 이 프로그램의 목적은 애플리케이션에 가장 적합한 옵션을 이해하고 각 애플리케이션 도메인에 대한 옵션을 최적화하는 것입니다."라고 설명했습니다. Imec의 기계 학습 담당 이사입니다.

테스트 칩

Imec은 GlobalFoundries의 22nm FD-SOI 공정을 기반으로 AnIA(아날로그 추론 가속기)라는 테스트 칩을 구축했습니다. AnIA의 512k SRAM 셀 어레이와 1024 DAC 및 512 ADC를 포함한 디지털 인프라는 4mm 2 를 차지합니다. . 약 50만 개 정도의 성능을 발휘할 수 있습니다.


Ioannis Papistas(이미지:Imec)

6비트(더하기 부호 비트) 입력 활성화, 삼항 가중치(-1, 0, +1) 및 6비트 출력을 기반으로 하는 작업 주기당 계산

Imec의 기계 학습 그룹의 Ioannis Papistas는 "다른 공급 전압, 0.8 및 0.6V에서 행렬 벡터 곱셈 출력을 생성할 수 있습니다."라고 말했습니다. “작동의 정확성에 영향을 미치지 않으면서 더 낮은 공급 전압에서 작동하면 작동 전력 소비를 크게 줄일 수 있으며, 이는 에너지 제약이 있는 시스템의 추론에 특히 중요합니다. 이것은 22FDX 프로세스에 의해 활성화된 우리 설계의 중요한 기능으로, 엣지에서 경쟁력 있는 추론을 가능하게 합니다.”

Imec은 CIFAR 10 데이터 세트에서 객체 인식 추론에 대한 정확도 결과를 보여주었으며, 이는 유사하게 양자화된 기준선과 비교하여 단 1% 포인트만 떨어졌습니다. 공급 전압이 0.8V일 때 AnIA의 에너지 효율은 23.5TOPS에서 1050~1500TOPS/W입니다. 0.6V 공급 전압의 경우 AnIA는 약 1800-2900TOPS/W에서 5.8TOPS를 달성했습니다.


Imec의 AnIA 테스트 칩과 비교한 다양한 AI 가속기의 에너지 효율성(확대하려면 클릭) (이미지:Imec)

주요 혁신

GlobalFoundries의 컴퓨팅 사업부 부사장 겸 GM인 Hiren Majmudar는 "[Imec이 발표한] 혁신이 주류가 될 것입니다. "우리는 검증된 실리콘으로 포스트 프로덕션 단계에 있는 GlobalFoundries의 파트너, 고객을 보고 있습니다... 우리는 아날로그 컴퓨팅 기반 실리콘이 올해 말이나 내년 초쯤에 생산에 들어갈 것으로 예상합니다. 대중 시장 배포 측면에서 우리는 아날로그 컴퓨팅이 늦어도 2022년까지는 대중 시장에 진입하기 시작할 것으로 예상합니다. 하지만 그보다 더 빨리 일어날 수도 있습니다.”


디에데릭 베르케스트(이미지:Imec)

GlobalFoundries는 에너지 효율적인 AI 가속기를 활성화하기 위해 22 FDX 플랫폼에서 구현할 수 있는 기능으로 Imec의 AiMC 기술을 포함하기 위해 노력하고 있습니다. FD-SOI 프로세스는 초저 대기 누설을 위해 마이크론당 1피코 암페어로 0.5V까지 작동할 수 있는 기능으로 저전력 소비를 위해 설계되었습니다. 새로운 AiMC 기능이 있는 22FDX는 독일 드레스덴의 Fab 1에 있는 GlobalFoundries의 300mm 생산 라인에서 개발 중입니다.

Imec의 경우 머신 러닝 프로그램이 계속됩니다. 그룹의 목표는 상시 작동 스마트 센서 및 소비자 웨어러블 기기에 대해 10,000 TOPS/W(100mW 미만의 10 TOPS)에 도달하는 것이라고 Verkest는 말했습니다.

"ML 프로그램에서 우리의 다음 단계는 이러한 컴퓨팅 셀의 크기를 줄이고 이 원칙에 대한 차세대 구현으로 새로운 메모리 장치를 살펴보기 시작하는 것입니다."라고 그는 말했습니다.

>> 이 기사는 원래 다음 날짜에 게시되었습니다. 자매 사이트인 EE Times.


임베디드

  1. 아날로그 집적 회로 소개
  2. 전산 회로
  3. Bluetooth Mesh로 설계:칩 또는 모듈?
  4. AI 칩 아키텍처는 그래프 처리를 대상으로 합니다.
  5. 초소형 Bluetooth 5.0 모듈은 칩 안테나를 통합합니다.
  6. 연구원은 작은 인증 ID 태그를 구축합니다.
  7. 30fps 자동차 이미징 레이더 프로세서 출시
  8. 저전력 레이더 칩은 스파이크 신경망을 사용합니다.
  9. 에지 AI 개발 속도를 높이는 스마트 센서 보드
  10. 생산을 위한 내구성 있는 UAV 속도