Zprávy

Urýchlovače neuronové sítě pro Lattice FPGA

Oba jsou zaměřeny na implementaci neuronových sítí v produktech spotřebních a průmyslových sítí. Nejsou vhodné pro síťové školení, které musí být provedeno jinde.

"Akcelerátor binárních neuronových sítí (BNN)" podporuje 1bitové váhy, má kvantifikaci aktivace 1bit a je navržen pro použití s ​​firmou iCE40 UltraPlus FPGA.

Kombinace akcelerátoru a FPGA je určena pro aplikace, jako je verbální detekce frází, detekce obličeje a detekce objektů.

Lattice-BNN-acceleratorPředpokládané parametry aplikace BNN + iCE40 UltraPlus jsou:

  • 1bitová neuronová síť
  • Aktivní spotřeba 1-10mW
  • Stopa 5.5 mm2
  • ~ $ 1 bom

Druhý produkt, akcelerátor "konvoluční neuronové sítě (CNN)", podporuje výběr 1, 8 a 16bitových dat jak pro váhu, tak pro aktivaci, je zaměřen na ECP5 FPGA - které jsou obecně určeny pro video použití.

Chcete-li ušetřit zdroje FPGA, mohou být různé šířky slov (1, 8 nebo 16bit) smíchány a porovnány v různých vrstvách neuronové sítě.

Tato kombinace akcelerátoru a FPGA je určena pro aplikace, včetně sledování obličeje, sledování objektů, detekce rychlosti znaménka a počítání objektů.

Lattice-CNN-accelerator

Předpokládané parametry aplikace CNN + ECP5 jsou:

  • 1, 8 nebo 16 bitů
  • <1W active consumption
  • 100 mm2 stopa
  • ~ $ 10 bom

Pro vývoj softwaru firma zavádí kompilátor neuronových sítí kompatibilní s vývojovými systémy Caffe a TensorFlow.

Podle ředitele marketingu sítě Deepak Boppana, kompilátor nevyžaduje předchozí RTL zkušenosti a také bude analyzovat a simulovat návrhy.

Plán je, říká Boppana, že kompilátor bude použit společně s vývojovým prostředím firmy Radiant pro kombinaci BNN + iCE40 UltraPlus nebo jeho vývojové prostředí Diamond pro CNN + EC5P.

Pro zákazníky, kteří si nejsou jisti, jak vyvinout aplikaci založenou na neuronových sítích, spolupracuje s firmami pro návrhářské služby včetně Colorado Engineering, Wipro, Softnautincs a VectorBlox.

Desky pro vývoj hardwaru jsou již k dispozici pro iCE40 UltraPlus a ECP5.

Rozhraní přemostění a datové agregace se očekávají v aplikacích IoT s vysokým objemem, včetně inteligentních reproduktorů, kamer, průmyslových robotů a dronů.

Referenční návrhy jsou k dispozici pro detekci obličeje, detekci klíčových frází (iCE40 UltraPlus) a pro EC5P: počítání objektů, sledování obličeje a detekce rychlosti.

Urychlovače jsou označeny jako "sensAI'.