EYYES Deep Learning Accelerator

Was ist das?

Beim Deep Learning Accelerator handelt es sich um eine Hardwarebeschleunigung zur Berechnung von Deep Convoluational Neural Networks, z.B. für Embedded Systems. Der Deep Learning Accelerator ist als IPCore für FPGA Plattformen verfügbar. Als Gerät in Form eines RTI oder einer TIC-Box gibt es ihn inklusive der Videopipeline und entsprechender Schnittstellen. In Zukunft wird der Deep Learning Accelerator auch als ASIC verfügbar sein.

Was tut das?

Der Deep Learning Accelerator berechnet die Inference/Prediction für jeden DNN-Layer. Innerhalb eines Layers können die Eingabedaten durch Compute Units parallel verarbeitet werden. Benötigt wird lediglich ein durch den Deep Learning Optimizer binarisiertes Model (DNN-Architektur, Parameter, Scheduling), sowie das Eingabebild, z.B. von einem Kamerasensor.

Warum ist das so gut?

Der Deep Learning Accelerator ist vielseitig einsetzbar und skaliert mit den verwendeten FPGA. So kann für jede Applikation der geeignete Trade-Off aus Rechenleistung und Energieverbauch gewählt werden. Der Deep Learning Accelerator wird laufend weiterentwickelt, so dass auch neuere Deep Learning Funktionalitäten in Zukunft unterstützt werden können, ohne dass sich die Hardwareplattform ändert. Die wichtigsten Layerarten und Aktivierungsfunktionen werden bereits heute unterstützt.