Please use this identifier to cite or link to this item:
For citation please use:
Main Title: Performance Counters based Power Modeling of Mobile GPUs using Deep Learning
Translated Title: Leistungszähler-basierte Leistungsmodellierung von Mobile GPUs mit Deep Learning
Author(s): Mammeri, Nadjib
Neu, Markus
Lal, Sohan
Juurlink, Ben
Type: Conference Object
Language Code: en
Abstract: GPUs have recently become important computational units on mobile devices, resulting in heterogeneous devices that can run a variety of parallel processing applications. While developing and optimizing such applications, estimating power consumption is of immense importance as energy efficiency has become the key design constraint to optimize for on these platforms. In this work, we apply deep learning techniques in building a predictive model for estimating the power consumption of parallel applications on a heterogeneous mobile SoC. Our model is an artificial neural network (NN) trained using CPU and GPU hardware performance counters along with measured power data. The model is trained and evaluated with data collected using a set of graphics OpenGL workloads as well as OpenCL compute benchmarks. Our evaluations show that our model can achieve accurate power estimates with a mean relative error of 4.47% with respect to real power measurements. When compared to other models, our NN model is about 3.3x better than a statistical linear regression model and 2x better than a state-of-the-art NN model.
GPUs sind in letzter Zeit zu wichtigen Recheneinheiten auf Mobilgeräten geworden, was zu heterogenen Geräten führt, auf denen eine Vielzahl von Parallelverarbeitungsanwendungen ausgeführt werden können. Bei der Entwicklung und Optimierung solcher Anwendungen ist die Schätzung des Stromverbrauchs von immenser Bedeutung, da die Energieeffizienz zu den wichtigsten Entwurfsbeschränkungen für die Optimierung auf diesen Plattformen geworden ist. In dieser Arbeit wenden wir Deep-Learning-Techniken an, um ein Vorhersagemodell zur Schätzung des Stromverbrauchs paralleler Anwendungen auf einem heterogenen mobilen SoC zu erstellen. Unser Modell ist ein künstliches neuronales Netzwerk (NN), das unter Verwendung von Leistungsindikatoren für CPU- und GPU-Hardware zusammen mit gemessenen Leistungsdaten trainiert wird. Das Modell wird mit Daten trainiert und ausgewertet, die mithilfe einer Reihe von OpenGL-Grafik-Workloads sowie OpenCL-Rechenbenchmarks erfasst wurden. Unsere Bewertungen zeigen, dass unser Modell genaue Leistungsschätzungen mit einem mittleren relativen Fehler von 4,47% in Bezug auf Wirkleistungsmessungen erzielen kann. Im Vergleich zu anderen Modellen ist unser NN-Modell etwa 3,3-mal besser als ein statistisches lineares Regressionsmodell und 2-mal besser als ein NN nach dem Stand der Technik Modell.
Issue Date: 15-Jul-2019
Date Available: 17-Feb-2020
DDC Class: 006 Spezielle Computerverfahren
Subject(s): power modeling
mobile GPUs
neural networks
deep learning
performance counters
neuronale Netze
Proceedings Title: 2019 International Conference on High Performance Computing & Simulation (HPCS)
Publisher: Institute of Electrical and Electronics Engineers (IEEE)
Publisher Place: New York, NY
Publisher DOI: 10.1109/HPCS48598.2019.9188139
ISBN: 978-1-7281-4484-9
Appears in Collections:FG Architektur eingebetteter Systeme » Publications

Files in This Item:

Accepted manuscript

Format: Adobe PDF | Size: 2.07 MB
DownloadShow Preview

Item Export Bar

Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.