Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-7942
Main Title: Opening the machine learning black box with Layer-wise Relevance Propagation
Translated Title: Öffnen der Black Box des maschinellen Lernens mit Layer-wise Relevance Propagation
Author(s): Lapuschkin, Sebastian
Advisor(s): Müller, Klaus-Robert
Referee(s): Müller, Klaus-Robert
Wiegand, Thomas
Principe, Jose C.
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
Language Code: en
Abstract: Machine learning techniques such as (Deep) Neural Networks are successfully solving a plethora of tasks, e.g. in image recognition and text analysis, and provide novel predictive models for complex physical, biological and chemical systems. However, due to the nested complex and non-linear structure of many machine learning models, this comes with the disadvantage of them acting as a black box, providing little or no information about the internal reasoning. This black box character hampers acceptance and application of non-linear methods in many application domains, where understanding individual model predictions and thus trust in the model’s decisions are critically important. In this thesis, we describe a novel method for explaining non-linear classifier decisions by decomposing the prediction function, called Layer-wise Relevance Propagation (LRP). We apply our method to Neural Networks, kernelized Support Vector Machines (with non-linear kernels) and Bag of Words feature extraction pipelines and evaluate LRP theoretically, qualitatively and quantitatively in comparison to other recent methods for interpreting model predictions. Using our method as a tool for comparative analyses between various pre-trained models we reveal different learned prediction strategies and flaws in datasets, predictors and the training thereof.
Techniken des maschinellen Lernens wie (Tiefe) Neuronale Netze lösen eine Vielzahl an Aufgaben mit großem Erfolg, beispielsweise in der Bilderkennung und Textanalyse, und bieten neuartige Vorhersagemodelle für komplexe physikalische, biologische und chemische Zusammenhänge auf. Dies geht jedoch durch die verschachtelte und komplex-nichtlineare Struktur vieler Modelle des maschinellen Lernens mit dem Nachteil einher, dass diese Modelle sich wie Black Boxes verhalten und keine oder nur wenig Informationen über interne Schlussfolgerungen preisgeben. Dieser Black Box-Charakter beeinträchtigt die Anwendung und Akzeptanz von nichtlinearen Methoden in zahlreichen Anwendungsgebieten, in denen das Verstehen individueller Modellvorhersagen, und somit das Vertrauen in das Vorhersagemodell unumgänglich ist. Diese Dissertation behandelt eine neuartige Methode, genannt Layer-wise Relevance Propagation (LRP), zur Erklärung nichtlinearer Klassifikationsentscheidungen mittels der Zerlegung der Vorhersagefunktion. Wir wenden unsere Methode auf Neuronale Netze, Support Vector Maschinen (mit nichtlinearen Kernen) und Bag of Words Merkmalsextraktionssysteme an, und evaluieren LRP auf theoretischer, qualitativer und quantitativer Ebene im Vergleich zu weiteren aktuellen Methoden zur Interpretation von Modellvorhersagen. Unsere Methode als Analysewerkzeug nutzend decken wir vergleichend zwischen diversen vortrainierten Modellen verschiedene erlernte Vorhersagestrate gien und Schwächen in Datensätzen, Prädiktionsmodellen und deren Training auf.
URI: https://depositonce.tu-berlin.de//handle/11303/8813
http://dx.doi.org/10.14279/depositonce-7942
Exam Date: 19-Dec-2018
Issue Date: 2019
Date Available: 30-Jan-2019
DDC Class: 004 Datenverarbeitung; Informatik
006 Spezielle Computerverfahren
Subject(s): machine learning
Layer-wise Relevance Propagation
Taylor decomposition
spectral relevance analysis
explainable artificial intelligence
machinelles Lernen
Taylor-Zerlegung
spektrale Relevanzanalyse
erklärbare künstliche Intelligenz
License: https://creativecommons.org/licenses/by-nc-nd/4.0/
Appears in Collections:FG Maschinelles Lernen » Publications

Files in This Item:
File Description SizeFormat 
lapuschkin_sebastian.pdf17.46 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons