Investigating deep ensembles for the tilted-wave interferometer

Harren, Lara

FG Maschinelles Lernen

Optical aspheres and freeform surfaces are widely used in modern technologies and industry and form an integral part of, e.g., lenses, photo cameras or imaging optics. They can be designed to be more complex than spherical surfaces, resulting in improved functionality and light, compact optical systems. However, their further improvement is challenged by the current limitation of high-accurate optical form measurement. Further improving optical form measurements in terms of accuracy, measurement and computation time, as well as incorporating a reliable uncertainty quantification of the reconstructed topography, therefore remain topics of ongoing research for the development of new technologies with high-precision components. The tilted-wave interferometer (TWI) is a state-of-the-art measurement technique for the accurate form measurement of optical aspheres and freeform surfaces. Its evaluation procedure strongly depends on mathematical calculations including solving a high-dimensional nonlinear inverse problem. So far, the TWI analysis is based on conventional analysis methods. The goal of this thesis is to explore the potential of deep learning for further enhancing the optical form measurement by the TWI. Data-driven machine learning methods and deep neural networks in particular have had a major impact on science and industry thanks to their ability to learn complex relationships from data. Deep learning techniques have been successfully applied and have been shown to outperform conventional methods in a variety of different applications including medical imaging, natural language processing or solving inverse problems. An advantage of deep neural networks is that they produce instant results once they are trained. This can be a benefit for time consuming applications. Also, deep learning comprises frameworks for easy-to-apply uncertainty quantifications of a solution. Our contributions are the following. In a first proof-of-principle study, we develop a deep learning method to solve the high-dimensional inverse problem related to the form reconstruction problem of the TWI. For this purpose, a database is generated for neural network training and testing using virtual experiments. The developed method is shown to provide reliable results and a calibrated uncertainty quantification of the prediction for in-domain as well as out-of-distribution data in a simulated environment. Next, we apply the developed deep learning approach to measurement data from a real specimen to demonstrate its practical use in a real-world environment. The results are shown to be consistent with the results of a modern TWI system from industry, and differences lie well within the estimated uncertainties of the proposed deep learning method, supporting the reliability of the developed uncertainty quantification for the deep learning approach. Finally, a Bayesian statistical framework is developed and used to gain new insights into the role of deep ensembles that represent the current state-of-the-art for uncertainty quantification in deep learning. We propose an extension to deep ensembles that leads to an improved quantification of the epistemic part of the uncertainty in tasks of deep regression without altering the neural network training or the prediction capacity. Analytical derivations ensure easy calculations and experiments demonstrate the significant impact of the developed extension.
Optische Asphären und Freiformflächen, wie z.B. Brillengläser, Kameraobjektive und andere Abbildungsoptiken, sind in modernen Technologien und der Industrie weit verbreitet. Durch ihre komplexen Gestaltungsmöglichkeiten helfen sie beispielsweise Abbildungsfehler zu reduzieren, was zu kompakteren und leichteren optischen Systemen führt. Jedoch ist es anspruchsvoll solche Oberflächen genau zu messen. Es wird stetig daran geforscht, die Formmessungen in Bezug auf die erzielten Genauigkeiten, Mess- und Rekonstruktionszeiten zu verbessern, sowie eine Unsicherheitsquantifizierung der rekonstruierten Topographie mit anzugeben, um neue Technologien mit hochgenauen Komponenten zu entwickeln. Das Tilted-Wave Interferometer (TWI) ist ein modernes Messgerät für die hochgenaue Formmessung von optischen Asphären und Freiformflächen. Es beinhaltet ein mathematisches Auswerteverfahren, welches bis jetzt mit konventionellen Analysemethoden bearbeitet wurde. Unter anderem muss ein hochdimensionales nichtlineares inverses Problem zur Formrekonstruktion gelöst werden. Ziel dieser Dissertation ist, das Potential von Deep Learning (DL) für die optische Formmessung mit Hilfe des TWIs zu untersuchen. Datengetriebene Methoden und insbesondere tiefe neuronale Netze können komplexe Zusammenhänge aus Daten lernen und haben einen großen Einfluss auf die heutige Forschung und Industrie. Sie wurden bereits in verschiedensten Aufgabenfeldern erfolgreich angewendet und sind der Stand der Technik in Teilbereichen der Bildverarbeitung, natürlichen Sprachverarbeitung oder der Lösung inverser Probleme. Ein Vorteil von neuronalen Netzen ist, dass sie sofortige Ergebnisse liefern, nachdem sie trainiert wurden. Außerdem bietet DL leicht anwendbare Methoden zur Unsicherheitsbestimmung. Die Beiträge dieser Dissertation lassen sich wie folgt zusammenfassen. In ersten Untersuchungen wird eine DL-Methode zur Lösung des hochdimensionalen inversen Problems zur Formrekonstruktion des TWIs entwickelt. Dafür wird eine Datenbank für das Trainieren und Testen tiefer neuronaler Netze mit Hilfe von virtuellen Experimenten generiert. Die Unsicherheitsquantifizierung wird auf Basis von Deep Ensembles, welche als aktueller Stand der Technik zur Quantifizierung der Unsicherheit in DL gesehen werden können, in den DL-Ansatz mit eingebaut. Es wird gezeigt, dass die entwickelte Methode zuverlässige Ergebnise und eine kalibrierte Unsicherheitsquantifizierung der Vorhersage auf simulierten Daten liefert. Als Nächstes wird die entwickelte DL-Methode auf Messdaten eines realen Prüflings angewendet, um zu zeigen, dass sie auch in der Praxis verwendet werden kann. Ein modernes TWI-Messsystem aus der Industrie wird als Vergleichsmethode herangezogen, um die Ergebnisse bewerten zu können. Die Rekonstruktionsergebnisse der beiden Methoden sind konsistent und die Unterschiede liegen innerhalb der geschätzten Unsicherheiten. Schließlich werden Deep Ensembles von einem Bayes-statistischem Blickwinkel untersucht, um neue Einblicke in die Methode und ihre Unsicherheitsquantifizierung zu gewinnen. Darauf basierend wird eine Erweiterung vorgeschlagen, welche zu einer verbesserten Quantifizierung der epistemischen Unsicherheit für Regressionsprobleme führt, ohne dass die Netze neu trainiert werden müssen oder sich ihre Vorhersagegenauigkeit ändert. Analytische Herleitungen sorgen für einfache Berechnungen und Experimente belegen den signifikanten Einfluss der Erweiterung.