Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-11302
For citation please use:
Main Title: Towards robust object detection and pose estimation as a service for manufacturing industries
Translated Title: Dienstebasierte Objekterkennung und Posenschätzung zur Automatisierung industrieller Produktionsprozesse
Author(s): Rudorfer, Martin
Advisor(s): Krüger, Jörg
Referee(s): Krüger, Jörg
Verl, Alexander
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
Language Code: en
Abstract: The growing trend towards high-mix and low-volume production demands more flexible and reconfigurable control for assembly systems. In unstructured or less structured environments, object detection and pose estimation is a key capability to enable industrial robotics applications such as grasping, handling and assembling. The integration and interconnectivity of such automation functions is fostered by Industry 4.0 through the adoption of service-based ecosystems. The main objective of this thesis is to create a service-based framework for robust object detection and pose estimation in manufacturing environments. This could resemble a viable alternative to traditional machine vision systems such as smart cameras and embedded PCs, which are challenged by the high diversity and fast-paced progress in the field of object detection and pose estimation. We approach this problem in three steps. In the first step, we propose a framework and demonstrate that it is realizable. It has a REST / gRPC interface that allows to handle all detection methods uniformly. A virtualization strategy enables upscaling and easy deployment, and the new OPC UA vision specification is exploited for integration of the detector services into the production environment. In a second step, we examine three exemplary object detection and pose estimation methods and prove that they can be integrated into the framework. This boils down to automatic training from a CAD model and parameterization without expert knowledge, which is possible for two of the three methods. Regarding the third method – a Deep Learning approach – we demonstrate that synthetic images can be generated from the model to enable training, but further measures are required to attain the desired pose accuracy. Finally, in a third step, we characterize the framework to identify its strengths and weaknesses compared to conventional machine vision systems. We perform a scenario-based analysis to determine certain quality attributes and find that both system types have their justification. The proposed service-based framework enables more efficient resource utilization, has a better configurability, maintainability and availability. On the other hand, conventional systems have better timing behavior and do not require such elaborate security measures. Timing, resource utilization and reusability are moreover strongly affected by the chosen detection method. Given a particular application, our characterization helps to identify the most suitable system type. Altogether, in this work we have contributed a novel type of vision system and demonstrated that it is a viable alternative for object detection and pose estimation applications. The framework structure as well as the identified architectural trade-offs can furthermore be generalized to other machine vision or automation tasks. Promising future research directions include facilitating the training of Deep Learning methods, quantifying architectural trade-offs in case studies, and integrating other vision applications to create an ecosystem of vision services.
Der Trend zur Produktion von kleineren Losgrößen und mehr Varianten erfordert flexible und rekonfigurierbare Montagesysteme. Die Objekterkennung und Posenschätzung ist eine Schlüsseltechnologie, um Roboteranwendungen wie Handhabung und Montage in weniger strukturierten Umgebungen zu ermöglichen. Im Rahmen von Industrie 4.0 wird vorgeschlagen, die Integration und Vernetzung solcher Technologien durch Dienste-Plattformen zu fördern. Das Ziel dieser Arbeit ist die Schaffung einer Dienste-Plattform für robuste Objekterkennung und Posenschätzung in der Industrie. Dies wäre eine mögliche Alternative zu traditionellen Bildverarbeitungssystemen wie intelligenten Kameras oder PC-Systemen, die mit der großen Vielfalt und dem schnellen Fortschritt im Bereich Objekterkennung und Posenschätzung zu kämpfen haben. Diese Aufgabe gehen wir in drei Schritten an. Zuerst konzipieren wir eine Dienste-Plattform und zeigen, dass sie umsetzbar ist. Sie hat eine einheitliche REST / gRPC Schnittstelle für alle Objekterkennungsmethoden. Das Virtualisierungskonzept ermöglicht einfache Skalierung und Bereitstellung und die neue OPC UA Vision Spezifikation wird für die Integration in das Produktionsumfeld genutzt. In einem zweiten Schritt zeigen wir die beispielhafte Integration von drei repräsentativen Methoden zur Objekterkennung und Posenschätzung in die Plattform. Dazu müssen die Detektoren auf Basis eines CAD Modells trainiert und ohne Expertenwissen konfiguriert werden können. Für zwei der drei Methoden war dies ohne Weiteres möglich, für die dritte – einen Deep Learning Ansatz – nicht. Wir zeigen hier, wie synthetisch generierte Trainingsbilder genutzt werden können, um das Training dennoch zu ermöglichen. Im dritten Schritt untersuchen wir schließlich die Stärken und Schwächen der vorgeschlagenen Dienste-Plattform im Vergleich zu einem konventionellen System. Die Analyse verschiedenster Szenarien ergibt, dass beide Systeme ihre Berechtigung haben. Zu den Vorteilen der Plattform gehören effizientere Ressourcennutzung sowie bessere Konfigurierbarkeit, Wartbarkeit und Verfügbarkeit. Konventionelle Systeme punkten mit ihrem Zeitverhalten und bergen weniger Sicherheitsrisiken. Zeitverhalten, Ressourcennutzung und Wiederverwendbarkeit sind jedoch auch stark von der gewählten Detektionsmethode abhängig. Unsere Charakterisierung hilft, um für eine spezifische Anwendung den geeignetsten Systemtyp auszuwählen. In dieser Arbeit haben wir einen neuen Typ Bildverarbeitungssystem vorgeschlagen und gezeigt, dass er eine lohnende Alternative für Objekterkennungs- und Posenschätzungsanwendungen sein kann. Die Struktur der Plattform sowie Erkenntnisse zu architektonischen Abwägungen können auch auf andere Bildverarbeitungsanwendungen übertragen werden. Zukünftige Forschungsarbeiten könnten sich auf eine Vereinfachung des Trainings von Deep Learning Methoden, die Quantifizierung der architektonischen Abwägungen in Fallstudien, oder die Integration anderer Bildverarbeitungsaufgaben konzentrieren.
URI: https://depositonce.tu-berlin.de/handle/11303/12459
http://dx.doi.org/10.14279/depositonce-11302
Exam Date: 23-Oct-2020
Issue Date: 2021
Date Available: 5-Mar-2021
DDC Class: 004 Datenverarbeitung; Informatik
620 Ingenieurwissenschaften und zugeordnete Tätigkeiten
670 Industrielle Fertigung
Subject(s): computer vision
object detection
Industry 4.0
cloud computing
Bildverarbeitung
Objekterkennung
Industrie 4.0
License: https://creativecommons.org/licenses/by/4.0/
Appears in Collections:FG Industrielle Automatisierungstechnik » Publications

Files in This Item:
rudorfer_martin.pdf
Format: Adobe PDF | Size: 7.16 MB
DownloadShow Preview
Thumbnail

Item Export Bar

This item is licensed under a Creative Commons License Creative Commons