Loading…
Thumbnail Image

Computer vision and computer algebra

Wagner, André

In Multiview-Geometrie, einem Teilgebiet der Computer-Vision, werden Bilder mit Kameras von 3D-Objekten aus verschiedenen Perspektiven aufgenommen. Diese Arbeit studiert Multiview-Geometrie mit Methoden aus der Computer-Algebra. Hauptprobleme des Maschinellen Sehens sind die Objektrekonstruktion und die Bestimmung der Kameraparameter. In diesen beiden fundamentalen Fragestellungen erzielen wir neue Erkenntnisse unter der Voraussetzung, dass zusätzliche Informationen über die ursprünglichen dreidimensionalen Objekte zur Verfügung stehen. In Multiview-Geometrie beschreibt die Multiview-Varietät die Beziehungen der Bildpunkte in verschiedenen Bildern. Wir entwickeln zwei Verallgemeinerungen der Multiview-Varietät, die Rigid Multiview-Varietät und die Unlabeled Multiview-Varietät. Beide Varietäten sind durch konkrete Anwendungsbeispiele im Maschinellen Sehen motiviert. Sie können benutzt werden, um Qualität und Geschwindigkeit der Identifikation von Markern auf 3D-Objekten zu verbessern. Die Rigid Multiview-Varietät wird mengentheoretisch beschrieben und ein Triangulierungs-Algorithmus für die Unlabeled Multiview-Varietät konzipiert. Der 8-Punkt Algorithmus ist einer der wichtigsten Algorithmen in Multiview-Geometrie und einer der meist genutzten Algorithmen, um die Fundamentalmatrix zu bestimmen. Es ist bekannt, dass er bei Bildern vom Einheitswürfel unabhängig von der Lage der Kameras scheitert. Wir erweitern diese Aussage auf Bilder von allgemeinen kombinatorischen Würfeln. Für diesen Fall beschreiben wir einen neuen Algorithmus, der die Qualität der Rekonstruktion der Fundamentalmatrix im Vergleich zum 7- und 8-Punkt Algorithmus drastisch verbessert. Abschließend bestimmen wir Teilschnitte der primären Zerlegung der mengentheoretischen Gleichungen der Veronese-Varietät. Da die Veronese-Varietät ein Binomial-Ideal ist, können wir diese wir mit Hilfe von Kombinatorik beschreiben.
In multiview geometry, a field of computer vision, images of a three-dimensional scene are taken by several cameras from various perspectives. We dedicate ourselves to studying multiview geometry by means of computer algebra. Three-dimensional scene and camera parameter reconstruction is at the core of computer vision. This thesis obtains novel results about these two fundamental topics in certain cases if additional information about the original three-dimensional scene is available. The multiview variety encodes the space of three-dimensional points seen through various views. We extend the knowledge about the multiview variety to two generalizations of it, the rigid multiview variety and the unlabeled multiview variety. These two varieties are inspired by specific applications in computer vision. They can be used to improve and speed-up the identification of unlabeled marker configurations. We give a set-theoretical description of the rigid multiview variety and design a triangulation algorithm for the unlabeled multiview variety. The 8-point algorithm is one of the most important algorithms in multiview geometry, and the most commonly used algorithm for fundamental matrix estimation. It is known that the unit cube defeats the 8-point algorithm. We extend this result to all combinatorial cubes. Two perspective projections of a combinatorial cube defeat the 8-point algorithm independent of the position of the cameras. In this case we describe a new algorithm that drastically improves the quality of reconstruction of the fundamental matrix compared to the 7- and 8-point algorithm. Finally we determine subintersections with omitted single intersectands of the primary decomposition of the set-theoretic equations of the Veronese variety. As the Veronese variety is an binomial ideal, these can actually be described by combinatorial means.