Loading…
Thumbnail Image

Steered mixture-of-experts for image and light field representation, processing, and coding

Verhack, Ruben

FG Nachrichtenübertragung

Virtual reality for camera-recorded scenes is fundamentally different from the VR experience of, for example, computer games. The problem is much more challenging due to the scene's lack of geometric knowledge. Currently, 360-degree video is the primary form of immersive experience of camera-recorded images (CC-VR), but it is not yet sufficient for a full VR experience. More specifically, viewers can only look around, but the location of their head is fixed. As such, there is a great interest in overcoming these limitations, thus giving the viewer the ability to navigate between objects in a large complex space and even walk through doors. This thesis proposes a new universal method for displaying and encoding a wide range of image modalities designed in a future-proof manner to enable CC-VR in the future. First, a theoretical explanation is given about requirements for such experiences and the shortcomings of the current paradigms. The new representation is then illustrated for lower-dimensional images (eg images) and further applied to more immersive image modalities (eg 360 ° images and light fields). Finally, an encoding method is presented to efficiently store, transmit and broadcast such images.
Die virtuelle Realität für mit der Kamera aufgenommene Szenen unterscheidet sich grundlegend von der VR-Erfahrung von beispielsweise Computerspielen. Das Problem ist aufgrund des Mangels an geometrischem Wissen in der Szene viel schwieriger. Derzeit ist 360-Grad-Video die primäre Form des immersiven Erlebens von mit Kamera aufgenommenen Bildern (CC-VR), reicht jedoch noch nicht für ein vollständiges VR-Erlebnis aus. Betrachter können sich nämlich nur umschauen, aber die Position ihres Kopfes ist festgelegt. Daher besteht ein großes Interesse daran, diese Einschränkungen zu überwinden, sodass der Betrachter in einem großen komplexen Raum zwischen Objekten navigieren und sogar durch Türen gehen kann. Diese Arbeit schlägt eine neue universelle Methode zur Anzeige und Codierung einer Vielzahl von Bildmodalitäten vor, die zukunftssicher gestaltet sind, um CC-VR in Zukunft zu ermöglichen. Zunächst wird eine theoretische Erklärung zu den Anforderungen an solche Erfahrungen und den Mängeln der aktuellen Paradigmen gegeben. Die neue Darstellung wird dann für Bilder mit niedrigeren Dimensionen (z. B. Bilder) dargestellt und weiter auf immersivere Bildmodalitäten (z. B. 360 ° -Bilder und Lichtfelder) angewendet. Schließlich wird ein Codierungsverfahren vorgestellt, um solche Bilder effizient zu speichern, zu übertragen und zu senden.