Thumbnail Image

The framework of α-molecules

theory and applications

Schäfer, Martin

The theory of wavelets constitutes an integral part of modern harmonic analysis with many theoretical and practical applications. In engineering for example, wavelets are nowadays a popular tool for the efficient representation and approximation of functions. Much of their success thereby relies on the fact that they are more suited to represent smooth signals with singularities than traditional Fourier systems. In fact, for smooth signals with point singularities wavelet systems perform quasi-optimally with respect to sparse approximation purposes. This makes them particularly useful for the approximation of 1-dimensional data. When approximating multivariate data, however, wavelets only show a suboptimal performance if anisotropic features are involved. The reason for this is that wavelets are inherently isotropic objects and thus not optimally suited for this task. Since in practice such anisotropic structures are very common, think of images with edges for example, over the recent years much effort has been invested to deal with this shortcoming. In particular, this led to the invention of various novel so-called directional representation systems, some of the most well-known of which are ridgelets, curvelets, and shearlets, to name just a few. Such directional systems can conveniently be categorized according to the type of scaling involved in their construction. Wavelets for example are isotropically scaled, the scaling of ridgelets is purely directional, and the construction of the classic curvelets and shearlets is based on parabolic scaling. A great variety of different scalings is covered by the concept of α-scaling, where a parameter α ∈ [0,1] is used to interpolate between the isotropic case and the purely directional case. The former systems, for example, are special instances of α-scaled systems corresponding to the parameters α=1, α=0, and α=1/2. The main endeavour of this thesis is to develop a common framework for such α-scaled representation systems. The basic notion are so-called α-molecules which generalize the earlier concept of parabolic molecules. Those were introduced to enable a unified treatment of parabolically scaled systems. By definition, they are obtained via parabolic dilations, rotations, and translations from a set of generating functions, whereby the generators are allowed to vary as long as they obey a certain time-frequency localization. This concept of variable generators explains the terminology ‘molecules’. Together with the utilization of so-called parametrizations to enable generic indexing, it provides the flexibility to cast different parabolically scaled systems as instances of one unifying construction principle. Indeed, the framework of parabolic molecules is general enough to unite rotation-based and shear-based constructions such as the classic curvelets and the classic shearlets under one common roof. Recently, this framework has been further generalized to also include continuous systems. The limitation to parabolic scaling however still excludes systems like ridgelets and wavelets, as well as hybrid constructions such as α-curvelets and α-shearlets. This is the motivation behind the generalization to α-molecules. Like parabolic molecules, systems of α-molecules consist of dilated, rotated, and translated versions of a set of generators which are merely required to fulfill a common time-frequency localization. However, instead of parabolic scaling, more general α-scaling is used. Due to this construction, each α-molecule is associated with a certain scale, a certain location, and a certain orientation, and thus determines a point in the parameter space, which is defined as the space comprising all possible triples of such parameters. A central building block of the theory of α-molecules is the observation that this parameter space can be equipped with a notion of distance such that a high distance between indices corresponds to a low cross-correlation of the respective α-molecules. This so-called index distance even induces a quasi-metric structure on the parameter space. Based on this distance, it can be proven that two systems of α-molecules are almost orthogonal, provided that certain consistency and time-frequency localization conditions are satisfied. This, in turn, leads to another central result of the theory, the so-called transfer principle, which states that any two frames of α-molecules, which are consistent in a certain sense and have sufficiently high order, exhibit the same approximation behavior. It enables the transfer of approximation results within the framework and thus provides a systematic way to prove results on sparse approximation for certain model data. Thereby, also the frame property of the systems comes into play, wherefore we prove a Daubechies-type frame criterion for α-molecules generalizing earlier criteria for shearlets and wavelets. As an application of the transfer principle, we explore the approximation performance of α-scaled representation systems with respect to cartoon-like data. More concretely, as data classes we consider C^β-cartoons which are C^β-smooth functions apart from C^β-discontinuity curves. It is known that the best N-term approximation rate achievable for such classes is of order N^{−β}. It is further known that for C^2-cartoons parabolically scaled systems such as the classic curvelets and shearlets achieve a quasi-optimal rate of order N^{−2}. In this thesis, we extend this result to more general α-scaled systems. For this, we first analyze the approximation properties of a prototypical anchor system, where we choose a discrete Parseval frame of α-curvelets. As a negative result, we will find that a cartoon approximation rate exceeding N^{−1/(1−α)} is not possible with this system. The maximal rate obtainable by simply thresholding the curvelet coefficients is even limited to N^{−1/ max{α,1−α}}. Consequently, an optimal approximation of C^β-cartoons cannot be achieved if β>2. On the positive side, however, we will see that in the range β ∈ (1,2] and for the choice α=β−1, which in particular includes the parabolic case, the anchor frame of α-curvelets indeed provides quasi-optimal approximation with a rate of order N^{−β}. Via the transfer principle, we finally conclude that these findings for α-curvelets apply to a larger class of α-molecule frames. As another application of the concept of α-molecules, we use it in the theory of function spaces for a unified treatment of curvelet and shearlet smoothness spaces. To this end, we introduce a continuous α-molecule transform and associated Besov-type coorbit spaces corresponding to certain mixed-norm Lebesgue spaces on the transform domain. A main result, which can be interpreted as another manifestation of the transfer principle, shows that these α-molecule coorbit spaces coincide if the order of the α-molecules is sufficiently high. Moreover, the abstract machinery of coorbit theory yields discrete characterizations which allow to identify them with known scales of curvelet and shearlet smoothness spaces. At the end of the thesis, we turn to an extension of the theory to higher dimensions. Thereby we focus on some main aspects, in particular the index distance and the transfer principle are generalized. As an application of the extension, we investigate the approximation of video data, which can be modelled as 3D-cartoon-like functions.
Waveletsysteme sind heutzutage ein integraler Bestandteil der harmonischen Analysis und dienen zum Beispiel als effizientes Werkzeug zur Darstellung und Approximation von Signalen. Ihr großer Erfolg beruht dabei unter anderem auf der Fähigkeit, glatte Signale mit lokalen Singularitäten besser zu approximieren als es traditionelle Fouriersysteme können. Bei isotropen Daten, welche insbesondere univariate Signale miteinschließen, ist ihre Performanz bei entsprechender Regularität sogar quasi-optimal. Für die Approximation multivariater Daten hingegen sind Wavelets im allgemeinen nicht optimal geeignet. Der Grund hierfür liegt in ihrer isotropen Skalierung, die keine optimale Auflösung anisotroper Strukturen erlaubt. Da solche Strukturen für multivariate Daten jedoch sehr typisch sind – man denke nur an Kanten in Bilddaten zum Beispiel – sind in den letzten Jahren viele Anstrengungen unternommen worden, um diese Unzulänglichkeit zu überwinden. Insbesondere wurden viele neuartige sogenannte direktionale Repräsentationssysteme eingeführt, von denen wir als einige der bekanntesten Ridgelets, Curvelets und Shearlets nennen wollen. Solche direktionalen Systeme lassen sich anhand der ihnen zugrundeliegenden Skalierung kategorisieren. Wavelets zum Beispiel sind isotroper Natur, eine rein direktionale Skalierung findet bei Ridgelets Verwendung, die Konstruktion klassischer Curvelets und Shearlets basiert auf einer parabolischen Skalierung. Eine Vielzahl unterschiedlicher Skalierungstypen wird durch das Konzept der α-Skalierung abgedeckt, wo mit Hilfe eines Parameters α ∈ [0,1] zwischen dem isotropen und dem direktionalen Fall interpoliert wird. Die vorgenannten Systeme zum Beispiel sind α-skaliert mit zugehörigen Parametern α=1, α=0 und α=1/2. Das Hauptziel dieser Dissertation besteht darin, eine einheitliche Theorie für derartige α-skalierte Repräsentationssysteme zu entwickeln. Den grundlegenden Begriff bilden dabei sogenannte α-Moleküle, die eine Weiterentwicklung des Konzepts der parabolischen Moleküle darstellen. Letztere wurden eingeführt, um eine simultane Behandlung parabolisch skalierter Systeme zu ermöglichen. Per Definition entstehen sie durch parabolische Skalierung sowie durch Rotation und Translation aus einer Menge generierender Funktionen, für die lediglich eine gemeinsame Zeit-Frequenz-Lokalisierung gefordert wird. Die Bezeichnung „Molekül“ rührt dabei von der möglichen Variabilität der Generatoren her. Zusammen mit der Verwendung sogenannter Parametrisierungen, welche eine generische Indizierung ermöglichen, bringt diese die nötige Flexibilität in die Konstruktion, um verschiedenartige parabolisch skalierte Systeme einheitlich zu beschreiben. Tatsächlich ist das Konzept allgemein genug, um sowohl rotations-basierte als auch scherungs-basierte Systeme wie die klassischen Curvelets und die klassischen Shearlets zu umfassen. Nach dem Vorbild parabolischer Molekülsysteme werden auch α-Molekülsysteme mittels Dilatation, Rotation und Translation aus einer zugrundeliegenden Generatormenge erzeugt, wobei die Generatoren wieder einer gemeinsamen Zeit-Frequenz-Lokalisierung unterliegen müssen. Statt einer parabolischen Skalierung wird jedoch eine allgemeinere α-Skalierung verwendet. Aufgrund dieses Konstruktionsprinzips ist jedem α-Molekül eine bestimmte Skalierung, eine bestimmte Orientierung und ein bestimmter Ort zugeordnet, und damit ein Punkt im sogenannten Parameterraum, welcher per Definition alle möglichen Tripel solcher Parameter umfasst. Ein zentraler Baustein der Theorie der α-Moleküle ist die Tatsache, dass dieser Parameterraum mit einem Distanzbegriff ausgestattet werden kann, so dass ein großer Abstand zwischen den Parametern einer kleinen Kreuzkorrelation entsprechender α-Moleküle entspricht. Wie wir zeigen können, induziert diese auch Indexabstand genannte Distanz sogar eine quasi-metrische Struktur auf dem Parameterraum. Auf ihrer Grundlage kann bewiesen werden, dass α-Molekülsysteme fast orthogonal zueinander stehen, wenn gewisse Konsistenzbedingungen erfüllt sind. Dieses Resultat wiederum führt zu einem anderen Stützpfeiler der Theorie, dem sogenannten Transferprinzip, das besagt, dass α-Molekülframes ein gleichartiges Approximationsverhalten haben, falls ihre Ordnung genügend groß ist und gewisse Konsistenzbedingungen erfüllt sind. Damit wird ein Transfer von Approximationsresultaten innerhalb des Framework ermöglicht und damit eine systematische Untersuchung sparser Approximationseigenschaften von α-Molekülen. Da dabei auch die Frameeigenschaft der Systeme eine Rolle spielt, beweisen wir zudem ein Daubechies-artiges Framekriterium, das frühere Kriterien für Shearlets und Wavelets verallgemeinert. Als Anwendung des Transferprinzips interessieren wir uns für das Approximationsverhalten von α-skalierten Systemen im Falle cartoon-artiger Daten. Als konkretes Datenmodell verwenden wir dabei C^β-Cartoons, also Funktionen welche mit Ausnahme von C^β-Unstetigkeitskurven C^β-glatt sind. Es ist bekannt, dass für solche Daten die maximal erreichbare N-Term Approximationsrate von der Ordnung N^{−β} ist. Desweiteren ist bekannt, dass C^2-Cartoons von parabolisch skalierten Systemen, wie zum Beispiel den klassischen Curvelets und Shearlets, mit einer Rate der Ordnung N^{−2} quasi-optimal approximiert werden können. Dieses Resultat wird in dieser Arbeit auf allgemeinere α-skalierte Systeme erweitert. Dafür untersuchen wir zuerst einen Parsevalframe aus α-Curvelets, der als prototypisches Referenzsystem fungiert. Als negatives Resultat zeigen wir, dass eine Cartoonapproximationsrate besser als N^{−1/(1−α)} von diesem System nicht erreicht werden kann. Die durch einfaches Thresholding der Curveletkoeffizienten erreichbare Rate ist sogar durch N^{−1/ max{α,1−α}} begrenzt. Mit α-Curvelets ist eine optimale Approximation von C^β-Cartoons also nicht möglich, wenn β>2 gilt. Demgegenüber steht das positive Resultat, dass für die Wahl α=β−1 im Bereich β ∈ (1,2] quasi-optimale Approximation mit einer Rate der Ordnung N^{−β} von α-Curvelets erreicht wird. Über das Transferprinzip können wir schließlich schlussfolgern, dass diese für α-Curvelets erzielten Ergebnisse auch für eine größere Klasse von α-Molekülframes Gültigkeit besitzen. Als weitere Anwendung verwenden wir das Konzept der α-Moleküle in der Theorie der Funktionenräume, wo es eine einheitliche Behandlung von Curvelet- und Shearleträumen ermöglicht. Dazu führen wir mit Hilfe einer kontinuierlichen α-Molekültransformation Besov-artige Coorbiträume ein, die von gewissen gemischt-normierten Lebesgueräumen auf dem Transformationsbereich erzeugt werden. Ein Hauptresultat, das als eine kontinuierliche Variante des Transferprinzips gedeutet werden kann, zeigt, dass diese Coorbiträume übereinstimmen, falls die Molekülordnung ausreichend hoch ist. Aus allgemeinen Prinzipien der Coorbittheorie erhalten wir zudem diskrete Charakterisierungen für diese Räume. Insbesondere können wir sie so mit bereits bekannten Curvelet- und Shearleträumen identifizieren. Am Ende der Arbeit wenden wir uns noch einer Erweiterung der Theorie auf höhere Dimensionen zu. Dabei beschränken wir uns auf einige ausgewählte Aspekte, insbesondere werden die Definition der Indexdistanz und das Transferprinzip verallgemeinert. Als Anwendung untersuchen wir die Approximation von Video-Daten, welche als 3D-cartoon-artige Funktionen modelliert werden können.