Loading…
Thumbnail Image

Mid-Level Content-Based Video Coding using Texture Analysis and Synthesis

Ndjiki-Nya, Patrick

In der vorliegenden Dissertation wird ein automatisches, inhaltsbasiertes Verfahren zur verbesserten H.264/MPEG4-AVC Videocodierung vorgestellt. Die Konsistenz des decodierten Videosignals wird durch einen geschlossenen Analyse-Synthese-Kreislauf mit integriertem Maß zur objektiven Erfassung der subjektiven Qualität sichergestellt. Die grundlegende Annahme des vorgeschlagenen Ansatzes liegt darin, dass Videotexturen sich in subjektiv relevant und subjektiv irrelevant aufteilen lassen. Letztere Texturklasse wird durch kompakte Metadaten beschrieben, die dem Decoder, bei niedriger Bitrate, als Seiteninformation übertragen werden, wo sie zur Texturrekonstruktion eingesetzt werden. Subjektiv relevante Texturen werden H.264/MPEG4-AVC codiert. Die Erkennung subjektiv irrelevanter Texturen erfolgt implizit durch Rate-Distortion-Entscheidung. Dadurch wird eine explizite Klassifikation der Videotexturen in die oben erwähnten Klassen vermieden. Die durchgeführten Experimente zeigen, dass der vorgeschlagene Algorithmus, im Vergleich zu einem standardkonformen H.264/MPEG4-AVC Videocodec, zu Bitratenersparnissen von bis zu 41% bei gleicher visueller Qualität führt.
An automatic, content-based approach for improved H.264/MPEG4-AVC video coding is presented in this thesis. Consistent quality of the decoded video signal is ensured by operating closed-loop analysis-synthesis with incorporated objective measurement of subjective quality. The fundamental hypothesis of the proposed approach is that textures in a video sequence can be classified into two classes: Perceptually relevant and perceptually irrelevant textures. Only the latter textures are described at reduced bit rate via meta data that are transmitted as side information to the decoder, where they are used for texture regeneration. Perceptually relevant textures are H.264/MPEG4-AVC coded. Target texture detection is done implicitly via the implemented rate-distortion decision module. That is, no explicit classification of textures into the above-mentioned classes is conducted. The experiments show that the proposed algorithm yields bit rate savings of up to 41% compared to a standard conforming H.264/MPEG4-AVC video codec at the same visual quality.