mediengestalter.info
FAQ :: Mitgliederliste :: MGi Team

Willkommen auf dem Portal für Mediengestalter

Aktuelles Datum und Uhrzeit: Di 16.04.2024 14:20 Benutzername: Passwort: Auto-Login

Thema: Diskrete Kosinustransformation Basismuster & Werte vom 26.11.2014


Neues Thema eröffnen   Neue Antwort erstellen MGi Foren-Übersicht -> Allgemeines - Bild und Ton -> Diskrete Kosinustransformation Basismuster & Werte
Autor Nachricht
Phaily
Threadersteller

Dabei seit: 26.11.2014
Ort: -
Alter: -
Geschlecht: -
Verfasst Mi 26.11.2014 19:32
Titel

Diskrete Kosinustransformation Basismuster & Werte

Antworten mit Zitat Zum Seitenanfang

Hallo,

und zwar habe ich ein Verständnisproblem bei den Werten, die nach der DCT rauskommen.
Ganz links oben : Fq[0][0] ist ja der DC-Anteil des 8x8 Blockes.Die anderen Werte sind die AC-Anteile.

Was sagt jetzt aber z.B die Zahl 3 aus ? Dass das Muster an der Stelle (0/2) insgesamt 3 mal in dem 8x8 Block überlagert vorkommt ?

Was passiert bei dem Wert - 8 (Fq[0][2]) ? Wird da das Muster insgesamt 8 mal abgezogen ?





Wäre für jeden Tipp sehr dankbar!
  View user's profile Private Nachricht senden
M_a_x

Dabei seit: 28.02.2005
Ort: -
Alter: -
Geschlecht: Männlich
Verfasst Sa 29.11.2014 16:57
Titel

Antworten mit Zitat Zum Seitenanfang

Phaily hat geschrieben:
Hallo,

und zwar habe ich ein Verständnisproblem bei den Werten, die nach der DCT rauskommen.
Ganz links oben : Fq[0][0] ist ja der DC-Anteil des 8x8 Blockes.Die anderen Werte sind die AC-Anteile.

Was sagt jetzt aber z.B die Zahl 3 aus ? Dass das Muster an der Stelle (0/2) insgesamt 3 mal in dem 8x8 Block überlagert vorkommt ?

Was passiert bei dem Wert - 8 (Fq[0][2]) ? Wird da das Muster insgesamt 8 mal abgezogen ?





Wäre für jeden Tipp sehr dankbar!


Da hast Du Dir für den Einstieg hier ja das leichteste Thema ausgesucht *zwinker*

Vielleicht mal kurz zum Grundverständnis, was die diskrete Cosinus Transformation hier eigentlich macht:
Der Helligkeits- und Farbverlauf kann durch eine gewichtete Summe von Cosinus Funktionen dargestellt werden. (Den Trick hat der olle Fourier mit der Fouriertransformation im Prinzip schon vor Jahrhunderten gefunden).

Dabei wird das ganze Bild auf Anteile von Cosinusfunktionen verschiedener Frequenzen untersucht.
Warum macht man das im JPEG? Man geht davon aus, dass das menschliche Auge für höhere Frequenzen im Bild unempfindlicher ist und man sie deshalb „rausbügeln“ kann.
(Daß das nicht immer gut funktioniert, sieht man, wenn man sich feine Schriften in einer JPG-Datei anschaut, die Mediengestaler werden sich jetzt schütteln weil sowas Bäääh ist)

Die DCT selbst ist übrigens nicht verlustbehaftet, der Trick zur Kompression ist die Quantisierung der originalen Koeffizienten, bei dem (hohe) Frequenzen, die im Originalbild vorhanden waren Null gesetzt werden und bei der Rücktransformation ein „weichgezeichnetes“ Bild rekonstruiert wird.

Deine Matrix oben ist so eine quantisierte Matrix, sie enthält wesentlich mehr Nullen als die Originalmatrix (zu sehen im Wiki-Artikel, aus dem Du Deine Bilder genommen hast) und lässt wegen der vielen Nullen eine bessere Kompressionsrate durch z.B.: Lauflängencodierung zu.
Da jetzt aber im Vergleich zum Original Frequenzen fehlen ist das Ganze jetzt verlustbehaftet.

Phaily hat geschrieben:


...
Was sagt jetzt aber z.B die Zahl 3 aus ? Dass das Muster an der Stelle (0/2) insgesamt 3 mal in dem 8x8 Block überlagert vorkommt ?

Du hast die Indizes verwechselt, die 3 steht an Position 1/0, die -8 bei 0/1.
Ich tue jetzt einfach mal so, als wenn die 3 an Position 2/0 und die -8 an Pos 0/2 steht, für die Erklärung spielt das nur eine untergeeortnete Rolle.

Bei 8 Pixeln horizontal und vertikal kommen 8 Basis Cosinusfunktionen ansteigender Frequenz zum Einsatz.
Von links nach rechts und von oben nach unten in der Matrix erhöht sich die Wellenzahl m bzw. n (m für für die horizontale Frequenz, n für die vertikale Frequenz) von Null (konstanter Anteil) bis m bzw. n=7 ( Frequenz=3,5).
Die Zahl 3 an Position 2/0 gibt also den Beitrag der horizontalem Cosinuswelle mit Wellenzahl 2 (eine Schwingungsperiode) an.
Die Zahl -8 an Position 0/2 bedeutet einen negativen Beitrag der vertikalen Cosinuswelle mit Frequenz 1 (Wellenzahl m=2 entspricht einer Schwingungsperiode),

Alle Nullen in der Matrix bedeuten, daß die entsprechenden Cosinuswellen nicht rekonstruiert werden. Wie Du siehst, stehen die Nullen an Stellen für hohe Frequenzen, z.B. ganz unten rechts Pos 8/8 mit horizontater und vertikaler Frequenz 3,5. Details mit diesen Frequenzen werden also
weggebügelt.

Die Werte (Anteile der entsprechende Cos Funtionen) einer solchen Matrix hängen natürlich von den konkreten Bilddaten ab.

Ich hoffe, ich konnte zur Verwirrung beitragen *zwinker*, wenn Du Fragen hast: her damit.


Zuletzt bearbeitet von Nimroy am Mo 01.12.2014 10:56, insgesamt 3-mal bearbeitet
  View user's profile Private Nachricht senden
Anzeige
Anzeige
 
Ähnliche Themen MBit/s Werte bei Videodateien und eine Frage zu Avid Liquid
Neues Thema eröffnen   Neue Antwort erstellen
MGi Foren-Übersicht -> Allgemeines - Bild und Ton


Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst an Umfragen in diesem Forum nicht mitmachen.