Von Lukas Danke und Jessica Becker


Übung 1 – MTA


Aufgabe 1









Angaben bei Ausführung von wave_io:


(Sprachaufnahme) | (Musikstück)

Filelength: 885844 | Filelength: 7996502

Samples: 442368 | Samples: 3997696

Rate: 22050 | Rate: 44100

Bits: 16 | Bits: 16

Bytes per Sample: 2 | Bytes per Sample: 4

Channels: 1 | Channels: 2



Die Abtastfrequenz bei der Musikdatei, sollte 44,1kHz betragen, da dies auch der Optimalwert für alle Musikstücke ist. ist.


Filelength – Größe der Datei

Samples – Anzahl der Samples

Rate - Abtastfrequenz

Bits -

Bytes per Sample – Größe der Bytes von jedem Sample

Channels – Anzahl der Kanäle(mono – 1, stereo – 2 )

















Aufgabe 2



Der Markierte Bereich beschreibt den Verlauf von 1,5 Perioden. Diese werden innerhalb von 8 Samples durchlaufen. Daraus folgt:



Bei sine_hi ist es fast die gleiche Rechnung, nur dass für die eingekreisten 1,5 Perioden nur 4 Samples gebraucht werden:




















Ein Blick in die Darstellung von GRAM zeigt exakt das gleiche Ergebnis:






Das Abtasttheorem


Das Abtasttheorem besagt, dass ein aufbandbegrenztes Signal mit einer Frequenz von mindestensabgetastet werden muss, damit man es wieder exakt rekonstruieren kann.

Dies geschieht mithilfe der Tiefpass-Filterung, die Frequenzteile hinter abschneidet, und damit ein Stören dieser nach der Rekonstruktion verhindert.




Diese Filterung benutzen auch Soundkarten.



Dieses Programm ist für das Downsampling verantwortlich. Am Ende wird auch der Header angepasst, da man die Hälfte der Werte danach nicht mehr braucht.




Beim sine_hi ist die Frequenz nun statt 6000 Hz nur noch 2000 Hz. Dies liegt daran, dass das Abtasttheorem verletzt wurde. Um das Theorem nicht zu verletzen, müssen die Frequenz betragen. Da dies bei sine_hi verletzt wird,ändert sich die Frequenz:

Beim sine_lo verändert sich nichts, da die 3000Hz unter 4000Hz liegen und damit das Abtasttheorem nicht verletzt wird.


Die Veränderung ist auch eindeutig hörbar:

sine_lo davor:



sine_lo danach:




sine_hi davor:


sine_hi danach:





Aufgabe 3


16 Bit ergibt , das ergibt Amplitudenwerte zwischen +32767 und -32768.

8 Bit ergibt , das ergibt Amplitudenwerte zwischen +127 und -128.



Hier ist das in 3.2 zu erstellende Programm: Je nachdem, wie viele Bit wir reduzieren wollen, ergibt sich die anzugebende Zahl(hier: 8192 = 13 Bit reduziert, 3 übrig).


Nun haben wir unser Musikstück und die Sprachaufnahme mithilfe dieses Programmes immer wieder modifiziert:


Sprachaufnahme:



Original: 10 Bit: 8 Bit: 6 Bit: 4 Bit: 2 Bit:



Bei 6 Bit Reduzierung (=10Bit verbleibend) ist schon ein leichtes Rauschen wahrnehmbar, allerdings ist das Sprechen immer noch sehr verständlich. Auch in GRAM ist noch kein großer Unterschied zu erkennen.




Bei 8 Bit Reduzierung wird erstmals auch das Sprechen leicht gestört. Man kann einige Störungen schon wahrnehmen, allerdings ist es immer noch gut verständlich. Man erkennt, dass die vereinzelten oberen Frequenzen fast komplett verschwunden sind. Im Hauptteil ist allerdings weiterhin keine große Veränderung vorhanden.



Bei 6 Bit wird die Aufnahme dann teilweise unverständlich. Sie wirkt wie durch ein Rauschen und Knistern abgehackt. Auch in GRAM sind erste stärkere Veränderungen zu erkennen. So sind am unteren Rand die Farben nicht mehr ganz so rot wie noch im Original sondern mehr blau. Dies betrifft auch andere rötliche bzw. orange Stellen im Graphen. Außerdem sind oberhalb der Hauptwerte wieder kleinere dünne Werte aufgetaucht, welche für das Rauschen und Knistern sorgen.



Bei 5 Bit ergibt sich ein ähnliches Bild, nur das noch mehr Töne nicht mehr vorhanden sind. Bei 4 Bit sind nur noch kleine Ausschnitte zu hören. Dies spiegelt sich auch in Gram wieder.



So sind nur noch vereinzelnde Striche vorhanden, die dann auch noch durch Störgeräusche verzerrt werden. Bei 2 Bit ist dann nichts mehr zu hören und auch in GRAM ist kein Wert mehr gefunden worden.

Musikstück: (Alle Stücke werden am Ende des Dokumentes aufgezählt)






Dieses Musikstück ist am Anfang sehr ruhig und nur instrumental, und wird am Ende immer lauter mit Stimmeinsatz.


Bei 10 Bit ist noch keine Veränderung hörbar, selbst ein Rauschen ist nicht wahrzunehmen.




Dies tritt erst bei 8 Bit das erste Mal ein, die Melodie ist ist trotzdem immer noch sehr gut zu hören

Auch in GRAM ist keine große Veränderung zu erkennen.

Bei 6 Bit ist erstmals eine Veränderung im Klang des Liedes zu hören. Die Töne wirken vor allem im leisen Anfang anders, im lauteren Schlussteil ist die Veränderung nicht so groß. In GRAM ist gut zu erkennen, dass zu Beginn Lücken entstanden sind. Im Endteil des Liedes ist das Rauschen sehr gut durch die vielen blauen Punkte oberhalb des normale Graphen erkennbar. Dies tritt vereinzelt auch schon am Anfang auf.





Bei 4 Bit sind die Aussetzer in der Melodie am Anfang sehr groß. Am Ende des Liedes ist das Rauschen außerdem viel stärker geworden, allerdings ist die Grundmelodie auch am Anfang immer noch herauszuhören. Auch in GRAM ist das zu bemerken. Man kann sehr gut erkennen, dass sich das Rauschen schon mit der Melodie gemischt hat. Vor allem die fast vollen Streifen von oben nach unten zeigen dies. Außerdem sieht man am Anfang, dass ein großer Teil der leisen Melodie auf dem linken Ausgang schon verschwunden ist. Erste Lücken sind am Ende ebenfalls erkennbar.




Bei 3 Bit ist die Musik am Anfang komplett verschwunden. Nur die Trommeln geben noch ein Knacken ab. Um so lauter das Lied wird, umso mehr Knacken ist noch zu hören. Beim Stimmeinsatz des Chors ist dann sogar noch die gesamte Melodie zu erkennen. Dort wo die Stimmen Pause machen, sind auch große Lücken. Dies ist in GRAM deutlich erkennbar, die großen roten Felder am unteren Rand zeigen das die Melodie noch erkennbar ist.


Bei 2 Bit ist keine Musik mehr erkennbar, und es sind nur noch vereinzelte Knacklaute der Trommel zu hören. Die Melodie am Ende ist nun auch nur noch ein Knacken und Rauschen und nicht mehr identifizierbar. Bei 1 Bit ist dann alles verschwunden.








Dies ist der Code für den letzten Teil der Aufgabe, dem Quantisierungsrauschen:


n steht hier für die Anzahl der reduzierten Bits. Das Rauschen wird in dem Programm verstärkt, damit man es wahrnehmen kann.

Hierfür haben wir das Musikstück modifiziert. Bei einer Reduzierung um 1 Bit ist bei der Musik keine Veränderung wahrnehmbar. Erst bei 3 Bit-Reduzierung ist ein erstes Rauschen klar hörbar und auch in GRAM zu sehen.




Der Unterschied zum Original ist eindeutig erkennbar.

Bei 6-Bit-Reduzierung ist das Rauschen nun sehr störend. In Gram ist es nicht mehr zu erkennen, was Melodie und was Rauschen ist. Es bleibt nur noch ein riesiger Block.




Ab 8 Bit ist kaum mehr ein Unterschied zu erkennen, das Rauschen und Knister wird nur noch sehr wenig schlimmer und lauter wird das Lied auch nicht mehr. Allerdings ist die Melodie auch bei 15-Bit-Reduzierung immer noch gut hörbar.
























Musikstücke:


Für Programm 3:


Original: 10 Bit: 8 Bit: 6 Bit:




4 Bit: 3 Bit: 2 Bit:




Für Programm 4:


-1 Bit: -3 Bit: -4 Bit: -6 Bit:




-8 Bit: -10 Bit: -12 Bit: -14 Bit:






Ergänzung zu GRAM:


Die Farben der Graphen entsprechen dB-Werten: