Automatische Tonaussteuerung von Audioaufnahmen rückgängig machen, geht das, gibt es da irgendeinen Effekt?

cabriofahrer

Well-Known Member
Wer kennt das nicht, die meisten Smartphones oder auch Handycams machen das: Wenn man Videos aufnimmt, wird das Audiosignal immer automatisch ausgesteuert, damit das Signal nicht verzerrt. Leisere Töne werden verstärkt, lautere heruntergesetzt. Die Aufnahme, gerade wenn man auf Konzerten filmt, verliert dadurch ihre gesamte Dynamik. Leider hat keines dieser Geräte eine Möglichkeit, diesen Automatismus zu umgehen und eine manuelle Aussteuerung vorzunehmen.
Meine Frage deshalb: Gibt es irgendetwas / irgendeine Funktion in den geläufigen Audioeditierprogrammen wie Audacity, um das im Nachhinein zu korrigieren und mehr Dynamik in die Aufnahme zu bringen, als wenn man manuell ausgesteuert hätte?
Ich tippe eher auf Nein, aber vielleicht irre ich mich und hier ist jemand, der sich mit Sound gut auskennt.
 
Mit ffmpeg kannst du sorum probieren:
ffmpeg -i quelle.mp4 -c:v copy -c:a libopus -af loudnorm test1.mkv

Audacity:

Entweder wie im Tutorial nur den leisen Teil angleichen oder den ganzen Track versuchen.

Beachte, dass du in jedem Fall neu kodieren musst. Lossy nach lossy kodieren bedeutet Qualitätsverlust.
 
Vermutlich läuft das Signal beim Recording auf dem Händy o.ä. durch nen Compander (Compressor/Expander, in Software) - leises wird angehoben, lautes abgesenkt - um den heute üblichen Einheits max-0dB Brei zu kriegen;

Es sollte möglich sein, das einfach nochmal durch nen Compander laufen zu lassen, mit umgekehrten Settings (Einstellwerte mal minus 1 zur "normalen" Verwendung) - dann sollte im Idealfall wieder das ursprüngliche rauskommen; tuts natürlich nicht, erst recht nicht bei lossy Kodierung hernach.

Mir ist allerdings kein solches Compander-Plugin (bzw ein nur-Expander, was man auch mal für diesen Fall testen könnte) für Audacity bekannt.
 
heute üblichen Einheits max-0dB Brei
Weg mit dem Trommelfell! :D

Ich glaube es ja nicht, aber vielleicht kann man das direkt am Fon abschalten. Versteckt sich gerne als autogain/gain/audiogain/micgain usw.
Wenn man mal drauf achtet, kann man in TV-Interviews bei starkem Wind den Effekt hören. Gespräch normal hörbar, Wind pustet oder irgendwo ein Knall, Gespräch unverständlich leise und wird wieder lauter. Trotz diesem Schaumstoff, der das unterbinden soll (und manchmal zu feuchte Aussprache :p).
 
Weg mit dem Trommelfell! :D

Ich glaube es ja nicht, aber vielleicht kann man das direkt am Fon abschalten. Versteckt sich gerne als autogain/gain/audiogain/micgain usw.
Wenn man mal drauf achtet, kann man in TV-Interviews bei starkem Wind den Effekt hören. Gespräch normal hörbar, Wind pustet oder irgendwo ein Knall, Gespräch unverständlich leise und wird wieder lauter. Trotz diesem Schaumstoff, der das unterbinden soll (und manchmal zu feuchte Aussprache :p).

Kann man soweit ich weiß, man braucht ne gescheite Aufnahmeanwendung, oft gibts dann ne Option Rohdaten oder sowas
 
Ein Schuss in der Nacht - nee, ins Blaue, da ich keinerlei Erfahrung damit habe:

Mittels LV2proc und dem LV2-Plugin Dynamic Processor vielleicht zum gewünschten Ergebnis kommen (nach ner mehr oder weniger steilen Lernkurve)

Falls LV2proc nicht tut, dann sowas mächtiges wie Ardour installieren und da das Plugin laden (und noch ne steilere Lernkurve vor sich haben).

EDIT: ein Wort "Plugin" zuviel gelöscht
 
Meine Frage deshalb: Gibt es irgendetwas / irgendeine Funktion in den geläufigen Audioeditierprogrammen wie Audacity, um das im Nachhinein zu korrigieren und mehr Dynamik in die Aufnahme zu bringen, als wenn man manuell ausgesteuert hätte?
Das KANN es ja nur geben, wenn irgendwo die Information hinterlegt ist, wann die Verstärkung erfolgt und wann nicht. Ein Programm kann das ja schlecht raten.
Im Idealfall wird die Aufnahme nicht als solches bearbeitet, sondern einfach nur in den Metadaten hinterlegt, das es an den entsprechenden Stellen beim Playback verstärkt bzw. abgesenkt werden soll.
Dann brauchst Du nur diese Metadaten anpassen (bzw. wegignorieren). Ist das nicht der Fall, siehts natürlich nicht so gut aus.
Du kannst es dann höchstens noch händisch machen. Ist aber halt entsprechend aufwendig.

Besser man nimmt von vornherein ordentliches Aufnahmeequipment, anstatt da im Postprocessing noch drin rumpfuschen zu müssen.
 
ne gescheite Aufnahmeanwendung,
Genau, bei Android in der Telefonapp für Gespräche kann man da ja auch einiges einstellen, Bass hoch/runter oder so.

Mal generell: Konzerte sind eben für 'live' gedacht, dh. die Tontechniker basteln die Bühne so, dass möglichst viel nach vorne raus in die Masse kommt, möglichst bis ganz nach hinten. Natürlich ist dann nicht vermeidbar, dass auch Anwohner Zorngiebel in seinem Schlafzimmer den Bass genießt.
Selbst die offiziellen Mitschnitte (davon ausgehend, dass die etwas höherwertigeres Equipment haben und die das Signal direkt aus den amps beziehen) von Konzerten sind am Ende klanglich eher bescheiden, vor allem wenn das Endprodukt dann eh nur AC3@192kbps ist.

Wenn man ordentlich auf die Ohren will: abgemischte Studioaufnahmen und davon entweder die gute alte CD oder gleich FLAC bzw. ein anderes lossless-Format vom Streaminganbieter seiner Wahl. Der Vollständigkeit halber: OPUS liefert auch ordentlich, ist aber eben lossy ;)
 
Das KANN es ja nur geben, wenn irgendwo die Information hinterlegt ist, wann die Verstärkung erfolgt und wann nicht. Ein Programm kann das ja schlecht raten.
Genau das habe ich auch gedacht. Deshalb glaube ich, dass die "Normalize" Funktion hier nichts bringt.
Und dann frage ich mich auch, wo diese Information denn hinterlegt sein sollte? Ich glaube kaum, dass die Smartphones das überhaupt irgendwie vermerken was da gemacht wird und dann im Audiotrack abspeichern.
 
Deshalb glaube ich, dass die "Normalize" Funktion hier nichts bringt.
Natürlich funktioniert das normalisieren und ist exakt für diesen Zweck. In audacity sogar optisch zu schön zu sehen. Es hat eben nur den Nachteil, dass man erneut kodieren muss und damit ein Generationsverlust einhergeht.

Und dann frage ich mich auch, wo diese Information denn hinterlegt sein sollte? Ich glaube kaum, dass die Smartphones das überhaupt irgendwie vermerken was da gemacht wird und dann im Audiotrack abspeichern.
Ob jetzt in Sekunde X runtergeregelt wird, entscheidet die Aufnahmeapp on the fly und die schreibt/kodiert in dem Moment das file 'as is'. Also keine Metadaten, die man rauskratzen könnte. (wäre einfach und der erste Ansatz)
Der zweite Ansatz wäre diese gain-Funktion auszuschalten.
Wenn das auch nicht geht: die nächste Überlegung, audio von der app lossless schreiben lassen. Dann kann man zähneknirschend in Kauf nehmen, dass man nochmal nachbearbeiten muss, aber vermeidet den Generationsverlust und hat den seltenen Luxus sowohl lossless nach lossless als auch lossless nach lossy (einmalig) zu kodieren.
Wenn auch das nicht geht, muss man eben lossy nach lossy kodieren -> dann ists zwar normalisiert, aber die 'schlechtmöglichste' Variante.
Bevor der Blitzgedanke kommt, dass man doch lossy nach lossless kodieren könnte. Vergiss das gleich, technisch zwar möglich, aber grober Unfug. Man pustet damit nur sinnlos die filesize auf und gewinnt nichts.
 
Und dann frage ich mich auch, wo diese Information denn hinterlegt sein sollte?
Müsste man im Zweifel gucken. Erst mal schauen, was überhaupt für ein "Codec" verwendet wird und dann gucken, ob das Format überhaupt sowas vor sieht und wenn ja, dann an den entsprechenden Stellen schauen.

Ob das aber überhaupt gemacht wird, da würde ich jetzt allerdings ein dickes Fragezeichen hinter setzen. Von daher würde ich nicht allzu viel Hoffnung da rein legen.
 
Mir entging irgendwie der Nachfolger zu mp3gain: https://www.freshports.org/audio/rsgain/

Das geht jetzt sogar spezifisch mit AAC, OPUS, FLAC...
Das Prinzip ist Audiomaterial (eher mehrere als Paket, quasi ein Musikalbum) scannen, Lautstärkedifferenzen erkennen und passend Metadaten schreiben, damit ein kompatibler Player automatisch 'folgt' und reguliert. Hat den Vorteil, dass man ohne recode davonkommt, also kein Qualitätsverlust und immer reversibel. Details: https://github.com/complexlogic/rsgain/blob/master/README.md

Es geht auch mit einzelnen files, wäre ein Versuch wert.

Vorausgesetzt, die Aufnahme ist ein .mp4 mit AAC-audio, ggf. anpassen:
Code:
ffmpeg -i aufnahme.mp4 -map_metadata -1 -map_chapters -1 -acodec copy -vn -sn -dn test1.m4a
Das kopiert den reinen Audiostream in einen passenden Container ohne etwaige, vorhandene Metadaten. Das muss nicht stören, aber sicher ist sicher.
Dann mal vielleicht so probieren:
Code:
rsgain custom -s i -l -14 test1.m4a
 
Zurück
Oben