Hur man bestämmer sann ljudkvalitet för strömmande ljud

För ett par år sedan skrev vi en artikel om hur man bestämmer den verkliga bithastigheten för alla ljudfiler, liksom varför det är slöseri med att konvertera YouTube till 320 kbps MP3. Vårt mål var att hjälpa användarna att bestämma den verkliga ljudkvaliteten på musikfiler som de har betalat för och laddat ner, för att undvika musiktjänster som hävdar att de erbjuder högkvalitativt förlustfritt ljud men till exempel serverar MP3-filer som omvandlats till FLAC.

Många användare frågade också hur de kan bestämma den verkliga ljudkvaliteten för strömning musik, snarare än lokala filer. Det här är en stor fråga, eftersom många HiFi-streamingtjänster har dykt upp de senaste åren och hävdar att de erbjuder högkvalitativa förlustfria musikströmmar till sina användare.

Du kanske tror att du bara skulle kunna spela in strömmande ljud, spara det lokalt som en .WAV-fil och köra det genom en spektrumanalysator som Spek. Detta kan inte göras. Det är omöjligt att fånga lite perfekt ljud från en strömkälla med ditt vanliga ljudkort på moderkortet.

Så vad vi behöver göra är att använda en nästan perfekt noggrann spektrumanalysator för att streama ljud och förstå hur man läser det i realtid.

Krav:

MusicScope-programvara
Streamingljudtjänst efter eget val

MusicScope är en ljudanalysator och mätverktyg i realtid som kan leverera mycket exakt feedback om strömmande ljud. Tyvärr slutade utvecklarna att sälja licenser för programvaran, men testversionen låter dig testa upp till 30 sekunders ljud.

För syftet med denna guide kommer vi att ge exempel på hur man använder programvaran med lokala filer i olika format. Men all information som ges kan också gälla för strömmande ljud, som från Spotify, Deezer, etc.

Bestämning av frekvens och LRA-ljudområde

Låt oss prova ett förlustfritt spår (.M4A ALAC) "A Stroll Through the Sky" från filmen Det levande slottet. Det är en orkesterinspelning, så vi borde få ett bra urval av alla frekvensområden. Till exempel kan vi se isolerade högfrekventa toppar som cymbal shimmers mellan 11 och 22 kHz.

När vi tittar på graferna i MusicScope kan vi se att det finns ett mycket högt dynamiskt omfång, som vi förväntar oss av en orkesterinspelning.

Vad MusicScope också kan ge oss är LRA (loudness range), som mäter kontrasten mellan de mjukaste och högsta frekvenserna. För detta specifika spår kan vi se att det finns en skillnad på cirka 23 decibel mellan de mjukaste och högsta passagerna.

När det gäller mikrodynamik har detta specifika spår ett mycket högt dynamiskt omfång, vilket vi kan förvänta oss av en högkvalitativ orkesterinspelning, men det händer också några intressanta saker.

MusicScope kan berätta om ett spår skulle ha nytta av att behärska med en högre upplösning. Så det här spåret spelas in med ett 16-bitars djup med en samplingsfrekvens på 44 kHz. Men vi kan säga att banan har mycket utrymme. Från 0 till 6 decibel under fullskalan finns det inga data i det linjära frekvensspektrumet.

Så det här spåret har en effektiv bithastighet på bara cirka 14 till 15 bitar, vilket innebär att de kunde ha använt dynamiskt omfångskomprimering under huvudinspelning, eller så tog mikrofonerna som användes under inspelningen inte all information.

Så även om det fanns en 96 kHz-version av den här filen, skulle det inte gynna det, för det är troligt att mikrofonerna som används under inspelningen inte hämtade all data. Detta beror på att de flesta mikrofoner är utformade för att mappa till frekvenser för mänskligt hörselområde, så i all ärlighet skulle en 96 kHz / 24-bitars inspelning av detta spår inte verkligen erbjuda någon märkbar skillnad.

Avhämtningen från detta är att för att förbättra ljudkvaliteten fokuserar vi på vad som händer under inspelnings- och masteringstiden. Ett överfokus på “högupplösta” ljudfiler för högupplösta filer distraherar oss från det som verkligen betyder något, vilket är inspelningsutrustningen och processen som används.

Hur man vet om en låt kan ha en bättre ljudversion

Låt oss försöka använda ett EDM-spår, 'Zebra' från Oneohtrix Point Never i 24-bitars 44 kHz-format. Det som är intressant med det här spåret är bara den rena tätheten av den musikaliska informationen i det här spåret. Du kan se ett spektakulärt grönt block på spektrogrammet och se hur det fylls i hela banan.

Detta spår har en LRA på cirka 12,9, vilket är ganska högt för ett EDM-spår. Det som är intressant här är att du kan se att det är en 24-bitars spårning som använder nästan hela 24 bitar i det dynamiska området. Den mjukaste musiken i denna inspelning ligger cirka 100 dB under det högsta ljudet.

Så du kan bara berätta när du tittar på spektrogrammet att det här spåret är avstängt vid 22 kHz, det är en riktigt hård avstängning och högfrekventa toppar vid cirka 22 kHz ligger bara cirka 60 decibel under fullskalan.

Det betyder att om vi hade en 96 kHz version av det här spåret skulle det troligen finnas gott om information kvar över 22 kHz, vilket inte gjorde det till den här versionen av spåret.

För att uttrycka det enkelt skulle din lyssningsupplevelse kunna dra nytta av en högre upplösning av detta spår. Detta spår når gränserna för sitt format (44 kHz samplingsfrekvens). När du förstår tankeprocessen här kan du verkligen börja förstå om du får den bästa möjliga versionen av ett spår på en hi-fi-streamingtjänst.

Hur man berättar om ljudinspelning av dålig kvalitet

Låt oss använda spåret "Fly Away" av TeddyLoid, i 16-bitars 44 kHz-format. Vi kan hör omedelbart att spåret var starkt bemästrat.

Genom att titta på radardiagrammet kan vi se att spåret kontinuerligt toppar hela låtens varaktighet, så att det kontinuerligt klipps mot fullskala. Så om du spelade det här spåret genom medelklassutrustning skulle det sannolikt snedvrida mycket.

Det här spåret har också en LRA på cirka 2,3, vilket innebär att det finns en spridning på 2,3 decibel dynamiskt omfång i hela detta spår, vilket verkar ganska galen.

Dålig kvalitet eller avsiktlig produktion?

När vi överväger ett spår som "Fly Away", måste vi också överväga om det faktiskt är ett dåligt bemästrat spår som en amatörproduktion, eller om det var avsiktligt. Spåret "Fly Away" var tänkt att vara ett slags "disponibelt", högt dansspår. Det låter som att det spelas genom dåliga högtalare, vilket faktiskt kan ha varit det avsikt bakom mastering av banan.

Tänk på det som kamerafilter. Om du tar en selfie med hög upplösning och tillämpar ett sepiafilter och till exempel lägger till lite oskärpa. Folk kanske tror att du tog ett suddigt foto av dålig kvalitet, men det var faktiskt din avsikt. Detsamma kan hända i musikproduktion, som avsiktligt dålig ”garagepunk” -musik.

Så för att sammanfatta. Vi kan använda MusicScope för att bestämma all slags information om ett musikspår, men vi bör också överväga vad konstnären hade för avsikt, och om en mastering av dålig kvalitet egentligen var en form av konst eller något liknande.