Uwaga! – Latencja. Ile można znieść?

Latencja-01-smallSzczerze mówiąc pozostaję ostatnio w stanie lekkiego osłupienia. Dlaczego? Jak muzyka może być lepsza, jeżeli dość powszechne jest przekonanie, że latencja w pewnym zakresie jest akceptowalna. Moim zdaniem nie, no ale dobra – co to znaczy „w pewnym zakresie”? Jakie opóźnienia musimy a jakie możemy zaakceptować, i jak te opóźnienia przekładają się na brzmienie naszych nagrań? Postanowiłem sprawdzić.

Jednym z powodów tego testu było stwierdzenie moderatora jednego z naszych najpopularniejszych forów w dyskusji dotyczącej opóźnień – cytuję: „opóźnienie do 30-40ms jest całkowicie akceptowalne”!!! Oczywiście, być może miał na myśli sytuacje inne, niż nagrywanie rzeczywistych instrumentów, ale pozostawienie tego bez komentarza jest moim zdaniem niebezpieczne. Na innym forum – gitarowym! – spotkałem się ze stwierdzeniem „mam Alesis IO2 i nie odczuwam latencji” – a przypomnę, że ten interfejs pracuje ze sterownikami ASIO4ALL. W zasadzie wszyscy też kiedyś słyszeliśmy, że w sumie niewielka latencja jest OK, w końcu dźwięk w powietrzu też wędruje, jeden metr to 3ms, a kto stoi bliżej niż dwa metry od marszala czy perkusisty… i inne tego typu kwiatki.

Wszystko już miałem napisane i przygotowane, a w międzyczasie na innym forum pojawiło się nagranie, w którym latencja wynosząca niecałe 20ms jest całkowicie akceptowalna i różnice w graniu i odtwarzaniu są nieistotne – „wszak nie zamontowano nam w aparacie słuchowym nanoskopu”… W takim razie o tym później, na razie niech będzie to, co już mam.

Postanowiłem sprawdzić, ile może znieść normalny człowiek. Za punkt wyjścia przyjąłem na początek latencję wejście-wyjście równą 30ms, żeby nie było, że całe 40. Prosty, skwantyzowany loop z kolekcji Avida oraz stratocaster tłumionymi ósemkami. Gram ja, jest w zasadzie równo, trochę sobie pomogłem prądem 😉
Założenie jest następujące: do uprzednio nagranych bębnów dogrywamy gitary (miał być bas, ale słabiej słychać a poza tym basu się nie dubluje) w dublu i ustawiamy je skrajnie w panoramie. Czyli: bębny nagrane, albo są z automatu, w każdym razie są równe. Do tego najpierw lewa, potem prawa gitara, przez symulator programowy, a więc słyszana w odsłuchu podczas nagrań z opóźnieniem. Opóźnienie wynosi 30ms, co odpowiada mniej więcej pracy z buforem 512 próbek przy częstotliwości próbkowania 44,1kHz. Bufor duży i „mniej więcej”, ale nie ja wymyśliłem te 30ms. Tak, te 30ms to dużo, później zmniejszymy, na razie zobaczmy, czego słuchać. Czyli: nagrywamy swoje ślady, słysząc się w monitorach czy słuchawkach z 30ms opóźnieniem – co dla ciekawych odpowiada odległości jakichś 10m od źródła dźwięku.

Po nagraniu chcemy uzyskać mniej więcej coś takiego:

równo

równo

Żeby udowodnić, że się da, muszę też oczywiście dać posłuchać 😉

No i dobrze – da się, o co mi chodzi? Opóźnienie w odsłuchu wynoszące 30ms razi tylko na początku – po chwili, jak dostosujemy się do sytuacji, bez problemu jesteśmy w stanie je skompensować grając – tak grają od zawsze organiści, w pewnym stopniu też pianiści i akordeoniści, przysłowiowi gitarzyści „daleko od pieca”… Tak, muzyk bez problemu kompensuje sposobem grania opóźnienie wnoszone przez instrument, jeżeli dobrze słyszy i się skupi, to może równo zagrać nawet z opóźnieniem 30ms. Tak, tego nie neguję! To w sumie nie jest takie trudne, spróbowałem, i na początku jest dziwnie (zwłaszcza na słuchawkach) ale na monitorach już po chwili przyzwyczajamy się i z głośników jest równo. Zapominamy jednak o drobiazgu, jakim jest kompensacja latencji! Każdy współczesny DAW ma taką funkcję, i choć wprawdzie można ją wyłączyć, to oczywiście nikt tego nie robi, bo to przecież dobre jest. Tak? Na pewno? No to zastanówmy się chwilę: nagrywając, słyszymy się z opóźnieniem 30ms. Chcąc grać równo, naturalnie i niejako odruchowo gramy „do przodu” o te 30ms i w czasie nagrania jest równo. To się da zrobić. Zresztą często inni ludzie słuchają podczas nagrywania i mówią – „szybciej, wolniej, o teraz OK”. I podczas nagrywania jest OK. Jednak natychmiast po naciśnięciu spacji nagrany ślad zostaje przesunięty w przód o wartość opóźnienia, czyli nasze 30ms. Czyli: równo nagrany ślad jest wyprzedzony o 30ms! Jak to w rezultacie brzmi? Proszę bardzo, poniżej przykład z przesuniętymi w przód o 30ms oboma śladami gitar:

wyprzedzone

Jeżeli ktoś nie słyszy różnicy, to faktycznie nie musi przepłacać…
Ale dobrze, załóżmy, że wiemy, że po nagraniu ślad zostanie przesunięty, i z zaciśniętymi zębami gramy swój ślad „do tyłu”, żeby potem było równo. No to kto na ochotnika zagra tak, jak w poniższym przykładzie – oba ślady w tył o 30ms?

opóźnione

 

Taki sposób grania jest może i fajny, ale jeżeli chcemy, żeby było równo, to tak zagrać będzie bardzo trudno. Poza tym musimy jakoś kompensować opóźnienie (czy raczej wyprzedzenie), a więc musimy je poznać, najprawdopodobniej metodą prób i błędów, a to raczej długi i męczący proces. Czy to koniec problemów? Nie, dopiero początek. Można w sumie się uprzeć, że sprawny gitarzysta jest w stanie zagrać do przodu czy do tyłu i w sumie jakoś to się uda. Ale przecież potrzebne są dwa ślady gitar…

Reklamy

5 thoughts on “Uwaga! – Latencja. Ile można znieść?

  1. sun

    No, to ja bym ci musiał teraz Przemek wyjaśniać tajemnice działania wszechświata i budowy na podstawie fluktuacji zmian nieskończonych energii przebytej w czasie, żebyś uwierzył ? Napięcie spadło na 3,19V-bios ( rzeczywiste 3,25V-zasilacz Delta 350W ), w Reaperze 4.12, lub cakewalku 8.0 ten akcent w innym miejscu wypadał, np ciągłe pływanie tego napięcia z 3,26-bios na 3,23-3,21V powodowało, że ścieżka nagrana była zniszczona pod względem równości ( z tym był największy problem), mimo że akcent w odsłuchu metronomu był poprawny. Prawdopodobnie źle działał przetwornik wyjściowy, lub wejściowy, a teraz wydaje mi się, że to może był po prostu zły odczyt-zapis na dysku, coś z dyskiem się działo. Nic innego nie wymyśle. Jeśli masz starą zaśniedziałą jakąś przejściówkę z 20 pin na 24pin z rozszerzonymi, luźno siedzącymi stykami, przetestuj z kilka dni na jakimś codegenie 300W. Pozdro

    Odpowiedz
  2. sun

    Witam. Nieprawidłowe napięcia 3.3V, 5V (spadek, wzrost) na zasilaczu, lub w układzie płyty głównej powodują np pływanie latencji (najbardziej daje się we znaki dopasowanie w kieszeni uderzeń stopy, werbla do akcentów gitary na wtyczkach Vsti ), zniekształcone widmo, w ogóle problemy z równym nagraniem na sucho ścieżki bez nakładania symulacji gitarowych wzmacniaczy lepou, impulsów, itp. Spowodowane może być to uszkodzonym zasilaczem, płytą główną, zaśniedziałymi stykami we wtyczce ATX24-pin, niekompatybilnością karty dźwiękowej z płytą główną itp. Spotkałem się z tym i musiałem o tym napisać.

    Pytania mam. Czy w studiach muzycznych są jakieś wytyczne dobierania sprawdzonych podzespołów, jak płyty główne, karty dźwiękowe, zasilacze itd. PC-et w każdym studiu robi chyba za rdzeń całej rejestracji dźwięku w tych czasach ?

    Pytanie drugie.

    Czemu gdy nagram gitarę (czysty sygnał), jej amplituda jest niesymetryczna ( występuje to wtedy, gdy uderzam mocniej w struny – filtr RC-HPF, obniżenie poziomu wejścia nic nie daje ), góra ma niskie szczyty, dół wysokie, przez co dźwięk jest zniekształcony, nieczytelny dynamicznie. Porównuje z Ola Englunga nagraniami i u niego te połówki są prawie równe.

    Czytam po necie, że może być to związane ze składową stałą-DC Offset ( najcichszy dźwięk jest na lini ZEROWEJ, a i tak są połówki niesymetryczne u mnie ), niby na to pomaga filtr HPF, ale jeśli on nie daje rady, to jest związane z przetwornikami AC-CA ( używam w tej chwili SB live 5.1).

    Cyfra tak ma przy nagrywaniu gitary na wtyczkach vst, że trzeba delikatnie uderzać w te struny, żeby było czytelnie, dynamicznie w odsłuchu po nagraniu ( w tej chwili u mnie takie coś występuje przy sygnale dochodzącym do max -6dB ) ?

    Odpowiedz
    1. nagrywamy Autor wpisu

      Latencja zależna od napięć? Myślę, że nie sądzę. W każdym razie nie spotkałem się z wpływem napięcia na latencję.

      Przebieg może być niesymetryczny i jest to całkowicie normalne. Ani symetryczny nie świadczy o poprawnym nagraniu, ani niesymetryczny o złym – tak po prostu jest. Filtr dolnozaporowy całkowicie usuwa składową stałą, ale nie wyrówna połówek przebiegu jeżeli chodzi o ich amplitudę.

      Nie wiem, czy trzeba uderzać delikatnie – wydaje mi się, że jeżeli poziomy są ustawione odpowiednio, to grać trzeba normalnie, jak na piecu.

      Odpowiedz
      1. sun

        Bios zaniża 0,06V. W zasilaczu jest napięcie 3,33V, czyli prawidłowe. Przez zaśniedziałe
        styki złącza ATX24-pin bios pokazuje 3,23V po kilku godzinach, dniach ( rzeczywiste na
        układzie płyty 3,29V ), to napięcie już powoduje degradacje sygnału, jeśli spadnie jeszcze
        niżej na 3,19V-bios, wtedy metronom zamiast stukać puk,cyk,cyk,cyk, stuka cyk,cyk,cyk,puk
        (akcent wypada gdzie indziej)- Cakewalk, Reaper tak samo reaguje. Czego ja tam nie robiłem,
        latencje kompensacji ustawiałem ręczną, bufory na WDM, Asio, Asio4all, cztery karty w tym
        EMU1212-wszedzie tak samo. Chodzi mi o to, że ścieżka jest zniszczona, nierówna względem
        perkusji, wieczne przesuwanie ścieżki nic nie daje. Wymieniłem Złącze atx24 w zasilaczu i
        jest teraz prawie idealnie (napięcie nie spada już z 3,26V-3,32V na 3,23V,3,21V. W tej
        chwili dysk lepiej działa, zaraz po włączeniu systemu, np firefox uruchamia się natychmiast
        bez dogrywania się dysku. Odtwarzane mp3 mają więcej przestrzeni, są czytelniejsze.

        PCI, USB jest na liniach 3,3V, 5V, i układy kart podpiętych pod te złącza-szyny są z tych
        napięć zasilane. Szukałem tego trochę czasu, co to może być, zasilacz zostawiłem na koniec,
        a raczej wtyczkę.Czym częściej słuchałem muzyki tym bardziej spadało napięcie na linii 3,3V. Sprawdzałem miernikiem i odczep 3.3V na płycie (gniazdo ATX24) jest bezpośrednio doprowadzony do około 10 pinów na złącze PCI.

        Czytam o budowie zasilaczy impulsowych i wynika z tego, że zwiększenie sprawności zależy od
        jak najlepszego wyprostowania tego prądu przez (zwiększenie częstotliwości) zmniejszenie
        okresowości występowania impulsów prostokątnych, a to znaczy, że procesor i układy muszą
        działać bezbłędnie.

        Nie podoba ( oczywiście może mi się nie podobać-kogo to obchodzi, ale mimo wszytko muszę
        napisać ) mi się jednak kilka rzeczy w tej cyfrze. Jedna z nich, to że musi być wszystko
        dokładne co do jednej bilionowej, dwa- czym dokładniejsza konwersja ciągów binarnych, próbek na sygnał analogowy, tym lepsza jakość słuchanego dźwięku. Na Sb live 5.1 trzeba się
        emocjonalnie nastawiać do utworów i zmuszać się do słuchania tego dźwięku, nie ma to nic
        wspólnego z analogami, gdzie ten dźwięk z taśmy wzbudzał emocje, tu jest odwrotnie. Dopiero
        np karta Emu1212 i jej konwertery dają zbliżony obraz wyrazistości dźwięku np gitar z
        wokalem w głębi, przestrzeni itp.

      2. nagrywamy Autor wpisu

        Nie wierzę, że zmiany napięcia zasilania, w dodatku tak niewielkie, zmieniają akcentowanie metronomu. Nie wierzę.

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s