• mozgókép készítési alapismeretek
• videó • vágás • üzemtan
• hangmérnöklés • vágáselmélet

A digit íze III. rész, most már sok számmal

Ez egy erősen redundáns oldal itt a weblapon, egy számokkal és megahertzekkel teli leírása a videó digitalizálásának. Időben ez a leírás keletkezett legkorábban. Akit zavar a sok szám, nyugodtan ugorja át, de ezt a lapot is itt hagyom, ugyanis egy kicsit más szemléletű leírása a dolgok menetének, lehet lesz olyan olvasó aki itt világosodik meg.  Tehát:

Az analóg berendezésekben vigyázni kell a jelre, pontosan, zavar- és torzítás mentesen kell, hogy kezeljék a rajtuk átmenő jel minden részletét.  A digitálisnak elég annyi, hogy van jel – nincs jel.  Ég a lámpa - nem ég a lámpa szinten elég ha átmegy az információ, ezt sokkal könnyebb továbbítani, másolni, hibajavítani, zavarszűrni, sérülése esetén helyreállítani.  A vevő oldalon nincs szükség tiszta, zaj-, zavarmentes jelre elég ha a szándék derül ki egyértelműen: odaát ég a lámpa (ha haloványan is) vagy nem.

 

Az analóg-digitál átalakító (Analog-Digital-Converter ADC) a bemenetére kerülő jel nagyságát bizonyos időközönként, bizonyos pontossággal megméri, és a kapott számértékekhez hozzárendel egy, a jel nagyságával arányos, számot.  Az egymást követő mérések során keletkező számsorozatot kettes számrendszerben ábrázolt értékekként megjeleníti a kimenetén.   Az előbb említett „bizonyos időközönként“ lesz a mintavétel gyakorisága a mintavételi frekvencia,  más néven órajel, a „bizonyos pontossággal“ pedig a bitmélység.  Kicsit részletesebben

A világosságjel digitalizálása során annak az analóg jelre vonatkozó szabvány szerinti feszültség-minimuma és maximuma közötti távolságot a konverter véges számú tartományra osztja fel.  (Az ábrán 3 bites azaz 23=8 tartományra.)  Az ún 8 bites ADC 28=256, a 10 bites ADC 210=1024 darab tartományra, és nem többre.  A mérés során a konverter azt vizsgálja, hogy a bejövő jel nagysága a mérés pillanatában melyik (sorszámú) tartományba esik: a tartomány sorszáma lesz az adott pillanathoz tartozó digitális világosságérték.  Az ITU-R BT.601 szabvány (amit röviden csak 601-esnek emlegetnek) precízen leírja, hogy a fekete-szintnek 8 bites mintavételnél a 16-dikra, a fehér-szintnek pedig 235-dikre kell esnie. Ugyanezek az értékek 10 bites mintavételnél 64. és 940.  Az, hogy a jel nem használja ki maximálisan rendelkezésre álló 1-255 ill. 1-1024 közötti területet lehetőséget ad némi túllövési tartalékra, ha valahol hiba van a szintekkel még nem torzul helyrehozhatatlanul a jel alakja.  Ugyanígy a színkülönbségi jelek nulla szintje 8 biten a 128, 10 biten az 512.  A maximumok a 225. ill 900. szinteken lehetnek, az e fölötti tartományt szuper-fehér (superwhite) tartománynak is nevezik, használatát néha menüből lehet engedélyezni.

 

Látható, hogy a nagyobb bitszámú felbontás több tartományra bontja a digitalizálandó feszültségtartományt, az így kapott számhalmaz finomabb lépcsőkben követi az eredeti jel alakját.  Bitmélységnek nevezzük (bit depht), hogy a kettő hányadik hatványa számú tartományra osztja fel az AD átalakító a digitalizálandó feszültségtartományt, hány intenzitásvariációt képes az adott számnagyság megjeleníteni.  Az 1 bit kétféle szintet jelent 0-át, vagy 1-et, feketét vagy fehéret.  Két bit már négyet: 00, 01, 10, 11, ez már plusz két szürke-árnyalat, vagy akár szín erősségi szinttel több ábrázolását engedi meg.

A 256 db 8 bites, a 1024 db 10 bites, a 16 bit pedig 65536 db szinttartományra osztja fel a sávot.  A videoformátumok többsége színcsatornánként legalább 8 biten azaz 256 intenzitásszintet megkülönböztetve ábrázol.

 

Az RGB képeknél tradicionálisan a színábrázolásra használt összbitszámmal jellemzik a mintavételezés finomságát: 8 bit csatornánként, x 3 csatornán = 24 bites színmélység.  A 32 bites RGB alatt általában 24 bites képet értenek, csak tartozik hozzá még egy 8 bites alfa csatorna is.  Állóképeknél egyre inkább terjed a 48 bites RGB formátum.  A videót nem az össz, hanem a csatornánkénti bitmélységgel jellemezzük: az 8 vagy 10 bites szokott lenni.  A DVCPRO HD például 8 bites színes komponens: 8 bit írja le a a világosság, 8 bit a Cb és 8 bit a Cr jelalakot. 

 

A mintavétel (másodpercenkénti) gyakorisága (sample rate) meghatározó az AD-átalakítás minősége szempontjából.  Túl alacsony gyakoriság pontatlanságot okoz, a digitalizálandó jel gyors változásai kimaradnak, túlzottan magas mintavétel pedig sok felesleges adattal terheli a gépeket.  Egy Nyquist nevű ember törvénye szerint ahhoz, hogy az AD-átalakítás után képesek legyünk az eredeti jel visszaállítására az kell, hogy az AD-átalakítás órajele, mintavételezési gyakorisága legalább a duplája kell hogy legyen a legmagasabb a digitalizálandó jelben előforduló rezgésnek.  A világosságjel esetében ez 2 x 5,5 MHz = 11 MHz.  Az értéket úgy kapjuk, hogy megvalósítjuk a lehető legnagyobb, leggyorsabb fényerőváltozásokat tartalmazó képet.  Elképzelnek egy olyan vonalkód szerű ábrát, ami képpont szélességű, váltakozva fekete - fehér színű, egymás mellé állított oszlopból áll.  Ennek a továbbításakor minden egymást követő pixel a legkisebb és legnagyobb világosság érték közt váltakozik, rezgést generál.  Egy ilyen fekete-fehér pontpáron keletkező fényesség változás jelent egy periódust a rezgésben.  A sorban 720 pont van 720:2=360 változás soronként, 625 sor, 25 kép másodpercenként: 360 x 625 x 25 = 5.625.000 azaz kb. 5.5 MHz.  Ennek a duplája a 11 MHz.  Órajelnek 13,5 MHz-t választottak, hogy biztonsággal beleférjen a 625/50 és az 525/60 norma is, másrészt biztonságos távolság legyen a legmagasabb hasznos frekvencia és a mintavételi gyakoriság között.  Ha nagyobb a távolság, akkor nem kell kihegyezni az alkatrészeket néhány helyen, olcsóbb alkatrészekkel is lehet berendezést építeni.  Tehát az SD videó világosságjel mintavétele 13.5 MHz, a színjelé ennek a fele 6.75 MHz.  Az előbbi számítás az SD felbontásokra vonatkozik.  A HD-re más MHz értékek vonatkoznak, több sor, több képpont másodpercenként (HD videó világosságjel mintavételi frekvencia: 74.25 MHz, a színjelé: 37.125 MHz).

 

Az emberi szem a világosság változásokra jobban érzékeny mint a színekre.  Mutatja ezt az is, hogy éjjel szinte fekete-fehérben látunk.  A komponens jelben a színkülönbségi jel kevesebb információt tartalmaz.  A színkülönbségi jeleket ezért csak 6.75 MHz-el, a világosságjelnél alkalmazott frekvencia felével mintavételezik. 

 

A szín mintavételi arány (Color sample ratio) mutatja, hogy a egy világosságjel mintához mennyi színkülönbségi mintát rögzítünk.  Például a 4:2:2 azt jelenti, hogy négy világosság minta mellé két Cr és két Cb mintát vesznek.  A kevesebb minta kisebb adatmennyiséget jelent.

A visszaalakítás, a digitál-analóg átalakítás

A visszaalakításhoz három darab, a mintavételezésnél használt frekvencián, egymással szinkronban működő, digitál-analóg átalakítóra (Digital Analogue Converter-re, DAC-ra), van szükség.  Az egységek a bemenő digitális adatnak megfelelő nagyságú analóg feszültséget adnak ki a kimenetükön.  Az egyik oldalon bemegy a szám, a másik oldalon kijön a hozzá tartozó analóg feszültség. Az áramkört úgy konstruálják meg, hogy ha egymást követi egy maximális érték és egy nulla, akkor a kimeneten a maximumról a nullára fél mintavételi idő alatt esik le a feszültség.  Ez a tehetetlenség elmossa a digitális lépcsőket, és a kimeneten megjelenő jel olyan lesz mint az eredeti.

A digitális jelekre szabványok vonatkoznak: az SD-re az ITU-R BT.601, amit röviden csak „601“-nek is neveznek, a HD-re az ITU-R BT.709.  Az analóg jelet digitalizálás előtt elő kell készíteni.  Az AD-konverer bemenetére olyan jelet kell küldeni ami belül van a feldolgozhatósági tartományon.  Ez vonatkozik a feszültség és a frekvencia tartományokra.  Ha a feszültség szintje magasabb az előírtnál, az ADC folyamatos maximumot (pl. 255-öt) fog generálni, és így elveszik maga a jelalak.  Az ábrán egy audió jel részletén az „original“ az eredeti jel, a hangerőt jelképező fűszálak egyenlőtlen magasságúak.  Középütt látható, ha a jelnagyság meghaladja a megengedettet, akkor az „kilóg“ az ábrázolható tartományból, minden magasabb érték ugyanazt a még ábrázolható maximális értéket fogja kapni.  A fűnyíró végigmegy a magas értékeken.  Ha az így hibásan digitalizált jelet visszahalkítjuk, már csak ez a torzított jel lesz halkabb, a hangos jelek tetejének az alakja végleg elveszett.  Ez a fűnyírás hangban recsegésként, videóban homogén, maximális erősségű, kiégett fehérként jelenik meg visszaalakításkor, azaz a lejátszáskor.

Ha az órajel engedte értéknél magasabb frekvencia jut a bemenetre, az nem várt effektusokat generálhat.  Az ábrán szaggatott vonallal jelölt görbe egy olyan rezgés, ami nincs az eredeti analóg jelben.  A rosszul megválasztott, alacsony másodpercenkénti mintavételszám miatt jelent meg egy új frekvencia a digitalizált jelben.  Az analóg világban hasonló jelenség a visszafelé forgó lovaskocsikerék esete is, ha a vászonra vetített mozifilmet mi itt még az analóg világ részének tekintjük.  A mozifilm már mintavételezéssel, másodpercenként 24 analóg mozgás-mintával csapja be a szemet...

Analóg vs digitális

Az ég analóg módon kék.  Bármikor nézhetem és nagyon sokféleképpen lehet kék.  Ha filmkamerával fordulok feléje, akkor már csak másodpercenként huszonnégyszer kék.  Ez már egy mintavételezett kék, méghozzá mozgásában mintavételezett.  Ha átrepül a képen egy galamb, akkor a mozgás két képkocka közé eső részét már csak sejteni tudom, arról nem rögzült információ.  A mozgást tekintve a film már kezd hasonlítani a digitális világra de még nem az.  Mintavételezett világ, de nem digitális.  A képen mindenütt van szín, és az bármilyen értékű lehet, éppen ezért az még egy analóg kép.  Digitálissá akkor válik, ha sorokra és a sort alkotó pontokra, pixelekre bontják és a pixelekben mérhető értékeket is véges mennyiségű számmá alakítják.  De az analóg film is apró fényérzékeny szemcsékből áll.  Közelít egymás felé a két világ: a 2k-s (minden egyes képkocka 2 megapixel) képek már majdnem, a 4-k-s (4 megapixel/kép) képek pedig már igen közel járnak a mozikópiák szemcsézettségéhez.  Ez azt jelenti, hogy a 35 mm-es film egy kockáját kb. ugyanennyi, azaz 4 millió kristály alkotja…  Most akkor az is digitális?  Nem, mert ezek a kristályok bizonyos határokon belül bármilyen méretűek lehetnek.  A “digitálissághoz” mind a két dolog kell, hogy csak bizonyos (bitmélység) mennyiségű értéket vehet fel az adott mintavételi gyakoriság szerint sorba, oszlopba rendezett szín- vagy világosság érték.  A digitális adat rendezett számhalom, az analóg filmen a mindenféle alakú, méretű szemcsék rendezetlenül helyezkednek el.