Multimédia - hangok, zenék
home - prev - next

A hangok némileg kisebb jelentõséggel bírnak a képeknél a multimédiában, de a hangulat tökéletes megteremtéséhez elengedhetetlen.

A legegyszerûbb formájában a hangot a multimédiás programot tartalmazó CD lemez egy audio sávjában vagy sávjaiban tárolják - ekkor pl. egy háttérzene folyamatosan szólhat a CD meghajtón keresztül. A CD meghajtón kívül itt más erõforrásra nincs is szükség, de arra sajnos folyamatosan - így más adatokat párhuzamosan sajnos nem tudunk olvasni a CD-rõl. Ez az alkalmazási mód tehát csak úgy alkalmazható, ha közben a többi adatot pl. kimásoljuk a winchesterre, vagy egész egyszerûen máshogy oldjuk meg a hangkeltést.

A CD-n tárolt zenék - a mi szempontunkból - nem számítanak adatnak, mivel a számítógéppel nem kerül kapcsolatba, a CD meghajtóból egyenesen az erõsítõ vagy a hangszórók felé csatlakozik.

A második lehetõség, hogy a számítógépek hangkártyáiba beépítünk egy mini hanggeneráló chipet, aminek meg kell mondanunk, hogy milyen jellegû hangot szeretnénk hallani (hangmagasság, hangerõ, stb.), és õ már küldi is ki a hangszórók felé. Ezzel annyi a probléma, hogy a megfizethetõ árú hangchipek, amiket hangkártyára is érdemes szerelni, elég gyenge minõségûek. Ilyen jellegû hangkártyák voltak az AdLib-ek, 9 dallam- és 5 dobcsatornával (egy csatornán egyszerre egy hangszer szólalhat meg). Ez csak egy szintetizátorhangzás, és egyáltalán nem élethû, bár kétségkívül olcsó megoldás volt korábban.

Ha viszont igazi hangokat szeretnénk rögzíteni, akkor egy kicsit nehezebb dolgunk van. Minden hang, hangeffekt vagy zene ugyanis analóg, vagyis folyamatos adatnak számít, amit nem tudunk számítógépen ábrázolni, mivel az csak digitális adatábrázolásra képes.

Ha hasonlítani akarnánk, akkor például egy négyzetre emelés függvényt vehetnénk elõ.
Már ezt az igen egyszerû függvényt sem tudnánk számítógépen "dokumentálni", hiszen akármilyen tizedestörtet vizsgálnánk, azután még mindig írhatunk egy újabb tizedest (pl. 4.03 négyzetét tudjuk, de ott jön még 4.031 aztán 4.032, késõbb 4.0311, és így tovább).

Az egyetlen mód, ahogyan számítógépen hangot rögzíthetünk, az ún. mintavételezés vagy angol nevén sampling. Ennek során a számítógép a kapott analóg jelbõl egy ún. ADC (analog - digital converter) segítségével digitális adatot gyárt (az ADC a hangkártyán helyezkedik el). Ennek a digitális hangadatnak a megszólaltatása a DAC (digital - analog converter, szintén a hangkártyán) feladata lesz, ami valamivel egyszerûbb mûvelet.

A hangoknál is megjelenik a minõség kérdése - hiszen minél jobb minõségre van szükségünk, ez annál több helyet fog foglalni.

Az elsõ minõségi paraméter a mintavételezési frekvencia vagy mintavételezési gyakoriság (sampling frequency). Ez adja meg azt, hogy az ADC-nk másodpercenként hány mintát vegyen a hangból.  Ha a mintavételezési frekvencia pl. 22100Hz, akkor másodpercenként 22100 alkalommal vesz mintát az ADC. Viszonyításképpen a telefonvonalak 8kHz-nek, a CD minõség pedig 44100kHz-nek felel meg.

A másik tulajdonság, ami meghatározza a minõséget, a bitmélység (bit depth), vagy hangfelbontás.
A bitmélységtõl függ az, hogy a hallható tartományból (kb. 20hz-tõl kb. 18000 - 20000hz - ig) milyen széles tartományt tudunk rögzíteni a számítógéppel.
Speciális eseteket leszámítva a hangfelbontás minimum 8 bites lehet; 16 biten már kiváló minõséget lehet produkálni, míg a 24 bit pedig csak a stúdiókban használatos, profi szint.

(A 24 bitet azért alkalmazzák, hogy a nem hallható tartományt is rögzíthessék 20000Hz-tõl nagyjából 60-70000Hz-ig. Ennek célja, hogy az itt levõ ún. hang felharmonikusok se vesszenek kárba, amely a hang telítettségét és spektrumát befolyásolja).

A különbség 8 és 16 bites hangzás között körülbelül ugyanolyan, mint 8 illetve 16 bit különbsége egy képen: a képen 256 színnel épphogycsak ábrázolható egy fotó, 65535 szín felhasználásakor viszont már majdnem teljesen élethû (24 bit a képfeldolgozásban is a teljes élethûséget jelenti, "truecolor" - ez igaz a hangokra is).

Vigyázat! Ne keverjük össze a mintavételezési gyakoriságot és a hangfrekvenciát az azonos mértékegység miatt.

Multimédia - a hangformátumok

Természetesen a hangok számítógépes tárolásánál is sok különbözõ formátum alakult ki.
A lényegesebbek:

Egyszerû hangformátumok:
RAW: a legalapvetõbb formátum, ami tulajdonképpen nem is formátum, hiszen nem tartalmaz információkat a file tartalmával kapcsolatban (nem mondja meg, hogy hány bites, stb.). Csakis és kizárólag a digitalizált hangot tartalmazza. Ha egy RAW filet le akarunk játszani, akkor meg kell tudnunk mondani a lejátszóprogramnak, hogy a hang vagy zene milyen minõségben lett bedigitalizálva, mert egyébként nem azt kapjuk majd, amire számítottunk:
- rossz bitmélységben való lejátszáskor hangos éles zajt,
- rossz mintavételezési frekvencia felhasználásánál pedig az eredeti hangot vagy zenét, de más sebességgel (pl. egy 32000Hz-es mintavételi frekvenciájú hangminta 22100Hz-en lejátszva lassabb, 44100Hz-en lejátszva gyorsabb lesz).

WAV: a Microsoft által elterjesztett formátum, a Windows-zal együtt lett egyre népszerûbb. A WAV-nak több fajtája is van, tömörített WAV is létezik, mégis elsõsorban rugalmas felépítése miatt lett népszerû (például rögzíthetjük a WAV fileban az adott zene vagy hangminta készítõjének vagy az összes közremûködõnek a nevét, és még rengeteg más, esetenként nagyon fontos adatot is).
Kivétel nélkül minden program támogatja.

Mono WAV file-ok õsszehasonlítása:
8 bit, 11khz (22k);
16 bit, 11khz (44k);
8 bit, 44khz (89k);
16 bit, 44khz (176k)
minõségben.

Modul formátumok:
MOD, S3M, XM, IT: számítógép segítségével készíthetünk zenéket is. Ez azon alapul, hogy egy hangmintát nem csak eredeti hangmagasságában, hanem magasabban vagy mélyebben is megszólaltathatunk, ami persze dallamot eredményez.
A modulok lényegében egy vagy több hangmintát és egy speciális "kottát" tartalmaznak.

MIDI: a MIDI formátum a modulokhoz hasonlóan egy speciális kottát ír le, de itt más nincs is letárolva, mert a MIDI egy szabványosított hangszerkészletbõl építkezik. Ez a készlet minden számítógépen közel ugyanúgy kell, hogy megszólaljon - a hangkártyától függ, hogy ez teljesül-e, vagy a végeredmény csak nyomokban hasonlít a kívánt zenére.
Ezt a formátumot használják a szintetizátorok is.
Itt egy minta a MIDI fileokra, a Beatles "Real Love" címû száma.

Hangszer formátumok:
A modulok hívták életre a hangszerformátumokat. A hangszerfileok egy hangszerbõl (pl. zongora) különbözõ hangmagasságokban (pl. oktávonként egy hang) vett mintákat tartalmaznak. Ezt a módszert alkalmazzák a profi szintetizátorok is az "élõ" hangszerek utánzásánál.
Ez azért szükséges, mert egy pl. 5. oktávbeli hangot lejátszva egy oktávval lejjebb még esetleg, de két oktávval lejjebb már egyáltalán nem hasonlít a zongora hangjára (pláne nem minõségi hangzást kapunk).
Ilyen hangszerformátumok pl.: XI, PAT, SBF.

Tömörített formátumok:
Mivel egy CD minõségû, 4-5 perces zeneszám legalább 50MB-ot foglal el, és egy multimédia alkalmazásban bizony sûrûn szükség lehet zenére, ezért a készítõk legtöbbször a minõségbõl adnak alább, hogy a CD lemezen más adat is elférjen. A másik megoldás a hely jobb kihasználására természetesen a tömörített formátumok alkalmazása.

A mai legelterjedtebb tömörített formátum az MP3, amely választható minõségben képes a hanganyagot tárolni, és átlagosan tizedére csökkenti a hangminta helyigényét. Hasonlóan a képeknél említett JPG formátumhoz, ez a formátum is adatvesztéssel dolgozik, de az emberi fül számára legtöbbször nem, vagy csak alig hallható minõségromlást idéz elõ (ha túlzottan feltûnõ lenne a minõségromlás, akkor némi helyveszteség árán jobb minõséget is elérhetünk).
Az MP3 fileok minõségét a kbit/s, vagyis kilobit/másodperc érték megadásával szabályozhatjuk.

Mono MP3 file-ok õsszehasonlítása:

Az eredeti WAV file - James Brown: "I feel good" címû számából vett hangminta - mérete 345kb volt, 16 bit 44 kHz formátumban.

Az Interneten kapott nagy nyilvánosságot az ún. streaming media fogalma. Ez azt jelenti, hogy a nézett oldalt tartalmazó ("távoli") gépen létezik egy hangfile, amit annak letöltése közben tudjuk hallgatni. Mivel az Internet legtöbb esetben nem teszi lehetõvé a gyors adatátvitelt, ezért ezek a zenék, hanganyagok a kisebb méret érdekében gyengébb minõségûek.

Ezt a lehetõséget legtöbbször rádiók alkalmazzák internetes oldalaikon, mivel így lehetõség van arra, hogy maximum pár másodperces késéssel a világ másik végén is hallgathassák az adást - igaz, gyengébb minõségben. Ekkor a rádiónál alkalmazott számítógép menetközben tömöríti az adatot és már küldi is az internetes oldalra, míg a mi gépünk folyamatosan fogadja azt.
Példák: Danubius Rádió, Tilos Rádió, Pararádió.

A legelterjedtebb ilyen streaming - formátum az RA (RealAudio), de ma már az MP3-at is alkalmazzák ilyen területen.

home - prev - next