My są piraty - sound MPEG


      Jak świat światem człek poczciwy zwany PIRATEM, próbował zgarnąć nie co grosza na swym procederze. Wszyscy wszak wiedzą iż przy pomocy swego komputerka piracił software. Z czasem jednak nasz Kpt. Hook zainteresował się możliwością ciachania dźwięku i zarabiania na nim. Każda platforma sprzętowa miała na tym poletku swych liderów. Wszedzie jednak głównym problemem była wielkość pliku jaki uzyskiwało się po przeniesieniu próbki dźwięku bezpośrednio na komputer.

      Formaty typu WAV (grzyb) czy też 8SVX (Amiga) okazały się zbyt obszerne. I tak na przykład 5-cio minutowy kawałek po zgraniu na "łejwa" zajmuje 40 megasow na twardym dysku. Dlatego też próbowano skompresować plik tak, aby przy minimalnych rozmiarach jakość dźwięku odpowiadała oryginałowi. Cały problem to stworzenie bardzo skutecznego algorytmu niestratnego, czyli takiego który pozwalał by odtworzyć dokładnie plik pierwotny. Oczywiście wszystkie te starania nie miały na celu ułatwienia życia naszemu PIRATOWI, ale stworzenie uniwersalnego formatu zapisu dźwięku w Internecie.

      Pierwszym takim algorytmem który powstał był ADPCM (Adaptive Differential Pulse Code Modulation). Kodował on różnicę między dwiema kolejnymi próbkami sygnału starając się "przewidzieć" wartość kolejnej próbki dźwięku. Później stworzono algorytm ACE/MACE o kompresji 2:1 - własność firmy Apple. Wszystkie jednak były niedoskonałe.

      I wreszcie stało się, udało się opracować w miarę doskonały sposób kompresowania dźwięku - MPEG Audio. Aby przygotować taki skompresowany pliczek potrzebny jest specjalny program tzw. ENCODER. Aby odtworzyć plik po kompresji potrzebować będziemy natomiast DECODER-a. Obecnie ukończone są cztery standardy kompresji MPEG: Layer 1, Layer 2, Layer 3 i zupełnie nowy, świeżutki Layer 4.

      Pierwszy layer ma stopień kompresji dla sygnału o jakości CD w stosunku 1:4. Layer numer dwa charakteryzuje się maksymalną jakością dźwięku przy minimalnej złożoności. Dosyć dobry algorytm przy kompresji do wartośći 1:8. Przy wyższej kompresji jakość niestety się znacząco pogarsza. Obecnie już prawie nie stosowany, choć na pewno są jacyś masochiści... Z kolei Layer 3 to najbardziej złożony z tych formatów i jednocześnie najbardziej chyba wydajny. Opracowano go w Niemczech (z tego co pamiętam to chyba w instytucie Fraunhofer, czy jakoś tak...). Pracę nad nim trwały dosyć długo, bo w latach 87-91. Jak się okazało był on na tyle doskonały, że stał się optymalnym sposobem kodowania sygnałów audio w/g norm ISO-MPEG. Ma doskonałe parametry wynikowe; dźwięk stereo, 44 KHz, 16 bitów przy odtwarzaniu z prędkością 112-128 Kbs (kb na sekundę). Stopień kompresji dzięki temu jest niesamowity; od 11:1 do 13:1. Utwór który w "łejwie" okupuje 40 megsów po przerobieniu go na MP3 zajmuje jedyne 3 megasy z hakiem! I to jest sedno sprawy. Jeżeli taki kawałek to tylko trzy megabajty, to na jednym CD-eku zmieści się grubo ponad 100 numerów. Chyba nie muszę mówić jakie to otwiera możliwości dla PIRATÓW!

      U mnie w Trójmieście handel płytkami wręcz kwitnie. Za jedyne 50 PLN można zakupić sobie egzemplarz wypełniony po brzegi ukochaną muzyczką (disko polo także - a jakże!) A tak z innej beczki; pozycja layerów jest tak mocna, że zdecydowano się na stworzenie specjalnych walkmanów przystosowanych do odtwarzania specjalnych minidysków zawierających muzykę w tym formacie. Takie dyski można wielokrotnie zapisywać, a stosuje się do tego komputer (zapewne klasy pC - jedyny słuszny i koolasty sprzęcior). Aha! zapomniałbym iż jak wieść niesie powstał Layer 4. Niestety na razie nic o nim nie wiem, ale jak tylko coś wywęsze to doniosę.

      Na koniec trochę o wymaganiach sprzętowych pozwalających odtwarzać empegi w domowych warunkach. TRZEBA MIEĆ DOSYĆ SZYBKI PROCESOREK. Jeżeli mamy do dyspozycji grzybka to 486 (propozycja dla masochistów). Tak ogólnie to praca z audio empegami na blaszaku jest arcyciekawa. Po pierwsze flagowy player WinAMP zajmuje jedyne 22 megasy... Po drugie tak obciąża procesor, że nie ma już czasu na nic. Przezabawne jest to, iż im lepszy szybszy procesor rośnie częstotliwość odtwarzania, ale nie zmienia się wartość obciążenia procesora. Zauważyłem to porównując odtwarzanie na p133 i na pII233 MHz-ów. Mimo że istnieje różnica w cenie to korzyści są znikome. Ale co blacha to blacha.

Jeżeli chodzi o Amigę to do odtwarzania potrzebujemy proca min. 68020 i trochę fastramu. Oczywiście na takiej konfiguracji możemy umrzeć z nudów. Im szybszy procesorek tym lepszy efekt. Przyzwoity osiągalny jest od 030 wzwyż.

      Jako że text ten piszę po trochu już od kilku dni, miałem czas na ściągnięcie z sieci nowych informacji. Ściągnąłem taki news, iż zdaje się że to co napisałem dotąd w tym artykule traci sporo na aktualności...

      Otóż taki sobie koncern Yamaha opracował tzw. TwinVQ (Transform-domain Weighted Interleave Vector Organization ; w skrócie VQF). A cóż to za maszkara??? Ano jest to nowy format kompresji cyfrowej sygnału audio. Wykorzystuje podobne techniki kodowania co MP3, ale robi to znacznie skuteczniej. Do tego pliki VQF przy mniejszym rozmiarze mają lepszą jakość niż analogiczne pliki skompresowane MP3. Różnice długości pliku po kompresji to jakieś 30-35 procent na korzyść nowego formatu. Przykładowo utwór w formacie MP3 (128 kbps) zajmuje sobie 4 i pół megasa, gdy ten sam track w standardzie Yamahy ma o 1 mega mniej! Także sama jakość skompresowanego pliku jest lepsza w przypadku tego ostatniego. Oczywiście coś za coś. Taki super algorytm potrzebuje super procesora aby go rozgryźć (przeciętne zużycie to ok. 3 razy więcej czasu proca niż empeg trzeci).

      Na razie jest za wcześnie, aby wyrokować jaki format się bardziej przyjmie Ja osobiście wierzę w potęgę MP4, który to zbliża się wielkimi krokami. Ale co to wszystko może obchodzić zwykłego, szarego polskiego pirata, który to i tak zgarnie "należną sobie dolę" z ludzkiego naiwnego bydła.

encodował: GEPARD/DIAL