Dźwięk cyfrowy

Dźwięk to wibracje powietrza, seria wzrostów i spadków ciśnienia powietrza, odbiegających od średniej. Aby to zrozumieć, wystarczy umieścić coś wydającego głośny dźwięk (np. budzik) w komorze próżniowej. Szybko okaże się, że początkowo hałaśliwy przedmiot cichnie, jeśli nie jest otoczony przez powietrze.

Aby wywołać dźwięk, należy sprawić, by przedmiot wibrował. Tym sposobem, skrzypce brzmią, gdy wprawimy ich struny w drganie, a pianino gra, gdy młoteczek uderzy w strunę i wprawi ją w ruch.

Głośniki są używane do wzmacniania i rozprowadzania dźwięków. Membrana głośnika połączona jest z elektromagnesem. Płynący prąd porusza magnesem, a ten wprawia w drżenie membranę. To drżenie to właśnie dźwięk!


Oto jak powstają fale dźwiękowe. Mogą one być przedstawione na diagramie, jako zmiany ciśnienia powietrza w czasie.


Ten rodzaj graficznej prezentacji dźwięku nazywa się modulacją amplitudy (modulacją amplitudy dźwięku w czasie). Ultrasonogram, z drugiej strony obrazuje częstotliwość dźwięku na funkcji czasu. Należy zwrócić uwagę, że sonogram pokazuje podstawową częstotliwość, na którą nakładają się częstotliwości harmoniczne.


Oto, co pozwala nam rozróżniać różne źródła dźwięków: niskie tony mają niską częstotliwość, wysokie tony – wysoką.

Próbki dźwięków

Aby dźwięk mógł być odtworzony na komputerze, musi być przekonwertowany na format cyfrowy, ponieważ tylko na tym rodzaju danych jest w stanie pracować komputer. Program komputerowy przeplata małe próbki dźwięku w określonych odstępach czasu. Nazywa się to próbkowaniem lub digitalizacją dźwięku. Odstęp czasu między dwiema próbkami, nazywa się częstotliwością próbkowania. Aby ludzkie ucho odbierało dźwięk, jako ciągły, musi ono mieć przynajmniej częstotliowość 100 000 razy na sekundę, choć bardziej praktycznie ilość próbek na sekundę wyrazić w Hertzach (Hz). Oto kilka przykładowych częstotliwości próbkowania:

Częstotliwość próbkowania Jakość dźwięku
44,100 Hz Jakość dźwięku CD
22,000 Hz Jakość dźwięku radiowego
8,000 Hz Jakość dźwięku telefonu

Częstotliwość próbkowania dźwięku, na przykład, odtwarzanego z płyty CD nie jest arbitralna. W rzeczywistości, jak wynika z teorii Shannona, częstotliwość próbkowania powinna być na tyle wysoka, aby zachować formę sygnału. Teoria Nyquista – Shannona stanowi, że częstotliwość próbkowania musi być równa lub większa niż dwukrotność maksymalnej częstotliwości zawartych w sygnale. Nasze uszy słyszą dźwięki do około 20000 Hz, zatem do zadowalającej jakości dźwięku potrzebna jest częstotliwość próbkowania przynajmniej rzędu 40000 Hz.
W użyciu jest kilka wystandaryzowanych częstotliwości próbkowania:

  • 32 kHz: dla cyfrowego sygnału radiowego FM (pasmo ograniczone do 15 kHz)
  • 44.1 kHz: dla profesjonalnego sygnału audio i płyt kompaktowych
  • 48 kHz: do profesjonalnego cyfrowego zapisu wielościeżkowego i urządzeń rejestrujących (np. DAT lub MiniDisc)

Dźwięki na komputerach

Każda próbka (odpowiadająca odstępom czasu) jest powiązana z wartością, która określa wartość ciśnienia powietrza w danej chwili. Dlatego dźwięk nie jest przedstawiony, jako ciągła krzywa z odchyleniami, ale seria wartości dla każdego interwału czasowego:


Praca komputera opiera się bitach, więc liczba wartości, którą może mieć próbka musi być określona. Odbywa się to poprzez ustalenie liczby bitów dla której wszystkie wartości próbek są kodowane.

  • Dla 8-bitowego kodowania jest 28 (= 256) możliwych wartości.
  • Dla 16-bitowego kodowania jest 216 (= 65536) możliwych wartości.

Ta druga opcja wyraźnie oferuje wyższą jakość dźwięku, oczywiście kosztem wykorzystywanej pamięci komputera.

Wreszcie, dźwięk stereo wymaga dwóch kanałów, z dźwiękiem rejestrowanym indywidualnie dla każdego z nich. Dźwięk z jednego kanału podawany jest do lewego głośnika, z drugiego – do prawego.

W obróbce komputerowej, dźwięk jest reprezentowany przez kilka parametrów:

  • Częstotliwość próbkowania
  • Liczbę bitów w próbce
  • Liczba kanałów (jeden dla dźwięku mono, dwa – dla stereo, cztery – dla dźwięku kwadrofonicznego)

Pamięć wymagana do przechowywania plików dźwiękowych

Łatwo obliczyć, jaki będzie rozmiar plików audio bez kompresji. Wiedząc ile bitów będzie potrzebnych do zakodowania próbki, poznasz jej rozmiar (rozmiar próbki to liczba bitów).

Aby poznać rozmiar kanału, musisz znać proporcję próbkowania, ilość próbek na sekundę oraz ilość miejsca zajmowana przez każdą sekundę muzyki. Jest to
Częstotliwość próbkowania x Liczba bitów

Dlatego, aby dowiedzieć się, ile miejsca zajmie kilkusekundowy fragment muzyki, wystarczy pomnożyć powyższe dane przez ilość sekund muzyki:
Częstotliwość próbkowania x Liczba bitów x Liczba sekund

Wreszcie, aby określić rzeczywisty rozmiar pliku, wynik powyższego równania powinien być pomnożony przez liczbę kanałów (wynik będzie dwa razy wyższy dla stereo niż dla mono).
Rozmiar pliku, w bitach, równa się zatem:

Częstotliwość próbkowania x Liczba bitów x Liczba sekund x Liczba kanałów

Zdjęcie: © LINE ICONS - Shutterstock.com

Treści, które ukazują się w serwisie CCM powstają we współpracy z ekspertami IT i pod kierownictwem Jeana-François Pillou, założyciela CCM.net. CCM to serwis o nowych technologiach - jeden z największych na świecie, dostępny w 11 językach.
Ten dokument zatytułowany "Dźwięk cyfrowy" opublikowany przez CCM (pl.ccm.net) jest udostępniany na licencji Creative Commons. Możesz kopiować i modyfikować kopie tej strony, na warunkach określonych przez licencję i wymienionych w niniejszym tekście.