Dźwięk to wibracje powietrza, seria wzrostów i spadków ciśnienia powietrza, odbiegających od średniej. Aby to zrozumieć, wystarczy umieścić coś wydającego głośny dźwięk (np. budzik) w komorze próżniowej. Szybko okaże się, że początkowo hałaśliwy przedmiot cichnie, jeśli nie jest otoczony przez powietrze.
Aby wywołać dźwięk, należy sprawić, by przedmiot wibrował. Tym sposobem, skrzypce brzmią, gdy wprawimy ich struny w drganie, a pianino gra, gdy młoteczek uderzy w strunę i wprawi ją w ruch.
Głośniki są używane do wzmacniania i rozprowadzania dźwięków. Membrana głośnika połączona jest z elektromagnesem. Płynący prąd porusza magnesem, a ten wprawia w drżenie membranę. To drżenie to właśnie dźwięk!
Oto jak powstają fale dźwiękowe. Mogą one być przedstawione na diagramie, jako zmiany ciśnienia powietrza w czasie.
Ten rodzaj graficznej prezentacji dźwięku nazywa się modulacją amplitudy (modulacją amplitudy dźwięku w czasie). Ultrasonogram, z drugiej strony obrazuje częstotliwość dźwięku na funkcji czasu. Należy zwrócić uwagę, że sonogram pokazuje podstawową częstotliwość, na którą nakładają się częstotliwości harmoniczne.
Oto, co pozwala nam rozróżniać różne źródła dźwięków: niskie tony mają niską częstotliwość, wysokie tony – wysoką.
Aby dźwięk mógł być odtworzony na komputerze, musi być przekonwertowany na format cyfrowy, ponieważ tylko na tym rodzaju danych jest w stanie pracować komputer. Program komputerowy przeplata małe próbki dźwięku w określonych odstępach czasu. Nazywa się to próbkowaniem lub digitalizacją dźwięku. Odstęp czasu między dwiema próbkami, nazywa się częstotliwością próbkowania. Aby ludzkie ucho odbierało dźwięk, jako ciągły, musi ono mieć przynajmniej częstotliowość 100 000 razy na sekundę, choć bardziej praktycznie ilość próbek na sekundę wyrazić w Hertzach (Hz). Oto kilka przykładowych częstotliwości próbkowania:
Częstotliwość próbkowania | Jakość dźwięku |
---|---|
44,100 Hz | Jakość dźwięku CD |
22,000 Hz | Jakość dźwięku radiowego |
8,000 Hz | Jakość dźwięku telefonu |
Częstotliwość próbkowania dźwięku, na przykład, odtwarzanego z płyty CD nie jest arbitralna. W rzeczywistości, jak wynika z teorii Shannona, częstotliwość próbkowania powinna być na tyle wysoka, aby zachować formę sygnału. Teoria Nyquista – Shannona stanowi, że częstotliwość próbkowania musi być równa lub większa niż dwukrotność maksymalnej częstotliwości zawartych w sygnale. Nasze uszy słyszą dźwięki do około 20000 Hz, zatem do zadowalającej jakości dźwięku potrzebna jest częstotliwość próbkowania przynajmniej rzędu 40000 Hz.
W użyciu jest kilka wystandaryzowanych częstotliwości próbkowania:
Każda próbka (odpowiadająca odstępom czasu) jest powiązana z wartością, która określa wartość ciśnienia powietrza w danej chwili. Dlatego dźwięk nie jest przedstawiony, jako ciągła krzywa z odchyleniami, ale seria wartości dla każdego interwału czasowego:
Praca komputera opiera się bitach, więc liczba wartości, którą może mieć próbka musi być określona. Odbywa się to poprzez ustalenie liczby bitów dla której wszystkie wartości próbek są kodowane.
Ta druga opcja wyraźnie oferuje wyższą jakość dźwięku, oczywiście kosztem wykorzystywanej pamięci komputera.
Wreszcie, dźwięk stereo wymaga dwóch kanałów, z dźwiękiem rejestrowanym indywidualnie dla każdego z nich. Dźwięk z jednego kanału podawany jest do lewego głośnika, z drugiego – do prawego.
W obróbce komputerowej, dźwięk jest reprezentowany przez kilka parametrów:
Łatwo obliczyć, jaki będzie rozmiar plików audio bez kompresji. Wiedząc ile bitów będzie potrzebnych do zakodowania próbki, poznasz jej rozmiar (rozmiar próbki to liczba bitów).
Aby poznać rozmiar kanału, musisz znać proporcję próbkowania, ilość próbek na sekundę oraz ilość miejsca zajmowana przez każdą sekundę muzyki. Jest to
Częstotliwość próbkowania x Liczba bitów
Dlatego, aby dowiedzieć się, ile miejsca zajmie kilkusekundowy fragment muzyki, wystarczy pomnożyć powyższe dane przez ilość sekund muzyki:
Częstotliwość próbkowania x Liczba bitów x Liczba sekund
Wreszcie, aby określić rzeczywisty rozmiar pliku, wynik powyższego równania powinien być pomnożony przez liczbę kanałów (wynik będzie dwa razy wyższy dla stereo niż dla mono).
Rozmiar pliku, w bitach, równa się zatem:
Częstotliwość próbkowania x Liczba bitów x Liczba sekund x Liczba kanałów
Zdjęcie: © LINE ICONS - Shutterstock.com