Plik jest ciągiem informacji zapisanych w sytemie binarnym, na przykład ciągiem od 0 do 1. Plik może być przechowywany, aby zachować ślad tych informacji. Plik tekstowy jest z kolei plikiem składającym się ze znaków zapisanych w formie oktetów.
Plik ten jest przechowywany na dysku twardym w następującej formie "nazwa_pliku.ext", a z kolei ".ext" oznacza rozszerzenie; co pozwala na stwierdzenie, jakiego programu potrzebujemy do otwarcia tego pliku. (Ważne: nie zapewnia to jednak żadnej gwarancji co do typu pliku: przy zmianie rozszerzenia nie następuje zmiana typu pliku!).
Długość nazwy oraz rozszerzenia mogą różnić się w zależności od systemu operacyjnego.
Stąd też w systemach DOS oraz Windows 3.1 plik pochodzący z systemu Windows 9x będzie miał skróconą nazwę składającą się z 6 pierwszych znaków nazwy, po których wystąpi - x, co będzie reprezentować cyfrę, która będzie się zwiększać za każdym razem, kiedy plik będzie miał tę samą nazwę. Oznacza to, że jeżeli plik o nazwie "plik~1" już istnieje, następny zostanie nazwany "plik~2".
Co więcej, plik zawiera również nagłówek, w którym zawarte są dodatkowe informacje jak na przykład typ pliku oraz wielkość. Dodatkowo na końcu pliku znajduje się znak pokazujący, że informacje po nim występujące nie należą już do tego samego pliku.
Być może zastanawiasz się po co umieszczać informację o wielkości pliku w nagłówku, skoro znamy już wielkość pliku?
Po analizie poniższych dwóch przykładów, będzie wiedział, dlaczego.
Bez wątpienia zdarzyło Ci się, że przy ściąganiu pliku z Internetu wystąpił jakiś problem z przeglądarką lub serwerem i pobieranie zostało przerwane.
Jeśli pobierany plik był plikiem tekstowym, będzie Ci brakować jedynie końcowej części tekstu, jeśli jednak był to plik binarny (na przykład program wykonawczy), uruchomienie go może być niebezpieczne z uwagi na brakujące informacje. System operacyjny w takich przypadkach porównuje zatem aktualny rozmiar pliku z rozmiarem widocznym w nagłówku w celu sprawdzenia ważności tego pliku, co ogólnie związane jest z problemem integralności. Warto wiedzieć, że w rzeczywistości ten proces kontroli ma miejsce dzięki potężniejszemu algorytmowi znanemu jako CRC (cykliczny kod nadmiarowy).
Jeśli plik jest zainfekowany przez jakiś wirus, ten ostatni może dodać linie kodu. Stąd też informacja o wielkości pliku w nagłówku nie będzie już taka sama (chyba że wirus został zaprogramowany, tak aby zmieniać również nagłówek), co pozwoli na prostszą i szybszą identyfikację zainfekowanego pliku.
Zdjęcie: © Studio DI - Shutterstock.com