Tiedosto

Musiikkitiedostoja

Tiedosto (engl. file) on tiedostojärjestelmään tallennettu joukko tavuja. Tiedosto sisältää esimerkiksi tekstiä, musiikkia, kuvia tai tietokoneohjelman.

Suomen sanaa tiedosto ei sisälly vuonna 1966 valmistuneeseen Nykysuomen sanakirjaan.[1] Se on kuitenkin ollut käytössä jo viimeistään vuonna 1969.[2]

Tiedostojen tallentaminen

[muokkaa | muokkaa wikitekstiä]

Tiedosto on kokoelma tietoa, joka talletetaan massamuistille, joka on tyypillisesti haihtumatonta, eli tiedot säilyvät virran katkaisussa tai järjestelmän uudelleenkäynnistyksessä. Käyttäjän näkökulmasta tiedosto on pienin varausyksikkö loogisessa tallennuslaitteessa, eli tietoa ei voi tallettaa ilman sen sijoittamista tiedostoon. Tiedostot voivat olla tietokoneohjelmia tai käyttäjän dataa.[3]

Useimmissa nykyisissä käyttöjärjestelmissä tiedosto on vain peräkkäin tallennettu joukko tavuja, ja siihen viitataan tiedostonimen avulla. Tiedoston tiedostomuodon tunnistaminen ja tiedon tulkitseminen ja sen käsittely jää kokonaan sovellusohjelmien vastuulle. Täten käyttöjärjestelmä ei ota kantaa siihen sisältääkö tiedosto tekstiä, kuvaa vai ääntä ja käsittelee kaikkia tiedostoja samalla tavoin.

Tiedostojen tallennus massamuistiin tapahtuu tiedostojärjestelmän tasolla. Tiedostot järjestetään hierarkkisesti sisäkkäisiin hakemistoihin eli kansioihin, joista lueteltaessa muodostuu hakemistopolku. Nimen lisäksi tiedostoon liittyvää välttämätöntä metatietoa on sen koko tavuina, sillä tiedosto sisältää sille ennalta määrätyn määrän tavuja. Tiedostoille voidaan määrittää myös omistaja ja eritasoisia käyttöoikeuksia.

Tiedostojen rakenne

[muokkaa | muokkaa wikitekstiä]

Unix-järjestelmissä tiedostot ovat yksiulotteinen joukko tavuja ilman tiettyä rakennetta.[4][5]

On eräitä käyttöjärjestelmiä, joissa tiedosto voi olla yksinkertaista tavujen joukkoa rakenteellisempi. Tällainen on ainakin OpenVMS:n Files-11-tiedostojärjestelmä, jossa tiedosto voi koostua tietokannan tavoin määrätyistä tietueista, joissa voi olla useampia määrättyjä kenttiä.[6] Toinen nykyisestä käytännöstä poikkeava käyttöjärjestelmä on CP/M, jonka tiedostoilla ei ole kokoa, vaan tietty määrä varattuja lohkoja. Tällöin sovellusohjelman pitää itse huolehtia siitä, ettei se lue tiedostoon kuulumatonta tietoa.

Tiedostojen laajempi käyttö

[muokkaa | muokkaa wikitekstiä]

Unixin merkittäviin ominaisuuksiin sen kehittäjien mukaan kuuluu hierarkkinen tiedostojärjestelmä ja yhteensopivat rajapinnat. Jälkimmäisestä seuraa käsite "kaikki ovat tiedostoja" (Everything is a file), jossa laitteita voitiin käsitellä tiedostojen kaltaisen rajapinnan kautta. Myöhemmin tätä on täsmennetty muotoon "kaikki ovat tiedostokahvoja", jossa tiedostokahva on yhdistävä tekijä.[7]

  • Goldstein, Andrew C.: Files-11 On-Disk Structure Specification. VAX/VMS Software Devlopment, 1985. Teoksen verkkoversio. (englanniksi)
  • MOT: Tietotekniikan liiton ATK-sanakirja 5.0 (Tietotekniikan liitto ry:n sanastotoimikunta) lähde tarkemmin?
  • ATK-sanasto
  1. Nykysuomen sanakirja, osa 5: S-Tr
  2. Syrjänen, Markku: Tiedostorakenteet, s. 115. (Viittaa Aaro Kinnusen monisteeseen Tiedostojen organisointitekniikka (OtaDATA 1969)) OtaDATA, 1973.
  3. Silberschatz & Galvin & Gagne: Operating System Concepts, s. 421-422. (Eighth edition) Wiley, 2009. ISBN 978-0-470-12872-5 (englanniksi)
  4. K. Thompson: UNIX Implementation (PDF) users.soe.ucsc.edu. Viitattu 8.9.2019. (englanniksi)
  5. R. C. Daley & P. G. Neumann: A general-purpose file system for secondary storage dl.acm.org. 1965. doi:10.1145/1463891.1463915 Viitattu 14.4.2022. (englanniksi)
  6. Goldstein, Andrew C.: Files-11 On-Disk Structure Specification. VAX/VMS Software Devlopment, 1985. Teoksen verkkoversio. (englanniksi)
  7. Neil Brown: Ghosts of Unix Past: a historical search for design patterns lwn.net. 27.10.2010. Viitattu 23.10.2020. (englanniksi)