Metadata er informasjon som beskriver annen informasjon, altså data om data. Denne informasjonen gjør de faktiske dataene mer informative og lettere å tolke. Innen IT referer metadata ofte til integrert tilleggsinformasjon i filformater som tekstdokumenter, bildefiler eller videofiler. Metadata finnes imidlertid på mange nivåer og former.

Faktaboks

Etymologi
av meta- som betyr over og data som betyr opplysning. Over henviser her på noe som er på et høyere eller mer abstrakt nivå.
Også kjent som
metainformasjon, beskrivende informasjon, tilleggsinformasjon, kataloginformasjon, data om data

Typiske metadata er emneord, tittel og tidspunkt for opprettelse og endring av et dokument. Et innlegg i sosiale medier inneholder ofte metadata i form av tidspunktet posten ble opprettet og hvem som skal kunne se innlegget. Også tagger i innlegg kan sies å være metadata, selv om ordene i seg selv ofte også er en del av innholdet.

Standardisering av metadata

Standardisering av metadata er viktig for maskinell prosessering, presentasjon og søkbarhet. Et standardisert format er også viktig når informasjon og metadata skal overføres mellom systemer, slik at ikke bare selve metadataene, men også hva de representerer, bevares.

Et typisk eksempel på et standardisert format for metadata er Exif som benyttes i bildefiler og inneholder informasjon om tidspunkt for bildet, lokasjon, kamerainnstillinger. ID3 er et mye anvendt format for informasjon om musikkfiler, spesielt MP3, og inneholder informasjon som tittel, artist og album.

Sikkerhet og personvern

Metadata kan i enkelte tilfeller utgjøre en sikkerhetstrussel dersom brukeren ikke vet hvilke metadata som følger med i en fil som distribueres. Dette kan være vanskelig å vite da metadata ofte ikke synes i standardvisningen av en fil, og dermed kan være skjult for brukeren i dokumenter, bilder og e-poster.

Et eksempel kan være en fil med bilde av en person der identiteten er forsøkt anonymisert ved hjelp av sladding eller beskjæring før distribuering på nett. Posisjonsinformasjonen i Exif-dataene kan imidlertid avsløre identiteten dersom bildet er tatt på hjemmeadressen.

Et annet eksempel er endringsloggen i et tekstdokument som kan avsløre tidligere formuleringer av teksten.

Bruk av metadata i bibliotek

Innenfor bibliotekfag brukes metadata til å beskrive publikasjoner, og angi hvor de befinner seg. En viktig hensikt er å støtte brukeren i å finne, identifisere, velge og anskaffe publikasjoner. Det finnes tre typer metadata: Deskriptive, administrative og strukturelle. Metadata kategoriseres ut fra hvordan opplysningene brukes.

  • Deskriptive metadata oppgir identifiserende egenskaper som publikasjonens tittel, forfatter, utgave og forlag, samt beskrivelse av dokumentets innhold. Noen av disse opplysningene gjøres søkbare for gjenfinning. I deskriptive data inngår også opplysninger om hvor en kan finne publikasjonen. Denne type data finnes i bibliotekkataloger.
  • Administrative metadata muliggjør forvaltning av publikasjonen. Det kan være juridiske opplysninger, tekniske data, eller informasjon for preservering av objektet.
  • Strukturelle metadata angir strukturen til et digitalt objekt, slik at det fungerer og kan brukes og navigeres. En digital bok består for eksempel av sider og kapitler. Strukturelle metadata binder dette sammen slik at filene vises som en bok.

Metadata ordnes som regel i en søkbar database. Bruk av metadata øker dermed gjenfinnbarhet (se også katalog).

Metadata og kunstig intelligens

Metadata har lenge vært viktig for at maskiner skal kunne tilby tilpassede tjenester. For eksempel har strukturering av informasjon på internett gjennom annoteringsformater som microdata vært viktig for å bedre funksjoner i søkemotorer. Når for eksempel nettsider som beskriver en oppskrift er annotert med microdata, kan en søkemotor enkelt finne oppskrifter som inneholder visse ingredienser eller har en spesifikk tilberedningstid.

Av den grunn har det derfor vært ansett at metadata vil bli stadig viktigere for å kunne lage bedre tjenester og finne informasjon i stadig større datamengder. Språkmodeller som ChatGPT og lignende tjenester innen kunstig intelligens er imidlertid mindre avhengige av metadata, da de i større grad selv er i stand til å karakterisere informasjonen basert på form og innhold.

Les mer i Store norske leksikon

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg