Siirry pääsisältöön
LibGuides

Tutkimuksen aineistonhallinta

Aineistojen tallentaminen ja organisointi

Hankkeessa kerätyn aineiston hyvät tallennus- ja dokumentointikäytännöt auttavat välttämään virheitä ja sekaannuksia, helpottavat aineiston jakamista eri toimijoiden kesken sekä varmistavat, että aineistot ovat löydettävissä ja käytettävissä tarvittaessa vielä hankkeen jälkeenkin.
Tietoturvan varmistaminen on oleellinen tallennusratkaisujen valintaan vaikuttava tekijä. Tietoturvan varmistaminen edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja erilaisia teknisiä toimenpiteitä, joilla varmistetaan tiedon luottamuksellisuus.

Tiedostojen hallinta

Systemaattinen aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset myös aineistojen mahdolliselle jatkohyödyntämiselle

  • Nimeämiskäytännöt on hyvä suunnitella ja sopia projektin alussa 
  • Nimeämisen tulee olla johdonmukaista ja selkeää
  • Nimien ei tulisi olla liian pitkiä eikä myöskään liian lyhyitä
  • Hyödynnä päivämääriä ja/tai versionumeroita erottamaan tiedoston eri versiot toisistaan
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. projektin nimi, aineiston nimi, tekijä, pvm vuosi-kk-pv, versionumero)
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta lyhenteet ovat ymmärrettävissä. 
  • Vältä erikoismerkkejä ja välilyöntejä

Lue lisää nimeämiskäytännöistä esim. Harvard Collegen oppaasta.

Tiedostomuodon valinta kannattaa tehdä varhaisessa vaiheessa, jotta vältytään esimerkiksi turhilta formaatinmuutoksilta. Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, joten on varauduttava siihen, että jotain tietoa (esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänenlaatu) saattaa hävitä siirrossa.

Tiedostomuodon tulisi olla sellainen, joka on käytettävissä mahdollisimman pitkään. Suosi säilytys- ja siirtokelpoisia tiedostomuotoja. Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

  • Teksti: txt, .odt., .rtf, .csv, PDF/A, .html,.xml
  • Kuva: jpeg, tiff, png, dng
  • Video: MPEG-4 (.mp4), dpx
  • Ääni:  FLAC, aif, aac

Lisätietoja:

Varmuuskopioinnin avulla voidaan pienentää riskiä aineiston vahingoittumiselle tai tuhoutumiselle. Tutkimusaineistoista kannattaa aina säilyttää erilliset työ- ja varmuuskopiot. Varmuuskopioinnin perustana voidaan pitää 3-2-1-sääntöä, jolloin tietoaineistosta tallennetaan vähintään

  • kolme kopiota
  • kahdella eri välineellä
  • yksi fyysisesti erillään muista

Käytännössä tämä voi toteutua esimerkiksi säilyttämällä työkopio oman korkeakoulun automaattisen varmuuskopioinnin piirissä olevalla työasemalla ja tallentamalla aineistosta lisäksi yksi kopio pilvipalveluun ja toinen ulkoiselle tallennusmedialle. Varmuuskopioita tulee muistaa ottaa riittävän usein ja niiden toimivuutta on testattava säännöllisesti. Lisäksi on arvioitava, mistä versioista varmuuskopioita säilytetään, jotta varmistetaan tallennustilan riittävyys.

Lisätietoa:

Aineiston hyvällä dokumentoinnilla varmistetaan aineiston ymmärrettävyys. Dokumentoitavia asioita ovat mm.

  • miten aineisto on kerätty
  • miten aineistoa on käsitelty, kuka ja milloin
  • käytetyt laitteet ja ohjelmistot
  • muuttujien arvot
  • käytetyt koodit ja lyhenteet
  • eri versioiden hallinta
  • laadunvarmistusprosessit
  • muu tieto, jolla varmistat aineiston ymmärrettävyyden

Tietoaineiston yhteyteen on hyvä tehdä erillinen readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu.

Lisätietoa kuvailusta:

Tiedostojen tallentaminen ja tietoturva

Tiedostojen tallennuspaikan valintaan vaikuttavat mm. hankkeen toimijoiden yhteistyötarpeet, tiedostojen koko ja luonne sekä tietoturvaan liittyvät seikat. Tutustu oman organisaatiosi tietoaineiston säilytysohjeisiin sopivan tallennusratkaisun löytämiseksi.

  • Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluontoisesta aineistosta
  • Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen ja muuttumisen tai varastamisen estäminen sekä pääsy- ja käyttöoikeuksien hallinta
  • Tutkimusaineiston tallentamisessa tulee suosia automaattista varmuuskopiointia

Tiedostojen tallennusratkaisuja

Oman korkeakoulun työasemat ja verkkolevyt ovat usein ensisijaisia tallennusratkaisuja tutkimusaineistolle. Tutustu oman organisaatiosi tietoaineiston käsittelyohjeisiin ja suosi aineiston säilytyksessä automaattisen varmuuskopioinnin piirissä olevia tallennusratkaisuja. Selvitä, tarjoaako korkeakoulusi hankkeelle mahdollisuden omaan kansioon, johon pääsy on rajattu vain projektin sisällä.

Pilvipalvelut

  • Esim. Office 365 ja Google Drive mahdollistavat aineistojen tallentamisen yli organisaatiorajojen ja helpottavat täten aineistojen yhteiskäyttöä.
  • Julkisiin pilvipalveluihin ei tule laittaa esimerkiksi opintosuorituksia, opiskelijoiden arviointeja, tutkimussuunnitelmia, henkilötietoja, liike- tai ammattisalaisuuksia arkistointi- tai säilyttämisvelvollisuuden alaiset aineistoja tai muita aineistoja, joihin liittyy tietoturvariski.
  • Vaasan yliopisto sallii tietyin rajauksin luottamuksellisen aineiston tallentamisen salattuna Vaasan yliopiston OwnCloudiin tai O365-palveluun.
  • Tutustu oman korkeakoulusi aineistonkäsittelyohjeisiin varmistaaksesi, että löydät aineistollesi soveltuvan tallennusratkaisun.
  • Korkeakoulujen yhteinen arviointiryhmä on koonnut arviointisivuston, jossa on arvioitu eri pilvipalveluiden tietoturvan tasoa ja palvelun soveltuvuutta käytettäväksi organisaation toiminnassa. Arviointisivuston osoite: pilviohje.eduuni.fi

IDA - tutkimusdatan säilytyspalvelu
Fairdata-palvelukokonaisuuteen sisältyvä tutkimusdatan säilytyspalvelu.
Soveltuu hankkeen aikaiseen datan tallentamiseen ja datan jakamiseen käyttäjien kesken. Myös valmis data voidaan säilyttää IDAssa muuttumattomassa tilassa. Ei sovellu arkaluontoisia henkilötietoja tai biometrisiä tunnisteita sisältävälle datalle eikä myöskään raskaassa käytössä olevalle laskentadatalle tai jatkuvasti muuttuvalle datalle.

Korkeakouluille on varattu IDAaan maksuttomat säilytyskiintiöt.

eDuuni
Eduunin asiakkaita voivat olla koulutuksen, tieteen ja kulttuurin kohdealueella toimivat organisaatiot tai verkostot. Sähköisen työskentelyn ja verkostoitumisen palveluympäristö, joka mahdollistaa joustavan ja turvallisen yhteistyön yli organisaatio- ja ekosysteemirajojen. Maksullinen
 
ePouta - CSC:n palvelu sensitiivisen datan käsittelyyn

SD Connect ja SD Desktop - CSC:n palvelut sensitiivisen datan käsittelyyn ja yhteiskäyttöön (käyttöönotto vuonna 2022)

EUDAT - B2DROP
B2DROP on EUDAT-palvelukokonaisuuteen sisältyvä palvelu, joka soveltuu hankkeen aikaiseen datan tallentamiseen ja datan jakamiseen käyttäjien kesken. EUDAT tarjoaa ilmaisen julkisen perusesiintymän kaikille tutkijoille.

Saavutettavuusseloste Tillgänglighetsutlåtande