CSC:n tutkimusinfrastruktuurin datanhallintapolitiikka
Tämä CSC:n datanhallintapolitiikka (DMPol) ohjeistaa CSC:n datapolitiikan toteuttamista. DMPol edistää hyviä datanhallintakäytäntöjä toiminnassamme ja asiakasyhteistyöverkostoissa. DMPol määrittelee CSC:n tutkimusinfrastruktuurin (RI) datanhallintaa ja kuratointia ohjaavat periaatteet. CSC:n tutkimusinfrastruktuuri on yhteinen kansallinen datanhallinnan ja tieteellisen laskennan tutkimusalusta, joka sisältää palveluita tutkimusdatan koko elinkaarelle.
DMPol ohjeistaa miten tutkimuksen datanhallintapalveluissa käsitellään asiakkaiden ja käyttäjien aineistoja sekä näihin liittyviä metatietoja. DMpol kattaa ohjeistuksen kaikentyyppisille datoille, mukaan lukien hallinnolliset henkilötiedot ja arkaluonteiset tiedot (sensitiivinen data). CSC:n palveluilla voi olla erityisiä käyttöehtoja, palvelukuvauksia ja käytäntöjä palveluiden käyttötarkoituksesta riippuen.
1. Yleiskuvaus tutkimusinfrastruktuurin hallinnollisista tiedoista
CSC tutkimusinfrastruktuurin hallinnolliset tiedot liittyvät tarvittaviin palvelunhallintatietoihin käsittelystä vastaavista nimetyistä henkilöistä, ylläpito-oikeuksista, käyttäjätiedoista, palvelusopimuksista, palveluiden käytöstä ja laskutuksesta. CSC:n palveluissa tapahtuva hallinnollinen henkilötietojen käsittely perustuu oikeutettuun etuumme tai sopimuksen täytäntöönpanoon. Rekisteri sisältää seuraavia tietoja:
- rekisteröidyn perustiedot: nimi*, asiakasnumero, käyttäjätunnus ja/tai muu yksilöivä tunniste, salasana, sukupuoli ja ensisijainen asiointikieli;
- rekisteröidyn yhteystiedot: sähköpostiosoite*, puhelinnumero* ja fyysinen osoite*;
- rekisteröidyn ammatilliset ja tutkimukseen liittyvät tiedot: kotiorganisaatio*, laitos tai laitos, rooli, tieteenala*, kansalaisuus* ja koulutusaste*;
- tutkimuspalveluiden käyttöä koskevat tiedot: rekisteröidyn hankejäsenyydet, resurssisovellukset ja resurssien käyttö;
- kotiorganisaation yhteystiedot: y-tunnukset, yhteyshenkilöiden nimet ja yhteystiedot, tiedot aiemmista ja voimassa olevista sopimuksista ja tilauksista sekä muut tiedot asiakaskohtaamisista;
- teknisten järjestelmien tuottamat käyttäjätiedot, kuten lokit, online-tunnisteet ja
- muut rekisteröidyn nimenomaisella suostumuksella kerätyt tiedot: projektikäyttäjäryhmä: akateeminen, kaupallinen, kurssi tai LUMI suurteholaskenta.
Tähdellä merkittyjä tietoja tarvitaan sopimuksen tai asiakassuhteen luomiseen CSC:n kanssa. CSC:n asiakas- ja sidosryhmärekisterin tietosuojaselosteessa kerrotaan tarkemmin, miten CSC kerää vain palvelun tuottamiseen, palvelun laadun parantamiseen ja käyttökokemukseen tarvittavia tietoja.
Tarkemmat tiedot tietosuojaselosteista:
Fairdata-palveluiden käytön osalta opetus- ja kulttuuriministeriö ylläpitää myös Fairdata-palveluiden ja Pitkäaikaissäilytysratkaisun käyttäjä- ja metatietorekisteriä:
2. Yleiskuvaus tutkimusinfrastruktuurissa (RI) hallinnoitavasta tutkimusdatasta
Yleisenä tutkimusinfrastruktuuripalveluntuottajana CSC tarjoaa tutkimusinfrastruktuuripalveluita kaikille tutkimusaloille. CSC RI tekee tiivistä yhteistyötä useiden muiden tutkimusinfrastruktuurien kanssa edistäen synergioita ja yhteentoimivuutta eri tieteenalojen tutkimusinfrastruktuurien välillä. Palveluita tarjotaan kaikentyyppisille tieteelliselle datalle, jota voidaan käsitellä ja tallentaa digitaalisina objekteina. Tutkimusdatan lähteet vaihtelevat riippuen käyttäjien aktiivisista projekteista käyttäjien aktiivisten projektien mukaan. CSC:n tallennuspalveluihin tallennettu data voidaan optimoida pilveen, konttipilveen tai muuhun tallennusjärjestelmään, mukaan lukien tutkimusaineistojen digitaaliset keskipitkän tai pitkän aikavälin säilytyspalvelut (PAS-palvelut).
CSC:n RI-järjestelmiin tallennettavat tiedot ovat vain CSC:n palveluita käyttävien asiakkaiden määrittelemiä.
Tietotyyppi | Palvelut (2024) |
Hallinnolliset tiedot | eDuuni, s-posti palvelut, palvelutuki, Webropol, Eventilla, palvelujen logit & Todennus- ja valtuutusinfrastruktuuripalvelut (AAI), MyCSC, IdM ja Reppu |
Aktiivinen tutkimustieto | Allas, cPouta, ePouta, Kvasi, LUMI, Mahti, Puhti, Rahti, Chipster, CSC Noppe, SD Desktop, FUNET FileSender |
Dynaaminen tutkimusdata | Allas, Kaivos, Pukki, Sensitiivisten datan palvelut (Sensitive Data Services): SD Connect, SD Desktop, FEGA |
Tutkimusdatan julkaiseminen | Paituli, Fairdata palvelut: IDA, Qvain, Etsin, Sensitiivisen datan palvelut (Sensitive Data Services): FEGA, SD Apply (uudelleenkäyttö) |
Digitaalinen säilyttäminen | Tutkimusaineistojen pitkäaikaissäilytyspalvelu Fairdata PAS-palvelu (osa Fairdata-kokonaisuutta) |
- Linkki CSC:n tutkimuspalveluihin
- CSC:n tutkimuksen ja opetuksen palvelujen yleiset käyttöehdot
- LUMI-supertietokoneen käyttöehdot
3. Henkilötietoja tai sensitiivistä dataa sisältävien tutkimusaineistojen eettisyys ja lainsäädännön noudattaminen
CSC:n tutkimuspalveluiden henkilötietojen käsittelyä koskevat tietojenkäsittelysopimus (DPA) määrittelee oikeudet ja velvollisuudet CSC – Finnish IT Сenter for Science Oy:n (CSC) ja rekisterinpitäjän välillä, kun CSC käsittelee henkilötietoja CSC:n palveluissa rekisterinpitäjän lukuun. Verkkoportaalissa saatavilla olevissa palvelukuvauksissa kerrotaan, millaisia turvatoimia ja rajoituksia palvelu tarjoaa tietojen hallintaan tai jakamiseen.
Tarkemmat tiedot: Tietojenkäsittelysopimus – CSC:n tutkimuksen ja opetuksen palvelut
Jos data sisältää henkilötietoja (mukaan lukien erityiset tietoryhmät), käyttäjän on varmistettava, että datan käsittelyyn tarkoitettu palvelu soveltuu tällaisille tiedoille. Tällöin käyttäjä toimii rekisterinpitäjänä soveltuvan tietosuojalainsäädännön mukaisesti. CSC toimii henkilötietojen käsittelijänä. Kun data sisältää henkilötietoja sisältäen erityisiä tietoryhmiä (esim. arkaluonteisia henkilötietoja), käyttäjä ja CSC toteuttavat tietojenkäsittelysopimuksen ja kuvauksen käsittelytoimista. Käsittelytoimien kuvauslomake löytyy CSC:n asiakasportaalista MyCSC:stä. Nämä asiakirjat yhdessä säätelevät tällaista henkilötietojen käsittelyä.
Lisätietoja: CSC:n tutkimuksen ja opetuksen palvelujen yleiset käyttöehdot
CSC:n tutkimuksen sensitiivisen datan (SD) palvelut on suunniteltu tukemaan turvallista sensitiivisen datan hallintaa käyttäjän omalta tietokoneelta käytettävissä olevien web-käyttöliittymien kautta.
Tarkemmat tiedot: SD Services for Research
4. Tutkimusdatan oikeuksia koskevat sopimukset
Monien CSC:n palveluiden käyttö on maksutonta suomalaisille korkeakouluille (yliopistot, ammattikorkeakoulut), valtion tutkimuslaitoksille tai Kansallisarkistoon sidoksissa oleville käyttäjille, ellei toisin sovita. Käyttäjä voi käyttää palveluita vain käyttöehtojen mukaisesti. Monet palvelut ovat maksuttomia akateemiseen käyttöön ja tiettyyn kapasiteettitasoon asti.
Käyttäjä on vastuussa CSC:n palveluihin tallennetuista tai niiden kautta välitetyistä tiedoista ja hänen tulee noudattaa kaikkia soveltuvia lakeja ja määräyksiä sekä niihin liittyviä linjauksia. Jos data sisältää arkaluonteisia tai luottamuksellisia tietoja, käyttäjä vastaa siitä, että tietojen käsittelyyn käytetty palvelu noudattaa vaadittua tietoturvaa.
Käyttäjä antaa CSC:lle oikeuden päästä käsiksi dataan saavutettavuuden, laadun ja turvallisuuden varmistamiseksi, mihin kuuluu esimerkiksi datan säilyttäminen CSC:n IT-palvelualustalla. Tämä voi tarkoittaa pääsynvalvontaa, automaattista valvontaa tunkeutumisen havaitsemiseksi, varmuuskopioiden ottamista, tietojen kopiointia/siirtämistä tai vikojen toistamista. CSC suojelee tietojen luottamuksellisuutta lainsäädännön määrittämien vastuiden puitteissa.
Palveluiden käytön yhteydessä ei siirry omistus- tai immateriaalioikeuksia (IPR) dataan, ellei toisin sovita. Käyttäjät ovat vastuussa datansa jakamisesta CSC:n projektin sisällä projektin ja omien vaatimustensa mukaisesti. Mikäli käyttäjä lähtee CSC:n projektista, hänen tulee varmistaa, että dataan liittyvistä oikeuksista on sovittu.
Tarkemmat tiedot:
- Security and privacy
- CSC:n tutkimuksen ja opetuksen palvelujen yleiset käyttöehdot
- CSC-projektin vastuuhenkilönä toimimisen edellytykset ja velvollisuudet
Viittausohje: How to cite CSC in a paper
CSC RI. Tutkimusdatan hallinnan yhteinen infrastruktuuri, Suomi
CSC RI. Common infrastructure for research data management, Finland. (engl.)
Lisäksi palveluilla voi olla omia tarkempia viittausohjeita.
5. Dokumentaatio ja metatiedot
CSC tarjoaa tukea, ohjausta ja koulutusta datan dokumentointiin ja metadatan tuottamiseen osana tieteen tuki- ja säilytyspalveluita. CSC:n ohjeet metadatan ja dokumentaation parhaista käytännöistä sisältävät tietoa yhteentoimivuudesta, koneluettavuudesta sekä suositelluista kontrolloiduista sanastoista, käsitesanakirjoista ja ontologioista, ja ne on dokumentoitu ohjeistukseen: CSC guidance on metadata and documentation
Palvelusta ja tietotyypeistä riippuen CSC:n palveluissa on erilaisia teknisiä ja organisatorisia turvatoimia, jotka on kuvattu käyttöehdoissa ja/tai henkilötietojen suojatoimien kuvauksessa (TOMs). Esimerkiksi Fairdata-tallennuspalvelussa on versiointisäännöt julkaistuille tutkimusaineistoille datan eheyden varmistamiseksi.
Tarkemmat tiedot:
Teknisen valvonnan ja sisäisen eheyden lisäksi tietojen laadun ja oikeellisuuden tarkistaminen on tietojen omistajan vastuulla. Tietojen validointi ja laadunvalvonta-arvioinnit ovat osa ISO 27001 -sertifiointia ja FitSM-ohjeistusta.
Pysyvät tunnisteet – CSC:n tunnistepolitiikka
Pysyvä tunniste (PID) tunnistaa ja paikantaa entiteetin riippumatta siitä, missä sitä isännöidään tai julkaistaan, ja mahdollistaa sen yksiselitteisen ja pitkäaikaisen tunnistamisen. Kaikilla datoilla on oltava riittävät ja yksilölliset pysyvät tunnisteet (PID), jotka ovat dokumentoitujen standardien mukaisia. PID:ien käyttö ja käyttöönotto helpottaa tutkijoiden ja heidän tutkimustulostensa yhdistämistä. Tietojen julkaiseminen PID-tunnisteiden, metatietojen ja lisensointitietojen rinnalla on ratkaisevan tärkeää datan uudelleenkäytettävyyden kannalta. DOI-tunnistetta käytetään yleisesti tutkimusaineistoviitteissä.
Metatieto
Tutkimustietovaranto jakaa tietoa Suomessa tehtävästä tutkimuksesta, mukaan lukien Fairdatapalveluissa julkaistut tutkimusaineistot. Fairdata-palveluilla on oma graafinen käyttöliittymä ja loppukäyttäjärajapinta tutkimusdatan kuvaamiseen ja julkaisemiseen, mutta myös olemassa olevaa metadataa voidaan tuoda muista metadatakatalogeista ja organisaatioiden omista metatietovarastoista. Tällaisen organisaatiokäytön edellytyksenä on PID:ien käyttö alkuperäisessä lähteessä, riittävät metatiedot, käyttöoikeuksiin liittyvät tiedot, tieteenala ja ylläpitäjän uskottava tiedonhallinta.
6. Hallinnollisten ja tutkimusaineistojen pääsynvalvonta, varmuuskopiointi, säilytys ja hävittäminen
Pääsynvalvonta
CSC hallinnoi laskentampäristönsä ja siihen liittyvien palveluiden pääsynvalvontaa sekä ylläpitää käyttäjä- ja identiteetinhallintajärjestelmässään rekisteriä käyttäjistä ja käyttäjäryhmistä sekä niiden käyttötarkoituksesta, käyttöoikeuksista, tunnistautumisesta, rajoituksista ja vastuista. CSC ei yleensä hyväksy julkaisemattoman sisällön anonyymiä tallentamista ja lataamista yhdessä ja samassa palvelussa. Vain CSC:n valtuuttamilla henkilöillä tai käyttäjäryhmillä on pääsy CSC:n tietojärjestelmissä oleviin tietoihin, niiden tallentamiseen, muokkaamiseen tai muuhun oikeutettuun tietojen käsittelyyn.
Lisätietoja käyttäjän velvollisuuksista on määritelty tutkimuksen ja opetuksen palveluiden yleisissä käyttöehdoissa.
CSC:n datapalveluiden käyttöoikeudet kirjataan lokiin ja lokeihin päästään käsiksi Suomen tietosuojalainsäädännön, julkisten järjestelmien hyvien käytäntöjen ja tietoturvan hallinnan mukaisesti. CSC noudattaa järjestelmien hallinnassa ja häiriönkäsittelyssä Suomen viranomaismääräyksiä tietoturvallisuuden hallinnasta sekä ISO/IEC 27001:2013 -standardeja. ISO 27001 -sertifikaatti kattaa konesalitoiminnot, ICT- ja laskenta-alustat, IaaS cPouta ja ePouta, pitkäaikaissäilytyspalvelun, SAPA-, Eduuni- ja Tiimeri-yhteistyöalustat, LUMI-isännöinnin ja Funet Miitti -palvelut. Tietoturvallisuuden hallintajärjestelmillä varmistetaan, että CSC:llä on valmiudet johtaa, ohjata ja jatkuvasti kehittää palveluidensa ja toimintojensa tietoturvallisuutta.
Tekniset ja organisatoriset turvatoimet henkilötietojen suojaamiseksi määritellään tarkemmin:
Varmuuskopiot
Varmuuskopiopalveluiden saatavuus on määritelty palvelukuvauksessa. Vain rajoitetut varmuuskopiot otetaan, eikä niitä taata. CSC ei anna mitään takuuta minkään Sisällön palauttamisesta ja kieltäytyy kaikesta vastuusta mistä tahansa syystä kadonneista tiedostoista, ellei toisin ole sovittu. CSC suosittelee, että käyttäjät säilyttävät ajantasaisen kopion sisällöstään muilla tavoin, jos heillä ei ole varaa menettää sitä.
Säilytyspalvelut
Käyttäjille myönnettävät tallennusresurssit voivat vaihdella tutkimustarpeiden mukaan (esim. datan tallennustila 1 TB tai datalaskenta 1 miljoona ydintuntia). Kapasiteetin hallinnalla on tärkeä rooli sen varmistamisessa, että käytettävissä olevia resursseja käytetään optimaalisesti. Palvelutason ylläpitäminen lisääntyneillä vaatimuksilla edellyttää datan tallennus- ja laskenta-alustojen jatkuvaa kapasiteetin seurantaa ja resurssienhallinnan suunnittelua sekä tieteellisen laskentaympäristön hankintaa.
CSC tarjoaa useita vaihtoehtoja datan tallentamiseen data-analyysin aikana ja datan tallentamiseen tutkimusprojektin päättymisen jälkeen. Tallennuspalvelut on kuvattu CSC:n palvelukatalogissa. CSC RI:n palveluilla on omat SLA-tasonsa, joissa ilmoitetaan varmuuskopioinnin, eheyden tarkistuksen ja kulunvalvonnan taso. CSC neuvoo tarkoituksenmukaisen tallennuspalvelun valinnassa: What to consider when choosing a suitable storage solution.
Datan poistaminen
Käyttäjä on vastuussa datan siirtämisestä tai poistamisesta ennen tilinsä sulkemista tai projektin sulkemista. Jos tätä ei ole tehty ajoissa, tiedot poistetaan 90 päivän kuluttua tilin sulkemisesta tai projektin sulkemisesta ilman mahdollisuutta hakea tietoja, ellei toisin ole kirjallisesti sovittu. CSC pyrkii kohtuullisin keinoin ilmoittamaan käyttäjälle ennen tietojen poistamista ja pyydettäessä hakemaan hänen tietonsa ennen niiden poistamista. Datan kopiot voivat jäädä väliaikaisesti varmuuskopiotallennustilaan, mutta pääsyä rajoitetaan tiukasti.
Lisäehtoja tai -vaatimuksia voidaan soveltaa, ja ne ovat saatavilla asiaankuuluvien palvelujen yhteydessä. Lisäehdoista tulee osa Palvelusopimusta (hyväksytyt käyttöehdot, hyväksytty Tietojenkäsittelysopimus – CSC:n tutkimuksen ja opetuksen palvelut ja Service Descriptions) CSC:n kanssa, jos käyttäjä käyttää kyseisiä palveluita.
Lisätietoja: CSC:n tutkimuksen ja opetuksen palvelujen yleiset käyttöehdot
7. Tutkimusdatan ja/tai metadatan avaaminen
CSC edistää avoimen tutkimuksen FAIR-dataperiaatteita (niin avoimia kuin mahdollista ja niin suljettuja kuin on tarpeen) ja edellyttää kansallisten tietosuojalakien noudattamista kaikissa palveluissaan ja toiminnoissaan. Tietojen uudelleenkäyttöön kannustetaan mahdollisuuksien mukaan. Tähän tarjotaan mahdollisuuksia tallentaa tietoja data repositorioihin ja/tai hallinnoimalla dataa asianmukaisilla lisensseillä, jotka määrittelevät julkisuuden asteen ja käyttöoikeudet. Käyttörajoituksia voidaan toteuttaa käyttöehtojen, sopimusperusteisten tai oikeudellisten syiden perusteella.
CSC ei julkaise tai kuratoi tietoja käyttäjä- tai asiakasorganisaation puolesta ilman sopimusta. Käyttäjä vastaa kaiken julkaistun datan lisensoinnista sekä datan ja siihen liittyvän metadatan pitämisestä ajan tasalla. Kaikella datalle tulee olla nimetty yhteyspiste käyttöoikeuksien hallinnoinnin helpottamiseksi. Ohjeet datan lisenssoinnista ja oikeuksien määrittämisestä: Licensing & rights (engl).
CSC suosittelee kansallisten pitäaikaissäilytyspalveluiden ja ELIXIR:in hyväksymien tiedostomuotojen käyttöä biotieteiden datalle.
Datan jakaminen onnistuu myös aktiivisella datalla. Datan omistaja vastaa huolellisesta oikeuksien hallinnasta palveluissa, jotka mahdollistavat yhteistyön projektin sisällä tai ulkoisten kumppaneiden kanssa. Esimerkiksi dataa voidaan jakaa Allas-objektivarastosta joko rajatulle yleisölle, esim. muihin projekteihin, tai pääsy voidaan sallia kaikille julkistamalla data.
Metadataa voidaan julkaista Fairdata-palveluiden kautta, jotka mahdollistavat todennettavan ja toistettavan tieteen sekä turvallisen säilymisen. Fairdata Services -metatietomalli perustuu DCAT-ontologiaan. CSC:n RI on myös linjassa tulevan Tutkimustietovarannon kanssa mahdollistaen yhteentoimivan metadatan.
CSC:n SD-palvelut mahdollistavat datan turvallisen avaamisen ja sensitiivisen datan käytön yhteistyöprojekteissa: SD Connect tallentamiseen ja jakamiseen, SD Submit ja Federated EGA valvotussa julkaisemiseen (pilottivaiheessa) ja SD Apply datan uudelleenkäyttöön (pilottivaiheessa).