Plan Zarządzania Danymi Badawczymi (PZD)

Plan Zarządzania Danymi Badawczymi (PZD) / Data Management Plan (DMP) to dokument określający, w jaki sposób dane badawcze będą zarządzane podczas projektu badawczego, jak również po jego zakończeniu. Sporządzania takiego planu wymagają między innymi Narodowe Centrum Nauki, Komisja Europejska (w programach Horyzont 2020 i Horyzont Europa), Europejska Rada ds. Badań Naukowych, National Science Foundation ze Stanów Zjednoczonych czy też brytyjskie Research Councils.

UWAGA!

Najważniejszym dokumentem określającym sposób i warunki udostępniania danych badawczych jest umowa z instytucją finansującą badanie.
W umowie można znaleźć wszelkie zapisy dotyczące zasad publikacji, zarówno artykułów/monografii jaki i danych badawczych powstałych
w ramach realizacji projektu.

Plany Zarzadzania Danymi zawarte we wnioskach do NCN i Programu Horizon składane w WEBCON (Portal Elektronicznego Obiegu Dokumentów UEK) przechodzą przez weryfikację pracowników Biblioteki Głównej UEK. W związku z tym, bardzo prosimy, aby co najmniej na 14 dni przed planowanym złożeniem dokumentów w systemie przesłać przygotowany plan do konsultacji na adres otwartanauka@uek.krakow.pl.

Tym sposobem unikną Państwo ewentualnego odrzucenia wniosku ze względu na konieczność poprawy planu zarządzania danymi.

NCN

Plan Zarządzania Danymi jest narzędziem służącym do efektywnego zarządzania danymi badawczymi. Dokument ten zawiera szczegółowe informacje dotyczące rodzajów danych badawczych, zasad korzystania z tych danych, a także procedur związanych z ich udostępnianiem i archiwizacją w trakcie i po zakończeniu badań naukowych lub procesu badawczego. Od 2019 roku Plan Zarządzania Danymi jest obowiązkowym elementem każdego projektu badawczego realizowanego w ramach konkursów NCN. Warto podkreślić, że jest to dokument „dynamiczny”, czyli może się zmieniać wraz z postępem prac nad projektem. Poprawki w planie możliwe są przy składaniu raportu końcowego, który podlega ocenie przez NCN.

W czym może pomóc dobrze przygotowany Plan Zarządzania Danymi?

– pomaga efektywnie zaplanować proces badawczy oraz monitorować postępy w realizacji badania;
– ułatwia współpracę między naukowcami pracującymi w danym projekcie;
– pomaga skoordynować realizację badań;
– wzmacnia kontrolę dostępu do danych, ich bezpieczeństwo i jakość;
– minimalizuje ryzyka związane z realizacją projektu, np. zabezpieczenia danych osobowych przed ich nieuprawnionym wykorzystaniem;
– wspiera organizację długotrwałego przechowywania danych;

Narodowe Centrum Nauki wyznaczyło sześć obszarów tematycznych, które muszą zostać uwzględnione w planie zarządzania danymi:

  1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych.
  2. Dokumentacja i jakość danych.
  3. Przechowywanie i tworzenie kopii zapasowych podczas badań.
  4. Wymogi prawne, kodeksy postępowania.
  5. Udostępnianie i długotrwałe przechowywanie danych.
  6. Zadania związane z zarządzaniem danymi oraz zasoby.

Jak przygotować plan zarządzania danymi badawczymi?

Narodowe Centrum Nauki przygotowało przewodnik wraz z pytaniami pomocniczymi w języku polskim i języku angielskim oraz odpowiedzi na najczęściej zadawane pytania dotyczące Planu zarzadzania danymi:
Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym.
Guidelines for applicants to complete the Data Management Plan form in the proposal.
Najczęściej zadawane pytania.

W powyższym dokumencie znajduje się następujący komunikat: „NCN dopuszcza, że w ramach niektórych projektów nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze ani inne podobne materiały. W takich wypadkach wymagane jest jednak krótkie uzasadnienie.”

UWAGA!

W projektach, które przewidują wydanie publikacji naukowych należy udostępnić dane badawcze potwierdzające wnioski płynące z tych publikacji. Jeśli artykuł ukazał się w trakcie trwania projektu, to dane badawcze z nim powiązane powinny być udostępnione najpóźniej w momencie jego publikacji. Będzie to weryfikowane podczas składania raportu rocznego.

NCN dopuszcza sytuacje, w ramach których w projekcie nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze ani inne podobne materiały. To jednak rzadkie przypadki, które muszą być dobrze umotywowane.

W przypadku wytwarzania danych badawczych bez możliwości ich udostępnienia (np. w sytuacji eksploatacji przemysłowej, ograniczeń z powodu klauzuli poufności, zasad bezpieczeństwa i dobra publicznego, prawa własności intelektualnej, w tym ochrony patentowej czy tajemnicy handlowej, kwestii etycznych
i ochrony danych osobowych lub ze względu na licencje strony trzeciej) Plan Zarządzania Danymi powinien być wypełniony z uzasadnieniem, dlaczego dane nie będą udostępnione. 

Poniżej zamieszczamy kilka wskazówek dotyczących Planu Zarządzania Danymi (PZD), które zostały opracowane w oparciu o wytyczne NCN. Proszę pamiętać,
by każdorazowo odnieść sugerowane podpowiedzi do faktycznie planowanych działań i założeń swojego projektu. Plany będą oceniane przez ekspertów NCN
w kontekście danego projektu.

Rozpoczynając pracę nad PZD warto:

1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
1.1 W jaki sposób będą pozyskiwane lub wytwarzane nowe dane lub ponownie wykorzystywane dane już istniejące? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– jakie standardy, metody i oprogramowanie posłużą do pozyskiwania lub wytwarzania nowych danych?
– jakie dane już istniejące (własne lub będące w posiadaniu strony trzeciej) zostaną ponownie wytworzone?
– w jaki sposób zostanie udokumentowane pochodzenie danych?
– jak wyglądać będzie organizacja plików i zarządzanie ich różnymi wersjami?
– czy konieczna będzie digitalizacja danych analogowych lub wydanych w formie papierowej (takich jak mapy, fotografie i teksty)?


Dane pierwotne to dane wytworzone w trakcie realizacji przeprowadzanych badań naukowych lub projektów (np. ankiety, kwestionariusze oraz ich analizy, zdjęcia, notatki, analiza zawartości, analiza dokumentów zastanych, oprogramowanie, wyniki symulacji komputerowych, algorytmy, próbki, protokoły laboratoryjne, opisy metodologiczne itp.);

Dane wtórne to dane pochodzące z wcześniejszych badań, analiz lub dokumentów źródłowych (np. opublikowane wcześniej zbiory danych badawczych, wydane publikacje, zbiory biblioteczne, archiwalne, akty prawne, dokumenty urzędowe (np. GUS), zestawienia, statystyki itp.).
W tym punkcie należy:

opisać w jaki sposób dane pierwotne zostaną zgromadzone lub wytworzone oraz skąd pochodzą dane wtórne
               » dla danych pierwotnych można napisać, że (w zależności od projektu) dane będą wytwarzane np. podczas kwerend,  badań terenowych,  badań laboratoryjnych,  eksperymentów, wywiadów pogłębionych, obserwacji itp.
            » dla danych wtórnych należy podać źródło lub źródła, z których zostaną pozyskane, w jaki sposób dane będą opracowane (w jakim programie, co zostanie wytworzone na ich podstawie np.: zestawienia, wykresy, tabele, itp.) oraz wszelkie ograniczenia dotyczące ich ponownego wykorzystania (np. licencje, umowy, prawa własności).

 w przypadku istnienia już podobnych lub takich samych danych trzeba wyjaśnić dlaczego należy gromadzić nowe dane zamiast wykorzystać już istniejące.

NCN dopuszcza, że w ramach niektórych projektów nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze ani inne podobne materiały. To jednak rzadkie przypadki, które muszą być dobrze umotywowane.
 
UWAGA o dostępności
Aby dane wtórne można było bezpiecznie wykorzystać i udostępniać, prosimy sprawdzić, czy na pewno są to dane otwarte, ewentualnie na jakiej licencji są udostępnione. Być może konieczne będzie uzyskanie zgody lub podpisanie odpowiedniej umowy określającej warunki korzystania (jeśli są w posiadaniu strony trzeciej).
W przypadku danych pochodzących z archiwum konieczne będzie uzyskanie zgody na wykorzystanie i ewentualne udostępnienie pozyskanych danych.
 
UWAGA o umowach
Jeśli planują Państwo skorzystać z usług firmy zewnętrznej, która wykona określone badania (np. przeprowadzenie ankiety), to wybraną firmę trzeba poinformować o wytycznych narzuconych przez NCN oraz o założeniach PZD, tak aby podpisana umowa odpowiednio regulowała kwestie własności danych oraz ich udostępniania w otwartym repozytorium.
W momencie zlecenia opracowania raportu lub analizy trzeba dopilnować aby w umowie znalazł się paragraf o przekazaniu danych badawczych na podstawie których dokument został opracowany. Dane powinny być przekazane na licencji CC0. Takie dane będzie można udostępnić np. w repozytorium.
 
UWAGA o digitalizacji
Jeżeli konieczna będzie digitalizacja danych analogowych lub wydanych w formie papierowej (takich jak mapy, fotografie, teksty), to należy o tym fakcie napisać. W sytuacji, kiedy będzie to generować dodatkowe koszty, prosimy o ich oszacowanie i opisanie w punkcie 6.2 (w ramach kosztów pośrednich).
 
UWAGA o otwartości danych
Dane badawcze powinny być „tak otwarte, jak to możliwe – tak zamknięte, jak to niezbędne”.
W związku z tym, NCN dopuszcza przypadki, w których udostępnienie danych w otwartej formule może okazać się niemożliwe. W takiej sytuacji należy jednak obligatoryjnie zamieścić krótkie uzasadnienie.
 
Możliwe są również ograniczenia w udostępnianiu danych badawczych, na przykład w przypadku eksploatacji przemysłowej, ograniczeń z powodu klauzuli poufności, zasad bezpieczeństwa i dobra publicznego, prawa własności intelektualnej, w tym ochrony patentowej czy tajemnicy handlowej, kwestii etycznych i ochrony danych osobowych lub ze względu na licencje strony trzeciej. Jeśli dotyczy to Państwa projektu, to należy zamieścić informację o ograniczeniu, wraz z wyjaśnieniem jego przyczyny.
 
Warto mieć na uwadze, że nawet te dane, które z wyżej wymienionych względów nie mogą być upublicznione, można i tak zdeponować w repozytorium obejmując je czasowym embargiem lub zamykając wieczyście. Korzyść płynąca z takiego rozwiązania to zwiększenie widoczności badań
i działalności naukowej dzięki metadanym opisującym zdeponowany zbiór danych.

1.2 Jakie dane (tj. rodzaje, formaty, objętości) będą pozyskiwane lub wytwarzane w projekcie? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– jaki rodzaj, format i objętość danych planują Państwo pozyskać, wytworzyć lub ponownie wykorzystać?

W tym punkcie należy podać:

jakiego rodzaju dane będą wytwarzane lub pozyskiwane w trakcie projektu.  Mogą to być
np. dane tekstowe, dane liczbowe, nagrania audio, wideo, zdjęcia, zawartość bazy danych, oprogramowanie, wyniki symulacji komputerowych, kody źródłowe itp.

w jakich formatach będą zapisane te dane. W momencie zbierania danych warto nadawać pierwszeństwo standardowym otwartym formatom (np. .odt, .csv, .wav, .avi, .pdf i inne).
 
Formaty pakietu Microsoft Office nie są formatami otwartymi, ponieważ do ich utworzenia potrzebne jest oprogramowanie płatne.
 
Jeżeli zamierzają Państwo gromadzić lub wytwarzać dane w formatach zamkniętych, prosimy
o rozważenie konwersji do formatów otwartych (preferowanych przez NCN) przynajmniej tej części danych badawczych, która zostanie wyselekcjonowana do udostępnienia w otwartym repozytorium.
Jeśli nie będzie można dokonać konwersji to należy to uzasadnić w planie. Dodatkowo, w momencie deponowania i udostępniania danych badawczych w otwartym repozytorium należy dołączyć odpowiednią dokumentację, np. plik typu README, który będzie informował potencjalnych użytkowników o tym, jak skorzystać z tych danych i jaki program jest wymagany do ich odczytu
(w przypadku danych zapisanych w formatach zamkniętych).

jaki będzie szacunkowy rozmiar danych, w tym rozmiar kopii zapasowych (wyrażony w KB, MB, GB lub TB). W wyjątkowych sytuacjach można wpisać, że w momencie składania wniosku nie jest możliwe oszacowanie rozmiaru danych.

2. Dokumentacja i jakość danych
2.1 Jakie metadane i dokumentacja (np. metodologia oraz sposoby pozyskiwania i organizacji danych) będą towarzyszyć danym w projekcie? LIMIT: 2000 znaków
 
Warto rozważyć następujące kwestie:
– jakie informacje należy uzupełnić aby potencjalni użytkownicy (ludzie jak i komputery) byli w stanie w przyszłości odczytać i zinterpretować zebrane dane?
– czy możliwe jest ich komputerowe odczytanie?
– w jaki sposób powstawanie odpowiednia dokumentacja?
– jakie standardy środowiskowe (jeżeli w ogóle) posłużą do objaśnienia (meta)danych?
– jakie międzynarodowe standardy lub schematy (tj. Dublin Core, DDI) posłużą do organizacji metadanych?

W tym punkcie proszę zastanowić się nad planowanym sposobem organizacji pozyskanych danych, a następnie:

opisać przyjętą konwencję porządkowania danych: foldery i subfoldery, nazwy plików, wersje, np.
            » dane będą przechowywane w oddzielnych folderach…
            » tytuły plików będą w sposób jasny opisywały zawartość…
            » wersje będą tworzone…

napisać w jakim standardzie będą tworzone metadane. Ta kwestia jest połączona z wyborem repozytorium – jeśli zdecydują się Państwo umieścić swoje dane w RODBUK (Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich), to można napisać, że standardem zapisu metadanych stosowanym w RODBUK jest Dublin Core. Jeśli dane będą deponowane w innym repozytorium, to należy sprawdzić jaki standard zapisu metadanych jest tam wykorzystywany i podać tę informację (np. DDI, DataCite).

określić jak będzie wyglądać dodatkowa dokumentacja potrzebna do umożliwienia ponownego wykorzystania danych, wskazując gdzie informacje zostaną zapisane (np. baza danych z linkami do każdego elementu, plik tekstowy README, nagłówki plików, książki kodów lub zeszyty laboratoryjne)
            » informacje o przeprowadzonym badaniu jak i organizacji danych zdeponowanych w repozytorium będą zawarte w pliku README dołączonym do zbioru danych (datasetu).

UWAGA
Nawet jeśli projekt zakłada wykorzystanie tylko danych wtórnych pozyskanych np. z baz danych, to również należy opisać jaki będzie proces zarządzania pobranymi danymi, tj. jak będą organizowane folder/pliki, np. dzień pobrania, źródło, podstawowe informacje określające zawartość poszczególnych plików, itp. W przypadku danych wtórnych ważne jest prowadzenie odpowiedniej dokumentacji, która będzie potwierdzać pochodzenie takich danych.

2.2 Jakie planują Państwo zastosować środki kontroli jakości?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– w jaki sposób metody pozyskiwania, analizy i przetwarzania danych mogą wpływać na jakość?
– w jaki sposób można wyeliminować błędy pomiarowe i problem stronniczości?
– w jaki sposób zminimalizować ryzyko dotyczące poprawności danych?
W punkcie tym należy zawrzeć następujące informacje:

w jaki sposób będzie prowadzona kontrola jakości danych, np.
            » kto będzie przeprowadzał kontrolę jakości danych?
            » w przypadku badań laboratoryjnych należy opisać, jakie procedury zostaną wdrożone, by uzyskać wyniki najwyższej jakości oraz uniknąć błędu pomiaru. Jeśli laboratorium działa w oparciu
o określone procedury bezpiecznego i właściwego przeprowadzania badań, to warto się na nie powołać.
            » czy w trakcie badań, np. laboratoryjnych, urządzenia będą odpowiednio skalibrowane według instrukcji producenta, by uzyskać wyniki najwyżej jakości?
            » czy dane będą sprawdzane przez wykwalifikowany personel w trakcie badań laboratoryjnych?
            » czy projekt zakłada wykorzystanie specjalistycznego programu do sprawdzenia i analizy danych? itp.

jeśli dane ilościowe będą wymagać czyszczenia, należy opisać w jaki sposób będzie prowadzone czyszczenie tych danych, tak aby mogły być udostępniane i wykorzystywane przez innych.

w jaki sposób dane zostaną zabezpieczone przed nieuprawnioną modyfikacją. W tym miejscu należy wskazać przyjęte w instytucji mechanizmy mające na celu zabezpieczenie danych przed nieuprawnioną modyfikacją, np. procedury autoryzacji dostępu, odzyskiwania danych, regulamin pracy w chmurze.

UWAGA:
W przypadku współpracy kilku instytucji, należy opisać jak będzie przebiegał proces kontroli jakości danych w każdej z tych instytucji.

3. Przechowywanie i tworzenie kopii zapasowych podczas badań
3.1 W jaki sposób w trakcie projektu będą przechowywane dane i metadane? W jaki sposób będą tworzone ich kopie zapasowe?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– jaką dysponują Państwo pojemnością pamięci i gdzie będą przechowywane dane?
– jak wyglądają procedury tworzenia kopii zapasowych?
– czy potrzebne będą specjalne metody przenoszenia danych z urządzeń mobilnych, stanowisk terenowych lub sprzętu domowego na główny serwer w miejscu pracy?
NCN promuje tworzenie kopii zapasowych, najlepiej w zgodzie z zasadą 3-2-1 (polega ona na tym, że przechowuje się przynajmniej trzy kopie swoich danych, dwie kopie na różnych urządzeniach,
z których jedno znajduje się w innej lokalizacji niż np. siedziba firmy). Odnosząc się do tych zaleceń, należy w tym miejscu opisać, gdzie będą przechowywane dane i w jaki sposób będą tworzone kopie zapasowe.

Można rozważyć następujące opcje, które są dostępne z ramienia UEK:

laptop służbowy (zabezpieczony hasłem, posiadający zainstalowany program antywirusowy), kopia zapasowa tworzona będzie …(co jaki czas?)… ;

komputer stacjonarny służbowy (zabezpieczony hasłem, posiadający zainstalowany program antywirusowy), kopia zapasowa tworzona będzie … (co jaki czas?) …;

chmura UEK (drive.uek.krakow.pl) posiada 5 GB miejsca dla każdego pracownika, dane projektu będą zabezpieczone poprzez login i hasło, kopia zapasowa tworzona będzie raz na 2 dni;

dysk OneDrive w chmurze Microsoft – posiada 1 TB miejsca dla każdego pracownika
z możliwością zwiększenia do 5 TB, pliki mogą być udostępniane bezpośrednio innym członkom zespołu badawczego. Kopia zapasowa tworzona będzie przez kierownika projektu … (co jaki czas?) …;

dodatkowo może być dysk zewnętrzny zakupiony w ramach projektu, (zabezpieczony hasłem), kopia zapasowa tworzona będzie … (co jaki czas?) …, (informacja o kosztach zakupu dysku powinna być uwzględniona w punkcie 6.2).
 
Przechowywanie danych na pendrive’ach, płytach CD lub DVD nie jest preferowane.
 
W przypadku badań terenowych należy opisać procedurę przenoszenia danych z urządzeń mobilnych i/lub stanowisk terenowych na główny serwer w miejscu pracy.
 
W przypadku zbierania danych na laptopie w czasie wyjazdu badawczego, proszę opisać w jaki sposób będą tworzone kopie zapasowe danych.

UWAGA
W przypadku współpracy kilku instytucji, należy opisać jak będzie przebiegał proces przechowywania danych w każdej z tych instytucji oraz jak będzie wyglądać wymiana danych pomiędzy instytucjami.

3.2 W jaki sposób zostanie zapewnione bezpieczeństwo i ochrona danych wrażliwych w okresie trwania projektu?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– w jaki sposób można będzie odzyskać dane utracone w wyniku incydentu?
– kto uzyska dostęp do danych w czasie trwania projektu i jak wyglądać będzie kontrola dostępu do danych, zwłaszcza w przypadku współpracy między kilkoma partnerami?
 
Dane wrażliwe: dane osobowe ujawniające pochodzenie rasowe lub etniczne, poglądy polityczne, przekonania religijne lub światopoglądowe, przynależność do związków zawodowych, dane genetyczne lub dane biometryczne do celów jednoznacznego zidentyfikowania osoby fizycznej, dane dotyczące zdrowia, seksualności lub orientacji seksualnej danej osoby, bądź dane dotyczące wyroków skazujących i czynów zabronionych.
 
Anonimizacja danych to przetworzenie danych w taki sposób, że nie jest możliwe przypisanie informacji do określonej lub możliwej do określenia osoby fizycznej.
Bezpieczny anonimizator dokumentów, dzięki któremu można usunąć wrażliwe dane.
 
Pseudonimizacja oznacza przetworzenie danych osobowych w taki sposób, by nie można ich było już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji, pod warunkiem że takie dodatkowe informacje są przechowywane osobno i są objęte środkami technicznymi i organizacyjnymi uniemożliwiającymi ich przypisanie zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej. (RODO, artykuł 4, punkt 5)
Jeśli projekt nie zakłada przetwarzania danych wrażliwych, to trzeba napisać np.: „Dane wrażliwe nie będą przetwarzane w tym projekcie” lub „W badaniu nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych wrażliwych.”
 
Ponadto, należy odnieść się do następujących kwestii względem wszystkich gromadzonych danych:
gdzie dane będą przechowywane?
w jaki sposób dane zostaną odzyskane w przypadku incydentu?
w jaki sposób będą chronione przed nieuprawnionym dostępem (np. ochrona hasłem)?
czy dane umożliwiające identyfikację zostaną zanonimizowane lub zpseudonimizowane? A jeśli tak, to gdzie będzie przechowywany skrypt szyfrów do danych zpseudonimizowanych? (NCN zaleca inne pomieszczenie niż to, gdzie będą przechowywane dane);
kto będzie miał dostęp do danych (kierownik projektu, członkowie zespołu badawczego)?
 
Natomiast jeżeli projekt zakłada wykorzystanie danych wrażliwych, to należy planowane działania w zakresie przetwarzania i udostępniania takich danych skonsultować z uczelnianym Inspektorem Ochrony Danych UEK. Pozwoli to na uniknięcie potencjalnych błędów na dalszych etapach projektu. Informacja o takiej konsultacji (przeprowadzonej lub planowanej) będzie w tym punkcie dobrze widziana.

Warto także powołać się na wybrane akty prawa wewnętrznego UEK mające zastosowanie do projektu, np.
polityka bezpieczeństwa w zakresie danych osobowych;
instrukcja zarządzania systemem informatycznym;
procedura zarządzania incydentami bezpieczeństwa informacji;
polityka czystego biurka;
regulamin pracy w chmurze.
 
UWAGA
W razie współpracy kilku instytucji należy opisać procedurę postępowania z danymi wrażliwymi
w każdej instytucji, w tym procedurę udostępniania danych między jednostkami.

4. Wymogi prawne, kodeks postępowania
4.1 Jeżeli będzie miało miejsce przetwarzanie danych osobowych, w jaki sposób zostanie zapewniona zgodność z przepisami dotyczącymi danych osobowych oraz ich ochrony? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– czy w procesie pozyskiwania danych niezbędna będzie ich anonimizacja?
– czy należy usunąć informacje umożliwiające identyfikację osób lub zataić tożsamość uczestników (np. za pomocą pseudonimizacji) przed udostępnieniem danych?

Dane osobowe oznaczają informacje o zidentyfikowanej lub
możliwej do zidentyfikowania osobie fizycznej („osobie, której dane
dotyczą”); możliwa do zidentyfikowania osoba fizyczna to osoba,
którą można bezpośrednio lub pośrednio zidentyfikować,
w szczególności na podstawie identyfikatora takiego jak imię
i nazwisko, numer identyfikacyjny, dane o lokalizacji, identyfikator internetowy lub jeden bądź kilka szczególnych czynników określających fizyczną, fizjologiczną, genetyczną, psychiczną, ekonomiczną, kulturową lub społeczną tożsamość osoby fizycznej.
(RODO, artykuł 4, punkt 1)
Jeśli projekt nie zakłada przetwarzania danych osobowych, to wystarczy napisać np.: „Dane osobowe nie będą przetwarzane w tym projekcie” lub „W badaniu nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych osobowych.”
 
Natomiast jeżeli projekt zakłada wykorzystanie danych osobowych, to planowane działania
w zakresie zbierania i przetwarzania danych należy skonsultować z uczelnianym Inspektorem Ochrony Danych UEK (iod@uek.krakow.pl). Pozwoli to na uniknięcie potencjalnych błędów na dalszych etapach projektu. Informacja o takiej konsultacji (przeprowadzonej lub planowanej)
będzie w tym punkcie dobrze widziana.
 
Warto również dodać informacje:
jeśli planują Państwo pseudonimizację lub anonimizację danych (np. w  przypadku wywiadów czy ankiet), to należy wyjaśnić, jak ten proces będzie przebiegał;

warto zadeklarować stosowanie się do konkretnych przepisów prawnych obowiązujących na UEK, np. Polityki bezpieczeństwa w zakresie ochrony danych osobowych – załącznik nr 1 do Zarządzenia Rektora (R.0211.34.2022 z dnia 4 lipca 2022 roku).
  
UWAGA
W przypadku realizacji badań, w trakcie których będą zbierane i przetwarzane dane osobowe, konieczne będzie uzyskanie świadomej zgody uczestników na utrwalanie i udostępnianie ich danych osobowych.

W przypadku pełnej anonimizacji zgoda na udostępnianie danych nie jest wymagana, ale jest
to elementem kodeksu etyki badawczej, kultury badawczej i dobrej praktyki, aby zarówno
informacja jak i zgoda uwzględniały:
➢ informację o archiwizowaniu danych badawczych i osobowych (dane osobowe będą
bezpiecznie przechowywane, będą niejawne i ostatecznie zniszczone a zanonimizowane
dane badawcze będą jawne, udostępniane innym i przechowywane przez czas określony
w wytycznych organizacji finansującej badanie;
➢ informację o długoterminowym przechowywaniu i wykorzystaniu zanonimizowanych
danych;
➢ oświadczenie uczestnika badania potwierdzające świadomą zgodę na udział.

4.2 W jaki sposób planują Państwo zapewnić zgodność z innymi przepisami, takimi jak prawa własności intelektualnej i prawa własności? Jakie przepisy znajdują w tym przypadku zastosowanie? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– kto będzie właścicielem danych?
– jakie zostaną zastosowane licencje?
– jakie będą ograniczenia ponownego wykorzystania danych pochodzących od osób trzecich?
– czy przed udostępnieniem danych będzie uzyskanie odpowiedniego zezwolenia w zakresie praw autorskich?
W tym punkcie należy wskazać jakie przepisy dotyczące prawa własności intelektualnej zostaną zastosowane w trakcie realizacji projektu:
 
w zakresie praw własności intelektualnej stosowane będą: 
Ustawa o prawie autorskim i prawach pokrewnych
Ustawa Prawo własności przemysłowej;
Regulamin Zarządzania Dobrami Własności Intelektualnej i Przemysłowej oraz Zasadami Komercjalizacji w UEK (Załącznik do Uchwały Senatu nr 11/2015 z dnia 9 marca 2015 roku);
– umowa podpisana z podmiotem finansującym badania;
– oraz jeśli do zdeponowania danych badawczych został wybrany RODBUK to Regulamin Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK
 
Należy także zawrzeć następujące informacje:
kto będzie właścicielem danych badawczych zgromadzonych i wytworzonych w ramach projektu?
UWAGA
W przypadku współpracy kilku instytucji konieczne będzie podpisanie wspólnej umowy dotyczącej praw własności intelektualnej.
 
w przypadku wykorzystania danych pozyskanych od osób trzecich należy napisać, czy istnieją jakiekolwiek ograniczenia prawne dotyczące ponownego wykorzystania tych danych, zwłaszcza
w przypadku licencji i/lub umów, na podstawie których zostały udostępnione.
 
na jakiej licencji zostaną udostępnione dane wyselekcjonowane do otwartego repozytorium?
Aktualnie, zgodnie z wytycznymi NCN dane badawcze towarzyszące publikacji i potwierdzające wyniki w niej zawarte, powinny zostać udostępnione na licencji Creative Commons: CC0 lub CC BY (dane upublicznione do 31.12.2025).
 
Jeśli chodzi o licencje dla baz danych, to można wybrać PDDL, ODC lub ODbl), a dla programów komputerowych GNU GPL lub GNU LGPL).
 
Więcej o licencjach.

UWAGA
Jeżeli dane będą pozyskiwane na zamówienie przez podmioty zewnętrzne, należy zadbać o zawarcie odpowiednich umów prawnych, które będą regulowały kwestie m.in. własności intelektualnej,
czy możliwości udostępniania danych. Warto wówczas mieć na uwadze wymogi stawiane przez NCN co do otwierania danych badawczych i informować takie instytucje o PZD oraz wytycznych NCN, zwłaszcza w kwestii udostępniania danych badawczych na licencji CC0 lub CC BY (dane upublicznione do 31.12.2025).
5. Udostępnianie i długotrwałe przechowywanie danych
5.1 Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy istnieją ewentualne ograniczenia i zakazy dotyczące ich udostępniania? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
–  jaki sposób o Państwa danych dowiedzą się potencjalni użytkownicy?
– czy istnieją jakieś ograniczenia i przeszkody uniemożliwiające ich pełne lub częściowe udostępnienie?
– czy wydawcy czasopism będą wymagać składowania danych na poparcie ustaleń publikacji?
– czy udostępnienie danych wymaga zgody uczestników badania?
W punkcie tym muszą się znaleźć odpowiedzi na następujące pytania:
jaki jest planowany termin udostępnienia danych?
NCN obliguje grantobiorców, by dane badawcze udostępnić najpóźniej w dniu ukazania się publikacji towarzyszącej/ towarzyszącym projektowi.
 
jak długo dane będą przechowywane?
Ze względu na ewentualną przydatność i wartość danych badawczych, całość zebranych danych najlepiej przechowywać np. w archiwum kierownika przez minimum 10 lat. Jeśli chodzi o przechowywanie danych udostępnionych w repozytorium to minimalny okres przechowywania także trwa 10 lat. Wybierając repozytorium należy sprawdzić na jaki okres repozytorium zobowiązuje się przechowywać dane. Repozytorium RODBUK przechowuje dane bezterminowo.
 
jakie są ewentualne ograniczenia i zakazy dotyczące udostępnienia danych?
W przypadku ograniczeń dotyczących udostępniania części lub całości danych, należy opisać jakie dane i z jakich powodów nie zostaną udostępnione.
 
UWAGA
Danych można nie udostępniać tylko w przypadku, kiedy:
w projekcie przetwarzane są dane osobowe w tym dane wrażliwe i niemożliwa jest ich anonimizacja lub pseudonimizacja;

przewidziana jest komercjalizacja wyników badań;

zostały podpisane umowy (np. z firmami zewnętrznymi) zakazujące udostępniania danych;

w projekcie przetwarzane są dane mające wagę państwową np. dotyczące bezpieczeństwa państwowego.
 
W przypadku realizacji badania ankietowego, należy skonsultować się z Inspektorem Ochrony Danych UEK w celu uzgodnienia jaki rodzaj zgód na przetwarzanie danych powinno się uzyskać od respondentów, by w dalszych etapach realizacji projektu móc pozyskane dane udostępnić.

5.2 Jak będzie wyglądać selekcja danych przeznaczonych do utrwalenia i gdzie będą one długoterminowo przechowywane (np. w repozytorium danych, archiwum)? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– które dane trzeba zachować, a które zniszczyć z przyczyn wynikających z umów, przepisów prawnych lub regulacji?
– w jaki sposób zostanie podjęta decyzja o tym, które dane zachować?
– jaka będzie procedura selekcji przeznaczonych do utrwalenia danych?
– z jakiego repozytorium będą Państwo korzysta? Czy przestrzega ono zasad FAIR Data?
– czy państwa instytucja tworzy regularnie kopie zapasowe?
Po pierwsze należy opisać w jaki sposób będzie prowadzona selekcja danych do długotrwałego udostępnienia w otwartym repozytorium. Ważne jest, że:

od kierownika projektu (lub zespołu badawczego) zależy jakie dane zostaną udostępnione. Mogą to być zarówno dane surowe jak i przetworzone, w zależności od projektu i przewidywanych badań, licencji lub umów.

  warunkiem koniecznym narzuconym przez NCN jest, że w pierwszej kolejności należy wyselekcjonować taki zestaw danych, który będzie weryfikował i potwierdzał wnioski zawarte
w publikacji towarzyszącej. Dane wybrane do udostępnienia muszą:
            » spełniać zasady FAIR;
            » prezentować najwyższą jakoś oraz wartość poznawczą.
  należy również napisać informacje o tym, które dane powinny być zniszczone z przyczyn wynikających z umów, przepisów prawnych lub regulacji.

Po drugie trzeba podać w jakim konkretnie repozytorium danych badawczych dane zostaną umieszczone. Rekomendujemy RODBUK (Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich), które jest specjalnie dedykowanym repozytorium dla pracowników naukowych jak
i doktorantów UEK. Spełnia zasady FAIR i jest darmowe.
Można wybrać inne otwarte repozytorium, pod warunkiem że będzie spełniało warunki otwartości zgodnie z zasadami FAIR.
 
Jeśli wybrane przez Państwa repozytorium pobiera opłaty za zdeponowanie danych, prosimy oszacować te koszty i zastanowić się w jaki sposób zostaną zapewnione środki na długotrwałe przechowanie danych (minimum10 lat). Informacje o tych kosztach należy zamieścić w punkcie 6.2.
W tym punkcie należy również zawrzeć informacje o tym, które dane powinny być zniszczone z przyczyn wynikających z umów, przepisów prawnych lub regulacji.

5.3 Jakie metody lub oprogramowanie umożliwiają dostęp do danych i korzystanie z danych? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy aby dane mogły być przechowywane przez dłuższy czas i zachowały dłuższy okres ważności należy je przekształcić do formatu standardowego lub otwartego?
– czy do skanowania lub konwersji niezbędny będzie dodatkowy sprzęt lub oprogramowanie?
– jaki mechanizm posłuży do udostępnienia danych (np. odpowiedzi na żądanie, repozytorium)?
W tym punkcie należy zawrzeć następujące informacje:

w jakim formacie zostaną udostępnione dane w otwartym repozytorium;

jaki sprzęt lub oprogramowanie będzie potrzebne do odczytu tych danych.
 
UWAGA
NCN preferuje standardowe formaty otwarte, aby dostęp do zdeponowanych danych nie wymagał specjalistycznego oprogramowania. Należy zatem rozważyć konwersję danych, zapisanych w formatach zamkniętych. Jeśli taka konwersja jest niemożliwa ze względu na zachowanie jakości danych lub poprawność odczytu, należy podczas deponowania danych w repozytorium, w dołączonym do zbioru danych (datasetu) pliku README zamieścić odpowiednią dokumentację informującą potencjalnych użytkowników o tym, jak skorzystać z tych danych i jaki program jest wymagany do ich odczytu.

5.4 W jaki sposób zagwarantują Państwo stosowanie unikalnego i trwale przypisanego identyfikatora (takiego jak cyfrowy identyfikator dokumentu elektronicznego (DOI) dla każdego zbioru danych? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy trwale przypisany identyfikator zostanie uzyskany?
– jakie istniejące trwałe identyfikatory pozostaną w użyciu (np. cyfrowe identyfikatory dokumentu elektronicznego, numery dostępowe)?

Jeśli wybrane przez Państwa repozytorium zapewnia trwały identyfikator cyfrowy DOI, należy w tym miejscu zawrzeć taką informację. Jeśli nie, warto rozważyć zmianę repozytorium, na takie, które spełnia wymagania NCN.
 
Repozytorium RODBUK nadaje danym badawczym, udostępnionym w formie zbioru danych (datasetu) identyfikator cyfrowy DOI.
6. Zadania związane z zarządzaniem danymi oraz zasoby
6.1 Kto będzie odpowiadał za zarządzanie danymi (tj. kto będzie ich opiekunem)? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– czy Państwa instytucja posiada personel odpowiedzialny za zarządzanie danymi w trakcie trwania projektu, tj. od ich utworzenia, początkowego przechowywania, aż do archiwizacji i długoterminowego przechowywania danych?
– jeśli NIE to kto będzie odpowiedzialny za archiwizację i długoterminowe zarządzanie danymi w Państwa Jednostce?
– jeśli TAK to jakie zajmuje stanowisko w obrębie Jednostki?
– jaką rolę pełni Kierownik projektu w zarządzaniu danymi?
W tym punkcie należy zawrzeć następujące informacje:

kto będzie odpowiedzialny za zarządzanie danymi badawczymi, tj. kto będzie ich opiekunem?

kto będzie odpowiedzialny za gromadzenie, kto za jakość, kto za selekcję, kto za przechowywanie i tworzenie kopii zapasowych, a kto za archiwizację i udostępnianie?

kto będzie odpowiedzialny za wdrożenie i aktualizację Planu Zarządzania Danymi Badawczymi?

czy projekt przewiduje udział innych osób, które będą wspomagały proces zarządzania i opracowywania danych:
– Inspektor Ochrony Danych UEK (w przypadku danych osobowych w tym danych wrażliwych);
– prawnik (w przypadku rozstrzygania kwestii prawnych, np. prawa własności, umowy z podmiotami zewnętrznymi);
– zespół IT (w przypadku gromadzenia danych na serwerach uczelnianych);
– bibliotekarze UEK – w przypadku wybrania Repozytorium RODBUK jako miejsca deponowania danych w zakresie weryfikacji metadanych  i danych badawczych wprowadzanych przez naukowców do RODBUK;
– bibliotekarze UEK we współpracy z informatykami Cyfronet AGH w zakresie archiwizacji
i długoterminowego zarządzania danymi zdeponowanymi w Repozytorium RODBUK.

► jeśli projekt przewidywał współpracę pomiędzy różnymi jednostkami to trzeba opisać koordynację obowiązków w zakresie zarządzania danymi między partnerami.

UWAGA
NCN traktuje jako błąd sytuację, gdy jedna osoba jest odpowiedzialna za wszystkie działania związane z zarządzaniem danymi badawczymi.

6.2 Jakie zasoby zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR? (Jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie? W jaki sposób zostaną opłacone?) LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy potrzebne są dodatkowe zasoby do zarządzania danymi, takie jak osoby, czas, sprzęt lub oprogramowanie?
– jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie?
– w jaki sposób będą opłacone?

Koszty zarządzania danymi badawczymi można pokryć z kosztów pośrednich:
– koszty pośrednie Open Acess w wysokości do 2% przyznanych kosztów bezpośrednich, które mogą być przeznaczone wyłącznie na koszty związane z udostępnianiem publikacji lub danych badawczych w otwartym dostępie;
– pozostałe koszty pośrednie w wysokości do 20% od (wykorzystanych) kosztów bezpośrednich, które mogą być przeznaczone na koszty pośrednio związane z projektem, w tym koszty udostępniania publikacji lub danych badawczych w otwartym dostępie.
Jeśli projekt przewiduje koszty związane z udostępnianiem danych, należy je wymienić. Może
to być np.:
 zakup sprzętu lub usługa digitalizacji danych przeznaczonych do udostępnienia w otwartym repozytorium;
 zakup dysków zewnętrznych dla kopii zapasowych;
 opłata za depozyt danych w repozytorium na cały okres wymaganego przechowywania danych (min. 10 lat).

Jeśli projekt nie będzie generował dodatkowych kosztów związanych z udostępnianiem danych, należy napisać taką informację. Może to być np.:
zdeponowanie danych badawczych w repozytorium, które nie wymaga opłat np. Repozytorium RODBUK;
wykorzystanie istniejącej infrastruktury informatycznej UEK;

UWAGA:
Należy pamiętać o tym, aby publikacje naukowe deponowane w repozytoriach powiązać z opublikowanymi danymi badawczymi.

Plan Zarządzania Danymi a raportowanie:

PZD może zmieniać się w trakcie realizacji projektu (zalecane);

Podczas trwania projektu powinno się notować wszystkie zmiany jakie wynikły względem pierwotnej treści PZD;

Nie ma obowiązku regularnego informowania NCN o zmianach w PZD;

Raport roczny – raportujemy kwestie związane z udostępnianiem danych powiązanych z publikacjami (jeżeli dotyczy);

Raport końcowy: 
– należy przedstawić Plan Zarządzania Danymi zgodny ze stanem faktycznym na koniec realizacji projektu i wyjaśnić różnice w zarządzaniu danymi badawczymi, jakie wystąpiły w tym czasie wobec pierwotnej wersji planu;
– należy podać zestawy udostępnionych danych wraz z metadanymi, nawet gdy dane nie zostały (jeszcze) udostępnione (np. embargo);
– PZD podlega ocenie Zespołów Ekspertów: Ocena: zadowalająca (2 pkt), częściowo zadowalająca (1 pkt), niezadowalająca (0 pkt: wezwanie
do wyjaśnień/uzupełnień, a w przypadku ich braku stosuje się sankcje).

Informacje przygotowane m. in. na podstawie wytycznych i prezentacji Narodowego Centrum Nauki:

– Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym, https://ncn.gov.pl/sites/default/files/pliki/regulaminy/wytyczne_zarzadzanie_danymi.pdf
– Czarny G., Wskazówki dot. weryfikacji planów zarzadzania danymi i otwartych (meta)danych badawczych (prezentacja PDF)
– Galica N., Otwarte dane badawcze w polityce Narodowego Centrum Nauki (08.05.2024) https://www.ncn.gov.pl/sites/default/files/pliki/prezentacje/2024_05_08_otwarte_dane_badawcze_webinarium.pdf

Więcej o danych badawczych:

Strony do tworzenia Data Management Plan:

DMP Tool – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
DMP online – narzędzie bardzo podobne do DMPtool zawierające bazę instytucji finansującej naukę z Wielkiej Brytanii
The Digital Curation Centre (DDC) – brytyjski serwis specjalizujący się w zarządzaniu danymi badawczymi