Plan Zarządzania Danymi Badawczymi (PZD)

Plan Zarządzania Danymi Badawczymi (PZD) / Data Management Plan (DMP) to dokument określający, w jaki sposób dane badawcze będą zarządzane podczas projektu badawczego, jak również po jego zakończeniu. Sporządzania takiego planu wymagają między innymi Narodowe Centrum Nauki, Komisja Europejska (w programach Horyzont 2020 i Horyzont Europa), Europejska Rada ds. Badań Naukowych, National Science Foundation ze Stanów Zjednoczonych czy też brytyjskie Research Councils.

UWAGA!

Najważniejszym dokumentem określającym sposób i warunki udostępniania danych badawczych jest umowa z instytucją finansującą badanie. W umowie można znaleźć wszelkie zapisy dotyczące zasad publikacji, zarówno artykułów/monografii jaki i danych badawczych powstałych w ramach realizacji projektu.

Plany Zarzadzania Danymi zawarte we wnioskach do NCN i Programu Horizon składane w WEBCON (Portal Elektronicznego Obiegu Dokumentów UEK) przechodzą przez weryfikację pracowników Biblioteki Głównej UEK. W związku z tym, bardzo prosimy, aby co najmniej na 14 dni przed planowanym złożeniem dokumentów w systemie przesłać przygotowany plan do konsultacji na adres otwartanauka@uek.krakow.pl.

Tym sposobem unikną Państwo ewentualnego odrzucenia wniosku ze względu na konieczność poprawy planu zarządzania danymi.

NCN

Dokumentem pomocnym przy tworzeniu Planu Zarządzania Danymi dla grantów finansowanych przez NCN jest „Polityka NCN dotycząca otwartego dostępu do publikacji”, która określa wytyczne względem udostępniania danych badawczych:

Dane powiązane (podstawowy zestaw danych) z opublikowanymi artykułami powinny być udostępniane w otwartym repozytorium, tam gdzie to możliwe, zgodnie z warunkami licencji Creative Commons – przekazanie do domeny publicznej (licencja CC0) lub uznanie autorstwa (licencja CC-BY) , ze standardami cytowania danych zawartych w Declaration of Data Citation Principles by FORCE 11 oraz na zasadach zawartych w TOP Guidelines. Wszystkie publikowane metadane muszą spełniać wytyczne podane przez OpenAIRE7 i zawierać adnotację o finansowaniu ze środków projektu (Narodowe Centrum Nauki, numer projektu).

Plan Zarządzania Danymi może się zmieniać wraz z postępem prac nad projektem. Poprawki w planie możliwe są przy składaniu raportów rocznych i raportu końcowego.

Narodowe Centrum Nauki wyznaczyło sześć obszarów tematycznych, które muszą zostać uwzględnione w planie zarządzania danymi:

  1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych.
  2. Dokumentacja i jakość danych.
  3. Przechowywanie i tworzenie kopii zapasowych podczas badań.
  4. Wymogi prawne, kodeksy postępowania.
  5. Udostępnianie i długotrwałe przechowywanie danych.
  6. Zadania związane z zarządzaniem danymi oraz zasoby.

Jak przygotować plan zarządzania danymi badawczymi?

NCN przygotował przewodnik wraz z pytaniami pomocniczymi w języku polskim i języku angielskim:

W powyższym dokumencie znajduje się następujący komunikat: „NCN dopuszcza, że w ramach niektórych projektów nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze ani inne podobne materiały. W takich wypadkach wymagane jest jednak krótkie uzasadnienie.”

UWAGA!

Projekty zakończone publikacją naukową obowiązkowo powinny udostępnić dane badawcze. Dodatkowo jeśli publikacja ukazała się w trakcie trwania projektu to dane badawcze do tego artykułu powinny być udostępnione w momencie jego publikacji. Będzie to weryfikowane podczas składania raportu rocznego.

NCN udostępnił także odpowiedzi na najczęściej zadawane pytania dotyczące planu zarządzania danymi.

Poniżej zamieszczamy kilka wskazówek dotyczących Planu Zarządzania Danymi (PZD), które zostały opracowane w oparciu o wytyczne NCN. Proszę pamiętać, by każdorazowo odnieść sugerowane podpowiedzi do faktycznie planowanych działań i założeń swojego projektu. Plany będą oceniane przez ekspertów NCN w kontekście danego projektu.

Rozpoczynając pracę nad PZD warto:

1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych (
1.1 W jaki sposób będą pozyskiwane lub wytwarzane nowe dane lub ponownie wykorzystywane dane już istniejące? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– jakie standardy, metody i oprogramowanie posłużą do pozyskiwania lub wytwarzania nowych danych?
– jakie dane już istniejące (własne lub będące w posiadaniu strony trzeciej) zostaną ponownie wytworzone?
– w jaki sposób zostanie udokumentowane pochodzenie danych?
– jak wyglądać będzie organizacja plików i zarządzanie ich różnymi wersjami?
– czy konieczna będzie digitalizacja danych analogowych lub wydanych w formie papierowej (takich jak mapy, fotografie i teksty)?


Dane pierwotne to dane wytworzone w trakcie realizacji przeprowadzanych badań naukowych lub projektów (np. ankiety, kwestionariusze, zdjęcia, notatki, oprogramowanie, próbki itp.);

Dane wtórne to dane pochodzące z wcześniejszych badań, analiz lub dokumentów źródłowych (np. zbiory biblioteczne, archiwalne, akty prawne, dokumenty urzędowe, zestawienia, statystyki itp.).
W tym punkcie należy:

opisać dane badawcze, które zostaną wytworzone lub pozyskane na potrzeby projektu. Mogą to być zarówno dane pierwotne, jak i wtórne.

opisać pochodzenie oraz sposoby pozyskania danych badawczych (zarówno w przypadku danych pierwotnych jak i wtórnych):
            » dla danych pierwotnych można napisać, że (w zależności od projektu) dane będą wytwarzane podczas kwerend,  badań terenowych,  badań laboratoryjnych,  eksperymentów, wywiadów pogłębionych, obserwacji itp.
            » dla danych wtórnych należy podać źródło lub źródła, z których zostaną pozyskane oraz w jaki sposób będą opracowywane te dane (w jakim programie, co zostanie wytworzone na ich podstawie np.: zestawienia, wykresy, tabele, itp.)
 
UWAGA o dostępności
Aby dane wtórne można było bezpiecznie wykorzystać i udostępniać, prosimy sprawdzić, czy na pewno są to dane otwarte, ewentualnie na jakiej licencji są udostępnione. Być może konieczne będzie uzyskanie zgody lub podpisanie odpowiedniej umowy określającej warunki korzystania (jeśli są w posiadaniu strony trzeciej).
W przypadku danych pochodzących z archiwum konieczne będzie uzyskanie zgody na wykorzystanie i ewentualne udostępnienie pozyskanych danych.
 
UWAGA o umowach
Jeśli planują Państwo skorzystać z usług firmy zewnętrznej, która wykona określone badania (np. przeprowadzenie ankiety), to wybraną firmę trzeba poinformować o wytycznych narzuconych przez NCN oraz o założeniach PZD, tak aby podpisana umowa odpowiednio regulowała kwestie własności danych oraz ich udostępniania w otwartym repozytorium.
 
UWAGA o digitalizacji
Jeżeli konieczna będzie digitalizacja danych analogowych lub wydanych w formie papierowej (takich jak mapy, fotografie, teksty), to należy o tym fakcie napisać. W sytuacji, kiedy będzie to generować dodatkowe koszty, prosimy o ich oszacowanie i opisanie w punkcie 6.2 (w ramach kosztów pośrednich).
 
UWAGA o otwartości danych
Dane badawcze powinny być „tak otwarte, jak to możliwe – tak zamknięte, jak to niezbędne”. W związku z tym, NCN dopuszcza przypadki, w których udostępnienie danych w otwartej formule może okazać się niemożliwe. W takiej sytuacji należy jednak obligatoryjnie zamieścić krótkie uzasadnienie.
 
Możliwe są również ograniczenia w udostępnianiu danych badawczych, na przykład w przypadku eksploatacji przemysłowej, ograniczeń z powodu klauzuli poufności, zasad bezpieczeństwa i dobra publicznego, prawa własności intelektualnej, w tym ochrony patentowej czy tajemnicy handlowej, kwestii etycznych i ochrony danych osobowych lub ze względu na licencje strony trzeciej. Jeśli dotyczy to Państwa projektu, to należy zamieścić informację o ograniczeniu, wraz z wyjaśnieniem jego przyczyny.
 
Warto mieć na uwadze, że nawet te dane, które z wyżej wymienionych względów nie mogą być upublicznione, można i tak zdeponować w otwartym repozytorium obejmując je czasowym embargiem lub zamykając wieczyście. Korzyść płynąca z takiego rozwiązania to zwiększenie widoczności badań i działalności naukowej dzięki metadanym opisującym zdeponowany zbiór danych.

1.2 Jakie dane (tj. rodzaje, formaty, objętości) będą pozyskiwane lub wytwarzane w projekcie? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– jaki rodzaj, format i objętość danych planują Państwo pozyskać, wytworzyć lub ponownie wykorzystać?

W tym punkcie należy podać:

jakiego rodzaju dane będą wytwarzane lub pozyskiwane w trakcie projektu.  Mogą to być np. dane tekstowe, dane liczbowe, wyniki ankiety lub kwestionariuszy, nagrania audio, wideo, zdjęcia, zawartość bazy danych, oprogramowanie, wyniki symulacji komputerowych itp.

w jakich formatach będą zapisane te dane. W momencie zbierania danych warto nadawać pierwszeństwo standardowym otwartym formatom (np. .odt, .csv, .wav, .avi, .pdf i inne).
 
Formaty pakietu Microsoft Office nie są formatami otwartymi, ponieważ do ich utworzenia potrzebne jest oprogramowanie płatne.
 
Jeżeli zamierzają Państwo gromadzić lub wytwarzać dane w formatach zamkniętych, prosimy o rozważenie konwersji do formatów otwartych (preferowanych przez NCN) przynajmniej tej części danych badawczych, która zostanie wyselekcjonowana do udostępnienia w otwartym repozytorium.
Jeśli nie będzie można dokonać konwersji to należy to uzasadnić w planie. Dodatkowo, w momencie deponowania i udostępniania danych badawczych w otwartym repozytorium należy dołączyć odpowiednią dokumentację, np. plik typu README, który będzie informował potencjalnych użytkowników o tym, jak skorzystać z tych danych i jaki program jest wymagany do ich odczytu (w przypadku danych zapisanych w formatach zamkniętych).

jaki będzie rozmiar danych, w tym rozmiar kopii zapasowych (wyrażony w KB, MB, GB lub TB).
Jeśli w momencie składania wniosku trudno oszacować rozmiar danych, to należy taką informację zawrzeć w planie.

2. Dokumentacja i jakość danych
2.1 Jakie metadane i dokumentacja (np. metodologia oraz sposoby pozyskiwania i organizacji danych) będą towarzyszyć danym w projekcie? LIMIT: 2000 znaków
 
Warto rozważyć następujące kwestie:
– jakie informacje należy uzupełnić aby potencjalni użytkownicy (ludzie jak i komputery) byli w stanie w przyszłości odczytać i zinterpretować zebrane dane?
– czy możliwe jest ich komputerowe odczytanie?
– w jaki sposób powstawanie odpowiednia dokumentacja?
– jakie standardy środowiskowe (jeżeli w ogóle) posłużą do objaśnienia (meta)danych?
– jakie międzynarodowe standardy lub schematy (tj. Dublin Core, DDI) posłużą do organizacji metadanych?

W tym punkcie proszę zastanowić się nad planowanym sposobem organizacji pozyskanych danych, a następnie:

opisać przyjętą konwencję porządkowania danych: foldery i subfoldery, nazwy plików, wersje, np.
            » dane będą przechowywane w oddzielnych folderach…
            » tytuły plików będą w sposób jasny opisywały zawartość…
            » wersje będą tworzone…

napisać w jakim standardzie będą tworzone metadane. Ta kwestia jest połączona z wyborem repozytorium – jeśli zdecydują się Państwo umieścić swoje dane w RODBUK, to można od początku wpisywać, że jest to standard Dublin Core, który jest przypisany do tego repozytorium. Jeśli dane będą deponowane w innym repozytorium, to należy sprawdzić jaki standard zapisu metadanych jest tam wykorzystywany i podać tę informację (np. DDI, DataCite).

wskazać jak będzie wyglądać dodatkowa dokumentacja informująca potencjalnych czytelników o stosowanej metodologii pozyskanych danych (jak zebrano dane, procedury dotyczące analiz, definicje zmiennych, jednostki pomiaru, założenia, itp.), np.
            » informacje o przeprowadzonym badaniu jak i organizacji danych zdeponowanych w repozytorium będą zawarte w pliku README dołączonym do zbioru danych (datasetu), który będzie zawierał….

UWAGA
Nawet jeśli projekt zakłada wykorzystanie tylko danych wtórnych pozyskanych np. z baz danych, to również należy opisać jak będzie się zarządzało pobranymi danymi, tj. jak będą organizowane folder/pliki, np. dzień pobrania, źródło, podstawowe informacje określające zawartość poszczególnych plików, itp. W przypadku danych wtórnych ważne jest prowadzenie odpowiedniej dokumentacji, która będzie potwierdzać pochodzenie takich danych.

2.2 Jakie planują Państwo zastosować środki kontroli jakości?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– w jaki sposób metody pozyskiwania, analizy i przetwarzania danych mogą wpływać na jakość?
– w jaki sposób można wyeliminować błędy pomiarowe i problem stronniczości?
– w jaki sposób zminimalizować ryzyko dotyczące poprawności danych?
W punkcie tym należy zawrzeć następujące informacje:

w jaki sposób będzie prowadzona kontrola jakości danych, np.
            » kto będzie przeprowadzał kontrolę jakości danych?
            » w przypadku badań laboratoryjnych należy opisać, jakie procedury zostaną wdrożone, by uzyskać wyniki najwyższej jakości oraz uniknąć błędu pomiaru. Jeśli laboratorium działa w oparciu o określone procedury bezpiecznego i właściwego przeprowadzania badań, to warto się na nie powołać.
            » czy w trakcie badań, np. laboratoryjnych, urządzenia będą odpowiednio skalibrowane według instrukcji producenta, by uzyskać wyniki najwyżej jakości?
            » czy dane będą sprawdzane przez wykwalifikowany personel w trakcie badań laboratoryjnych?
            » czy projekt zakłada wykorzystanie specjalistycznego programu do sprawdzenia i analizy danych? itp.

jeśli dane ilościowe będą wymagać czyszczenia, należy opisać w jaki sposób będzie prowadzone czyszczenie tych danych, tak aby mogły być udostępniane i wykorzystywane przez innych.

w jaki sposób dane zostaną zabezpieczone przed nieuprawnioną modyfikacją. W tym miejscu należy wskazać przyjęte w instytucji mechanizmy mające na celu zabezpieczenie danych przed nieuprawnioną modyfikacją, np. procedury autoryzacji dostępu, odzyskiwania danych, regulamin pracy w chmurze.

UWAGA:
W przypadku współpracy kilku instytucji, należy opisać jak będzie przebiegał proces kontroli jakości danych w każdej z tych instytucji.

3. Przechowywanie i tworzenie kopii zapasowych podczas badań
3.1 W jaki sposób w trakcie projektu będą przechowywane dane i metadane? W jaki sposób będą tworzone ich kopie zapasowe?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– jaką dysponują Państwo pojemnością pamięci i gdzie będą przechowywane dane?
– jak wyglądają procedury tworzenia kopii zapasowych?
– czy potrzebne będą specjalne metody przenoszenia danych z urządzeń mobilnych, stanowisk terenowych lub sprzętu domowego na główny serwer w miejscu pracy?
NCN promuje tworzenie kopii zapasowych, najlepiej w zgodzie z zasadą 3-2-1 (polega ona na tym, że przechowuje się przynajmniej trzy kopie swoich danych, dwie kopie na różnych urządzeniach, z których jedno znajduje się w innej lokalizacji niż np. siedziba firmy). Odnosząc się do tych zaleceń, należy w tym miejscu opisać, gdzie będą przechowywane dane i w jaki sposób będą tworzone kopie zapasowe.

Można rozważyć następujące opcje, które są dostępne z ramienia UEK:

laptop osobisty / laptop służbowy (zabezpieczony hasłem, posiadający zainstalowany program antywirusowy), kopia zapasowa tworzona będzie …(co jaki czas?)… ;

komputer stacjonarny osobisty /służbowy (zabezpieczony hasłem, posiadający zainstalowany program antywirusowy), kopia zapasowa tworzona będzie … (co jaki czas?) …;

chmura UEK (drive.uek.krakow.pl) posiada 5 GB miejsca dla każdego pracownika, dane projektu będą zabezpieczone poprzez login i hasło, kopia zapasowa tworzona będzie raz na 2 dni;

dysk OneDrive w chmurze Microsoft – posiada 1 TB miejsca dla każdego pracownika z możliwością zwiększenia do 5 TB, pliki mogą być udostępniane bezpośrednio innym członkom zespołu badawczego. Kopia zapasowa tworzona będzie przez kierownika projektu … (co jaki czas?) …;

dodatkowo może być dysk zewnętrzny zakupiony w ramach projektu, (zabezpieczony hasłem), kopia zapasowa tworzona będzie … (co jaki czas?) …, (informacja o kosztach zakupu dysku powinna być uwzględniona w punkcie 6.2).
 
Przechowywanie danych na pendrive’ach, płytach CD lub DVD nie jest preferowane.
 
W przypadku badań terenowych należy opisać procedurę przenoszenia danych z urządzeń mobilnych i/lub stanowisk terenowych na główny serwer w miejscu pracy.
 
W przypadku zbierania danych na laptopie w czasie wyjazdu badawczego, proszę opisać w jaki sposób będą tworzone kopie zapasowe danych.

UWAGA
W przypadku współpracy kilku instytucji, należy opisać jak będzie przebiegał proces przechowywania danych w każdej z tych instytucji oraz jak będzie wyglądać wymiana danych pomiędzy instytucjami.

3.2 W jaki sposób zostanie zapewnione bezpieczeństwo i ochrona danych wrażliwych w okresie trwania projektu?
LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– w jaki sposób można będzie odzyskać dane utracone w wyniku incydentu?
– kto uzyska dostęp do danych w czasie trwania projektu i jak wyglądać będzie kontrola dostępu do danych, zwłaszcza w przypadku współpracy między kilkoma partnerami?
 
 
Anonimizacja danych jest to przetworzenie danych w taki sposób, że nie jest możliwe przypisanie informacji do określonej lub możliwej do określenia osoby fizycznej.
 
Pseudonimizacja oznacza przetworzenie danych osobowych w taki sposób, by nie można ich było już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji,pod warunkiem, że takie dodatkowe informacje są przechowywane osobno i są objęte środkami technicznymi i organizacyjnymi uniemożliwiającymi ich przypisanie zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej (RODO, artykuł 4, punkt 5).
Jeśli projekt nie zakłada przetwarzania danych wrażliwych, to wystarczy zawrzeć taką informację, np.: „Dane wrażliwe nie będą przetwarzane w tym projekcie” lub „W badaniu nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych wrażliwych.”

Natomiast jeżeli projekt zakłada wykorzystanie danych wrażliwych, to warto skonsultować z uczelnianym Inspektorem Ochrony Danych planowane działania w zakresie przetwarzania i udostępniania takich danych. Pozwoli to na uniknięcie potencjalnych błędów na dalszych etapach projektu. Informacja o takiej konsultacji (przeprowadzonej lub planowanej) będzie w tym punkcie dobrze widziana.
 
Ponadto, należy odnieść się do następujących kwestii:
gdzie te dane będą przechowywane?
w jaki sposób będą chronione przed nieuprawnionym dostępem (np. ochrona hasłem)?
czy dane umożliwiające identyfikację zostaną zanonimizowane lub zpseudonimizowane? A jeśli tak, to gdzie będzie przechowywany skrypt szyfrów do danych zpseudonimizowanych? (NCN zaleca inne pomieszczenie niż to, gdzie będą przechowywane dane);
kto będzie miał dostęp do danych (kierownik projektu, członkowie zespołu badawczego)?
 
Warto także powołać się na wybrane akty prawa wewnętrznego UEK mające zastosowanie do projektu, np.
polityka bezpieczeństwa w zakresie danych osobowych;
instrukcja zarządzania systemem informatycznym;
procedura zarządzania incydentami bezpieczeństwa informacji;
polityka czystego biurka;
regulamin pracy w chmurze.
 
UWAGA
W razie współpracy kilku instytucji należy opisać procedurę postępowania z danymi wrażliwymi w każdej instytucji, w tym procedurę udostępniania danych między jednostkami.

4. Wymogi prawne, kodeks postępowania
4.1 Jeżeli będzie miało miejsce przetwarzanie danych osobowych, w jaki sposób zostanie zapewniona zgodność z przepisami dotyczącymi danych osobowych oraz ich ochrony? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– czy w procesie pozyskiwania danych niezbędna będzie ich anonimizacja?
– czy należy usunąć informacje umożliwiające identyfikację osób lub zataić tożsamość uczestników (np. za pomocą pseudonimizacji) przed udostępnieniem danych?
Jeśli projekt nie zakłada przetwarzania danych osobowych, to wystarczy zawrzeć taką informację, np.: „Dane osobowe nie będą przetwarzane w tym projekcie” lub „W badaniu nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych osobowych.”
 
Natomiast jeżeli projekt zakłada wykorzystanie danych osobowych, to warto skonsultować z uczelnianym Inspektorem Ochrony Danych (iod@uek.krakow.pl) planowane działania w zakresie zbierania i przetwarzania tych danych. Pozwoli to na uniknięcie potencjalnych błędów na dalszych etapach projektu. Informacja o takiej konsultacji (przeprowadzonej lub planowanej) będzie w tym punkcie dobrze widziana.
 
Warto również dodać informacje:
jeśli planują Państwo pseudonimizację lub anonimizację danych (np. w  przypadku wywiadów czy ankiet), to należy wyjaśnić, jak ten proces będzie przebiegał;

warto zadeklarować stosowanie się do konkretnych przepisów prawnych obowiązujących na UEK, np. Polityki bezpieczeństwa w zakresie ochrony danych osobowych – załącznik nr 1 do Zarządzenia Rektora (R.0211.34.2022 z dnia 4 lipca 2022 roku).
  
UWAGA
W przypadku realizacji badań, w trakcie których będą zbierane i przetwarzane dane osobowe, konieczne będzie uzyskanie świadomej zgody uczestników na utrwalanie i udostępnianie ich danych osobowych.

4.2 W jaki sposób planują Państwo zapewnić zgodność z innymi przepisami, takimi jak prawa własności intelektualnej i prawa własności? Jakie przepisy znajdują w tym przypadku zastosowanie? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– kto będzie właścicielem danych?
– jakie zostaną zastosowane licencje?
– jakie będą ograniczenia ponownego wykorzystania danych pochodzących od osób trzecich?
– czy przed udostępnieniem danych będzie uzyskanie odpowiedniego zezwolenia w zakresie praw autorskich?
W tym punkcie należy wskazać jakie przepisy dotyczące prawa własności intelektualnej zostaną zastosowane w trakcie realizacji projektu:
w przypadku UEK będzie to: Regulamin Zarządzania Dobrami Własności Intelektualnej i Przemysłowej oraz Zasadami Komercjalizacji w UEK (Załącznik do Uchwały Senatu nr 11/2015 z dnia 9 marca 2015 roku).
 
Należy także zawrzeć następujące informacje:
kto będzie właścicielem danych badawczych zgromadzonych i wytworzonych w ramach projektu?
UWAGA
W przypadku współpracy kilku instytucji konieczne będzie podpisanie wspólnej umowy dotyczącej praw własności intelektualnej.
 
w przypadku wykorzystania danych pozyskanych od osób trzecich należy napisać, czy istnieją jakiekolwiek ograniczenia prawne dotyczące ponownego wykorzystania tych danych, zwłaszcza w przypadku licencji i/lub umów, na podstawie których zostały udostępnione.
 
na jakiej licencji zostaną udostępnione dane wyselekcjonowane do otwartego repozytorium?
Aktualnie, zgodnie z wytycznymi NCN dane badawcze towarzyszące publikacji i potwierdzające wyniki w niej zawarte, powinny zostać udostępnione na licencji Creative Commons: CC0 lub CC BY (dane upublicznione do 31.12.2025).
 
Jeśli chodzi o licencje dla baz danych, to można wybrać PDDL, ODC lub ODbl), a dla programów komputerowych GNU GPL lub GNU LGPL).
 
Więcej o licencjach.

UWAGA
Jeżeli dane będą pozyskiwane na zamówienie przez podmioty zewnętrzne, należy zadbać o zawarcie odpowiednich umów prawnych, które będą regulowały kwestie m.in. własności intelektualnej, czy możliwości udostępniania danych. Warto wówczas mieć na uwadze wymogi stawiane przez NCN co do otwierania danych badawczych i informować takie instytucje o PZD oraz wytycznych NCN, zwłaszcza w kwestii udostępniania danych badawczych na licencji CC0 lub CC BY (dane upublicznione do 31.12.2025).
5. Udostępnianie i długotrwałe przechowywanie danych
5.1 Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy istnieją ewentualne ograniczenia i zakazy dotyczące ich udostępniania? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
–  jaki sposób o Państwa danych dowiedzą się potencjalni użytkownicy?
– czy istnieją jakieś ograniczenia i przeszkody uniemożliwiające ich pełne lub częściowe udostępnienie?
– czy wydawcy czasopism będą wymagać składowania danych na poparcie ustaleń publikacji?
– czy udostępnienie danych wymaga zgody uczestników badania?
W punkcie tym muszą się znaleźć odpowiedzi na następujące pytania:
jaki jest planowany termin udostępnienia danych?
NCN obliguje grantobiorców, by dane badawcze udostępnić najpóźniej w dniu ukazania się publikacji towarzyszącej/ towarzyszącym projektowi.
 
jak długo dane będą przechowywane?
Ze względu na ewentualną przydatność i wartość danych badawczych, całość zebranych danych najlepiej przechowywać np. w archiwum kierownika przez minimum 10 lat. Jeśli chodzi o przechowywanie danych udostępnionych w repozytorium to minimalny okres przechowywania także trwa 10 lat. Wybierając repozytorium należy sprawdzić na jaki okres repozytorium zobowiązuje się przechowywać dane. Repozytorium RODBUK przechowuje dane bezterminowo.
 
jakie są ewentualne ograniczenia i zakazy dotyczące udostępnienia danych?
W przypadku ograniczeń dotyczących udostępniania części lub całości danych, należy opisać jakie dane i z jakich powodów nie zostaną udostępnione.
 
UWAGA
Danych można nie udostępniać tylko w przypadku, kiedy:
w projekcie przetwarzane są dane osobowe lub dane wrażliwe i niemożliwa jest ich anonimizacja lub pseudonimizacja;

przewidziana jest komercjalizacja wyników badań;

zostały podpisane umowy (np. z firmami zewnętrznymi) zakazujące udostępniania danych;

w projekcie przetwarzane są dane mające wagę państwową np. dotyczące bezpieczeństwa państwowego.
 
W przypadku realizacji badania ankietowego, należy skonsultować się z Inspektorem Danych Osobowych UEK w celu uzgodnienia jaki rodzaj zgód na przetwarzanie danych powinno się uzyskać od respondentów, by w dalszych etapach realizacji projektu móc pozyskane dane udostępnić.

5.2 Jak będzie wyglądać selekcja danych przeznaczonych do utrwalenia i gdzie będą one długoterminowo przechowywane (np. w repozytorium danych, archiwum)? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– które dane trzeba zachować, a które zniszczyć z przyczyn wynikających z umów, przepisów prawnych lub regulacji?
– w jaki sposób zostanie podjęta decyzja o tym, które dane zachować?
– jaka będzie procedura selekcji przeznaczonych do utrwalenia danych?
– z jakiego repozytorium będą Państwo korzysta? Czy przestrzega ono zasad FAIR Data?
– czy państwa instytucja tworzy regularnie kopie zapasowe?
Po pierwsze należy opisać w jaki sposób będzie prowadzona selekcja danych do długotrwałego udostępnienia w otwartym repozytorium. Ważne jest, że:

od kierownika projektu (lub zespołu badawczego) zależy jakie dane zostaną udostępnione. Mogą to być zarówno dane surowe jak i przetworzone, w zależności od projektu i przewidywanych badań, licencji lub umów.

  warunkiem koniecznym narzuconym przez NCN jest, że w pierwszej kolejności należy wyselekcjonować taki zestaw danych, który będzie weryfikował i potwierdzał wnioski zawarte w publikacji towarzyszącej. Dane wybrane do udostępnienia muszą:
            » spełniać zasady FAIR;
            » prezentować najwyższą jakoś oraz wartość poznawczą.

Po drugie trzeba podać w jakim konkretnie repozytorium danych badawczych dane zostaną umieszczone. Rekomendujemy RODBUK (Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich), które jest specjalnie dedykowanym repozytorium dla pracowników naukowych jak i doktorantów UEK. Spełnia zasady FAIR i jest darmowe.
Można wybrać inne otwarte repozytorium, pod warunkiem że będzie spełniało warunki otwartości zgodnie z zasadami FAIR.
 
Jeśli wybrane przez Państwa repozytorium pobiera opłaty za zdeponowanie danych, prosimy oszacować te koszty i zastanowić się w jaki sposób zostaną zapewnione środki na długotrwałe przechowanie danych (m.in. 10 lat). Informacje o tych kosztach należy zamieścić w punkcie 6.2.
W tym punkcie należy również zawrzeć informacje o tym, które dane powinny być zniszczone z przyczyn wynikających z umów, przepisów prawnych lub regulacji.

5.3 Jakie metody lub oprogramowanie umożliwiają dostęp do danych i korzystanie z danych? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy aby dane mogły być przechowywane przez dłuższy czas i zachowały dłuższy okres ważności należy je przekształcić do formatu standardowego lub otwartego?
– czy do skanowania lub konwersji niezbędny będzie dodatkowy sprzęt lub oprogramowanie?
– jaki mechanizm posłuży do udostępnienia danych (np. odpowiedzi na żądanie, repozytorium)?
W tym punkcie należy zawrzeć następujące informacje:

w jakim formacie zostaną udostępnione dane w otwartym repozytorium;

jaki sprzęt lub oprogramowanie będzie potrzebne do odczytu tych danych.
 
UWAGA
NCN preferuje standardowe formaty otwarte, aby dostęp do zdeponowanych danych nie wymagał specjalistycznego oprogramowania. Należy zatem rozważyć konwersję danych, które zapisane są w formatach zamkniętych. Jeśli taka konwersja jest niemożliwa ze względu na zachowanie jakości danych lub poprawność odczytu, należy podczas deponowania danych w repozytorium, w dołączonym do zbioru danych (datasetu) pliku README zamieścić odpowiednią dokumentację informującą potencjalnych użytkowników o tym, jak skorzystać z tych danych i jaki program jest wymagany do ich odczytu.

5.4 W jaki sposób zagwarantują Państwo stosowanie unikalnego i trwale przypisanego identyfikatora (takiego jak cyfrowy identyfikator dokumentu elektronicznego (DOI) dla każdego zbioru danych? LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy trwale przypisany identyfikator zostanie uzyskany?
– jakie istniejące trwałe identyfikatory pozostaną w użyciu (np. cyfrowe identyfikatory dokumentu elektronicznego, numery dostępowe)?

Jeśli wybrane przez Państwa repozytorium zapewnia trwały identyfikator cyfrowy DOI, należy w tym miejscu zawrzeć taką informację. Jeśli nie, warto rozważyć zmianę repozytorium, na takie, które spełnia wymagania NCN.
 
Repozytorium RODBUK nadaje danym badawczym, udostępnionym w formie zbioru danych (datasetu) identyfikator cyfrowy DOI.
6. Zadania związane z zarządzaniem danymi oraz zasoby
6.1 Kto będzie odpowiadał za zarządzanie danymi (tj. kto będzie ich opiekunem)? LIMIT: 1000 znaków
 
Warto rozważyć następujące kwestie:
– czy Państwa instytucja posiada personel odpowiedzialny za zarządzanie danymi w trakcie trwania projektu, tj. od ich utworzenia, początkowego przechowywania, aż do archiwizacji i długoterminowego przechowywania danych?
– jeśli NIE to kto będzie odpowiedzialny za archiwizację i długoterminowe zarządzanie danymi w Państwa Jednostce?
– jeśli TAK to jakie zajmuje stanowisko w obrębie Jednostki?
– jaką rolę pełni Kierownik projektu w zarządzaniu danymi?
W tym punkcie należy zawrzeć następujące informacje:

kto będzie odpowiedzialny za zarządzanie danymi badawczymi, tj. kto będzie ich opiekunem?

kto będzie odpowiedzialny za gromadzenie, kto za jakość, kto za selekcję, kto za przechowywanie i tworzenie kopii zapasowych, a kto za archiwizację i udostępnianie?

kto będzie odpowiedzialny za wdrożenie i aktualizację Planu Zarządzania Danymi Badawczymi?

czy projekt przewiduje udział innych osób, które będą wspomagały proces zarządzania i opracowywania danych:
– Inspektor Ochrony Danych (w przypadku danych osobowych i wrażliwych);
– prawnik (w przypadku rozstrzygania kwestii prawnych, np. prawa własności, umowy z podmiotami zewnętrznymi);
– zespół IT (w przypadku gromadzenia danych na serwerach uczelnianych);
– bibliotekarze UEK – w przypadku wybrania Repozytorium RODBUK jako miejsca deponowania danych w zakresie weryfikacji metadanych  i danych badawczych wprowadzanych przez naukowców do RODBUK;
– bibliotekarze UEK we współpracy z informatykami Cyfronet AGH w zakresie archiwizacji i długoterminowego zarządzania danymi zdeponowanymi w Repozytorium RODBUK.

UWAGA
NCN traktuje jako błąd sytuację, gdy jedna osoba jest odpowiedzialna za wszystkie działania związane z zarządzaniem danymi badawczymi.

6.2 Jakie zasoby zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR? (Jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie? W jaki sposób zostaną opłacone?) LIMIT: 1000 znaków

Warto rozważyć następujące kwestie:
– czy potrzebne są dodatkowe zasoby do zarządzania danymi, takie jak osoby, czas, sprzęt lub oprogramowanie?
– jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie?
– w jaki sposób będą opłacone?
Jeśli projekt nie będzie generował dodatkowych kosztów związanych z udostępnianiem danych, należy zawrzeć taką informację.
 
Jeżeli planują Państwo skorzystać z repozytorium, które nie wymaga opłat, proszę o tym napisać.
 
Jeśli planują Państwo ograniczyć się do wykorzystania istniejącej infrastruktury informatycznej UEK i tym samym nie generować dodatkowych kosztów, to w tym miejscu trzeba o tym wspomnieć.
 
Natomiast w sytuacji, kiedy projekt przewiduje dodatkowe koszty, należy je w tym puncie wymienić. Może to być np.:
 zakup sprzętu lub usługa digitalizacji danych przeznaczonych do udostępnienia w otwartym repozytorium;

zakup dysków zewnętrznych dla kopii zapasowych;

opłata za depozyt danych w repozytorium.
 
Zakup dysków zewnętrznych dla kopii zapasowych można zaplanować w ramach kosztów bezpośrednich zarówno w projektach NCN jak i badaniach finansowanych z subwencji MEiN. W razie potrzeby zakupu takiego sprzętu należy ująć to w kosztorysie.

UWAGA:
Należy pamiętać o tym, aby publikacje naukowe deponowane w repozytoriach powiązać z opublikowanymi danymi badawczymi.

Więcej o danych badawczych:

Strony do tworzenia Data Management Plan:

DMP Tool – narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
DMP online – narzędzie bardzo podobne do DMPtool zawierające bazę instytucji finansującej naukę z Wielkiej Brytanii
The Digital Curation Centre (DDC) – brytyjski serwis specjalizujący się w zarządzaniu danymi badawczymi