Rosyjskie serwery, numer DOI i uwolnione dokumenty. Czyli jak zdobywać informacje w XXI wieku?

Centrum Badań Struktur Demograficznych i Gospodarczych

Pełna zaskakujących faktów rozmowa z historykami z Centrum Badań Struktur Demograficznych i Gospodarczych Przednowoczesnej Europy Środkowo-Wschodniej Uniwersytetu w Białymstoku i Instytutu Historii i Nauk Politycznych Uniwersytetu w Białymstoku.

O tym, w jaki sposób szukają źródeł historycznych, opowiedzieli nam: dr hab. Marzena Liedke – prof. UwB, dr Piotr Guzowski, dr Radosław Poniat i dr hab. Krzysztof Boroda.

Część I rozmowy

Jak historyk z Białegostoku pozyskuje dziś wiedzę do badań?

Podstawą naszej pracy są materiały źródłowe, tworzone w epoce, którą badamy. Większość tych materiałów pozostaje w postacie rękopiśmiennej w archiwach. Mamy sieć archiwów państwowych w Polsce. Niezwykle ważna jest też sieć archiwów kościelnych.
Z dostępem do materiałów w archiwach państwowych w zasadzie nie ma już problemu. Część z nich jest zdigitalizowana i dostępna online. Choć pewnie 99% z nich – wciąż jeszcze nie jest… Ale już zaczyna się tu coś dziać, część materiałów trafia do Internetu. Jest taki portal: szukajwarchiwach.pl i on nam bardzo pomaga. Dostęp do niego jest darmowy.


Natomiast w przypadku archiwów kościelnych, archiwów diecezjalnych – można je podzielić na te, które dają pełen dostęp do swoich zasobów i jest z nimi bardzo dobra współpraca i na te, do których nie ma dostępu. Te archiwa nie są finansowane z budżetu, dlatego źródłem finansowania ich są korzystający, np. badacze genealogiczni. I od nich żąda się całkiem sporych pieniędzy. Za przygotowanie skanu, czy kopii jednej strony opłata wynosi – 7 złotych.
Na etapie pracy genealoga to nie jest problem, bo materiałów nie jest dużo. Ale w momencie, gdy my prowadzimy badania demograficzne, czy gospodarcze, kiedy musimy analizować statystycznie całe zespoły dokumentów, np. inwentarz dóbr gospodarczych, który ma kilkaset stron – robią się już duże kwoty. Wydajemy na to tysiące złotych.
Problemem jest też to, że nie zawsze w tych archiwach możemy uzyskać kopie całych dokumentów. Często mają one też swoje wewnętrzne przepisy, wedle których mogą nam zrobić kopie zaledwie 75% materiałów.
Jedna rzecz – to źródła. Druga rzecz – to opracowania.

A jak jest z opracowaniami?

Od kliku lat większość polskich czasopism naukowych ma swoje strony internetowe i dostęp do nich jest wolny, online. Natomiast wszystko to, co powstało przed 2010 rokiem – wciąż jest w wersji papierowej. Dostęp do tego jest ograniczony tylko do najlepszych bibliotek.
Natomiast z literaturą zagraniczną w ogóle jest problem. Niewiele polskich instytucji ma wykupiony dostęp do dużych baz danych wielkich wydawnictw, publikujących książki i czasopisma. Więc my, historycy korzystamy z nich, jeżdżąc na przykład do Biblioteki Uniwersytetu Warszawskiego, czy do Biblioteki Narodowej. Ale częściej są to nasze osobiste wyjazdy i kwerendy na za granicę. Jeśli mamy pieniądze z grantów – to jeździmy do tych bibliotek.
W sytuacji nagłej ratują nas niestety nielegalne serwery rosyjskie, z Kazachstanu, czy Wenezueli, które nie przestrzegają praw autorskich. Umieszczane są na nich nowości wielkich wydawnictw. I korzystamy z tego, że ktoś to upublicznił on line. Szczerze mówiąc, bez tego byłoby nam bardzo trudno.
Inna rzecz, że rosyjscy badacze, internauci – publikują też bardzo dużo materiałów źródłowych, które zostały wydane w XIX i na początku XX wieku, z archiwów wschodnich. Czyli terenów dawnej Rzeczpospolitej. A więc poprzez strony rosyjskie można dotrzeć do interesujących nas wydawnictw źródłowych, dotyczących Polski.

Dlaczego to akurat rosyjskie serwery?

Oryginalnie były to serwery z innych krajów, np. holenderskie. Ale właścicieli ich oskarżono o propagowanie piractwa i część serwerów przeniesiono do Rosji. Co nie znaczy, że prowadzą je Rosjanie.
Jedna z najbardziej znanych stron była zrobiona przez doktorantkę z Kazachstanu, która wykorzystywała dane przez wyszukiwanie numeru DOI. To uniwersalny numer nadany dokumentowi (artykułowi, rozdziałowi w książce), który pozwala znaleźć daną publikację w sieci. Dziś na tych kazachskich serwerach nie identyfikuje się źródła poprzez tytuł, czy autora – ale za pomocą tego elektronicznego numeru DOI. Wchodzimy na strony wielkiego wydawnictwa, sprawdzamy jaki jest numer DOI danego artykułu, wydanego w jakimś piśmie. Następnie wchodzimy na rosyjski serwer, wrzucamy ten numer i mamy sam artykuł.

Na tych serwerach są duże zasoby dokumentów?

Strategia jest taka: ludzie, którzy mają dostęp do danego systemu bibliotecznego, czyli powiedzmy pracownik Harvardu – udostępnia swoją kartę biblioteczną. I jeśli ktoś pyta o jakieś czasopismo czy artykuł, ten serwer łączy się z Biblioteką Harvardu, podając się za tego pracownika. Pobiera artykuł, zapisuje go na serwerze. Wobec czego kolejna szukająca osoba będzie już to miała na serwerze i nie nadużywa się konta. I w ten sposób artykuł zostaje – jak to oni nazywają – uwolniony.

A jak jest w Polsce?

Tu jest duży problem. Większość polskich wydawnictw naukowych, czasopism – jest finansowana z budżetu państwa. Nie widzimy powodu, dla którego książka w 100% sfinansowana przez środków publicznych i wydana przez wydawnictwo, które nie jest komercyjne – nie trafia od razu online do sieci. Trafia zaś do wybranych bibliotek, gdzie można z niej korzystać za darmo, ale na miejscu.
Podobnie jest z materiałami, które powstały z grantów. Na przykład, kiedy my opracowujemy takie materiały, już nam za nie zapłacono. Bardzo często również zapłacono za ich publikację. I te publikacje powinny „być uwolnione”.

Kto blokuje ten proces?

Wydaje nam się, że to jest wielki biznes wydawniczy. Wydawnictwa nie zarabiają nawet tak znacząco na samym sprzedawaniu, ale na wydawaniu. Zarabia się na druku, na składzie, na opracowaniu graficznym itp. Wydawnictwa uniwersyteckie też zwykle działają na podobnej zasadzie. Bardzo często wydawnictwa podpisując umowę, zobowiązują się, że udostępnią publikację w wolnym dostępie, online –w formie pdf. I jest to zrobione w ten sposób, aby tej treści nie można było znaleźć na konkretnej stronie.
Na przykład cykl podręczników do nauk pomocniczych historii – został w pełni sfinansowany przez państwo. I wydawnictwo miało obowiązek umieszczenia tych materiałów w sieci. I zostały one tam umieszczone, ale tak „schowane” na stronie, aby nikt nie mógł do nich dotrzeć… Czyli materiały są, ale ukryte.

Jakie byłoby rozwiązanie tej sytuacji?

Chcielibyśmy, aby wszystko, co jest w archiwach było dostępne online. Jeżeli można było zeskanować większość ksiąg metrykalnych z archiwów państwowych, to podobnie może się stać z całą resztą źródeł. Nasze archiwa obawiają się chyba tego, że kiedy umieszczą swoje zasoby w sieci – ich fizyczne istnienie straci rację bytu.
Stąd dzieją się na przykład takie rzeczy, że archiwum skanuje materiały, umieszcza je na swoim dysku na dwóch czy trzech komputerach w pracowni naukowej, ale nie pozwala zapisać tych danych na jakimś nośniku pamięci użytkownika i zabrać go ze sobą. Zmusza to często historyka do robienia zdjęć skanów z ekranu komputera w archiwum. Do komputera ustawia się kolejka zainteresowanych materiałami tam zapisanymi i robią zdjęcia zdjęć z ekranu. Trudno wytłumaczyć logicznie takie ograniczenia.

Przeczytaj część II.

rozmawiała Magdalena Gołaszewska
fot. MG