Archiwum kategorii: Bibliografia

Bibliometria — kilka uwag

Najdziwniejszy jest zawód urzędnika administracyjnego Instytutu matematycznego: nie wie, czym administruje!

Hugo Steinhaus

W pewnym sensie jestem ogromnym zwolennikiem bibliometrii, choć z drugiej strony, mogę powiedzieć, że używana jest w zły sposób, który w znacznej części niweczy jej zalety. Nie można bowiem narzędzia podającego informacje strategiczne stosować do bieżącej taktyki.

Ale urzędnicy, którzy nie rozumieją tego czym administrują, potrzebują łatwych (i w miarę „automatycznych”) narzędzi oceny naukowców i ich grup. Bibliometria pasuje jak znalazł. A jak już naukowcy wiedzą, za pomocą jakich narzędzi są oceniani — rozpoczynają optymalizację. Gdy głównym kryterium jest:

  • liczba publikacji — publikują ogromne ilości przyczynkarskich prac wszędzie tam, gdzie chcą przyjąć;
  • liczba cytowań — tworzą „spółdzielnie” ułatwiające publikowanie, przynależność do nich jest opłacona koniecznością cytowania innych członków spółdzielni;
  • indeks H wydaje się być niezłą miarą starającą się ocenić i liczbę publikacji i liczbę ich cytowań (indeks równy N oznacza, że uczony ma N publikacji cytowanych więcej niż N razy). Ale ma też bardzo wiele wad, które próbowano zniwelować wymyślając różne jego modyfikacje.

Hirsch, poważny fizyk (podlegający również różnym automatycznym ocenom), dla żartu wymyślił ten (indeks H) wskaźnik i „wyliczył” go dla kilku znanych uczonych (noblistów i członków innych szanownych gremiów). I się przyjęło.

Co gorsza(?) naukowcy dosyć szybko przywiązali się do różnych miar ich dorobku i bardzo negatywnie reagują, gdy okazuje się, że jakiś wskaźnik zamiast im rosnąć — maleje.

Z drugiej strony wszyscy zdajemy sobie sprawę, że jeżeli ten sam parametr mierzymy za pomocą różnych przyrządów pomiarowych możemy dostać różne wyniki. Czasami różnice są niewielkie, czasami są znaczące, ale w każdym przypadku nabieramy wątpliwości do jakości urządzeń pomiarowych. Czasami jednak wynik (pomiaru) powstaje w efekcie złożonej procedury pomiarowej i obliczeniowej. W takiej sytuacji cała metodologia, zestaw dostępnych danych, założenia — wszystko ma wpływ na wyniki. Jeżeli dostaje się wyniki powtarzalne — trudno metodę kwestionować.

  1. Politechnika Wrocławska jest uczelnią, która jako pierwsza w Polsce rozpoczęła zbieranie informacji na temat publikacji swoich pracowników. Są one gromadzone w bazie DONA. Oprócz tego podjęła poważny wysiłek aby informacje te przetwarzać dostarczając analizy zainteresowanym pracownikom i kierownictwu Politechniki Wrocławskiej. Uważam, że pracownicy tym zajmujący wykonują kawał bardzo dobrej i potrzebnej pracy.
  2. Science Citation Index (SCI) powstał w latach 60. zeszłęgo stulecia i stał się podstawą „sławy” ISI (Institute for Scientific Information w Filadelfii). Charakterystyczne tomy SCI były podstawową pozycją w każdej „czytelni czasopism bieżących” i bardzo ważnym narzędziem pozwalającym (w czasach przed-internetowych) stosunkowo łatwo śledzić „sznureczek” cytowań jakiejś publikacji w czasie. SCI był wówczas, (zwłaszcza gdy egzemplarze publikacji zdobywało się wysyłając na adres autora pocztówkę–prośbę o odbitki) niezastąpionym narzędziem. Losy ISI były bardzo burzliwe, zmieniał on swoich właścicieli ale podstawowy serwis Web of Science ma się bardzo dobrze. Na przykład Fińska Akademia Nauk przedstawia systematyczne (co dwa lata) oceny nauki fińskiej przygotowywane na podstawie danych WoS (wykorzystując bibliometrię do ocen strategicznych). 

    Tomy SCI w czytelni
    Tomy SCI w czytelni
  3. Nieco poźniejsza inicjatywa to różne próby wydawnictwa Elsevier do stworzenia wyszukiwarki prac naukowych (jak, na przykład Scirus), które przekształciły się w końcu w bazę Scopus. Podstawowa różnica, która wyróżnia serwis Scopus (i wszystkie z nim związane) to fakt, że Elsevier jest jednym z największych wydawców literatury naukowej i ma dostęp do wszystkich swoich publikacji. Jako jeden z pierwszych firma zadbała o stworzenie unikatowych identyfikatorów uczonych i podjęła działania, żeby łączyć ich z miejscem pracy.
  4. Mendeley — (działa od 2007 roku) aplikacja i serwis społecznościowy będące (od 2013 roku) własnością firmy Elsevier.
  5. Google Scholar (udostępniony w 2004 roku). Początkowo tylko wyszukiwarka, dziś również platforma informacyjna. Bardzo agresywnie przeszukuje udostępnione w Internecie pliki i łączy je z informacjami na stronach wydawnictw. Dzięki temu często udostępnia pełne teksty korzystając ze źródeł innych niż wydawców. Platforma informacyjna pozwala naukowcowi umieścić informacje o swoich pracach, a wyszukiwarka Google będzie „zliczała” automatycznie cytowania.
  6. Microsofy Academic (powstał jako Microsoft Academic Research w roku 2006 jako odpowiedź na powstanie Google Scholar). Dosyć kiepsko radzi sobie na rynku, był zamykany, otwierany i w końcu został reaktywowany jako Microsoft Academic i zintegrowany z z wyszukiwarką Bing. Posiada sporą bazę danych publikacji naukowych (jedynie tam znalazłem jakąś wzmiankę o wniosku patentowym, którego kiedyś byłem współautorem; patent nie został przyznany).
  7. Zotero — (działą od 2006 roku) aplikacja ułatwiająca gromadzenie metadanych i baz bibliograficznych. O ile pamiętam były jakieś plany udostępniania swoich baz bibliograficznych, ale nie do końca wiem jak to się skończyło.
  8. Research Gate — (działa od 2008 roku) medium społecznościowe dla naukowców. Udostępnia podstawowe informacje o publikacjach oraz, bardzo czesto, ich pełne teksty. Przy czym dostępność pełnych tekstów czasami jest ograniczona wyłącznie dla innych użytkowników serwisu.
  9. Academia.edu — (działa od 2008) komercyjne medium społecznościowe dla naukowców.

Wszystkie te firmy starają się stworzyć jakąś platformę wymiany informacji na temat publikacji. Modele biznesowe są różne, ale podstawą działania tych przedsięwzięć są gromadzone metadane i narzędzia do ich analizy. Jedną z podstawowych analiz jest zliczanie cytowań. Przyjrzyjmy się efektom pracy różnych serwisów. Do porównań wybrałem swoją współautorską pracę Optimum experimental design for a regression on a hypercube—generalization of Hoel’s result. Poniżej przedstawiam informacje o liczbie cytowań zaliczonych, przez różne serwisy:

  • Scopus (17)
  • WOS (17)
  • Microsoft Academic (19)
  • Google Scholar (23)
  • Dona (udostępnia publicznie jedynie cytowania po 2014 i tych jest tylko 2 (słownie dwa))

Nie jest tak, że wyniki różnią się drastycznie. Można powiedzieć, że praca została zacytowana 20 ± 3 razy. Nie wiemy, które z tych wyliczeń odrzucają autocytowania, nie wiemy (choć akurat tego to można czasami się dowiedzieć przy odrobinie chęci) czy 17 cytowań WOS to te same 17 cytowań ze skopusa.

Jak nie mamy pewności do liczby cytowań, to również indeks H (bożek wszystkich naukowców) będzie zaburzony: Według Google Scolara mój współczynnik za ostatnie pięć lat to 2 (a globalnie to 5). Według skopusa — jest on znacznie, znacznie niższy 🙁

Nie należy obrażać się na gorsze wyniki jakiegoś pomiaru, tylko cały czas pamiętać, że skoro oceniam kogoś za pomocą miarki skopusa to nie powinienem porównywać go z osobą ocenianą miarką Google Scholar. Wydaje się, że jest to elementarne założenie. Co niekoniecznie jest prawdą w różnego rodzaju wnioskach (na przykład o awans). Ale to już osobna historia.

Podsumowując zdaję sobie sprawę, że zestawienie, które przedstawiłem może być odbierane prze kogoś jako niesprawiedliwe. Ale proszę pamiętać, że skorzystałem z jednego narzędzia do oceny wszystkich. I wyniki są mniej-więcej porównywalne. Pierwsza część (podająca podstawowe informacja na temat naszych osiągnięć dotyczy okresu 2013–2018 (co jest napisane już w drugim ustępie), to jest nieco więcej niż pięć lat, ale zdajemy sobie sprawę, że rok 2018 ciągle jeszcze trwa). Cześć druga, dokonująca porównań z Wydziałem obejmuje okres dłuższy: 2010–2018 (co nie jest napisane, ale wynika z opisu osi wykresów).

Na stronach serwisu SciVal (dostęp może mieć, po zarejestrowaniu, każdy z sieci Politechniki Wrocławskiej) można się zapoznać z dostępna dokumentacją opisującą metodologię i znaczenie poszczególnych wskaźników. (Nie upubliczniam ich tutaj, bo nie mam pewności czy mogę to zrobić.)

Cicer cum caule czyli groch z kapustą

Podczas seminarium mówiłem o:

  1. Szablonie prezentacji. Informacje o nim znaleźć można w dziale Projekty.
  2. O studiach dualnych nie ma zbyt wielu informacji na stronach Politechniki Wrocławskiej.
  3. Ledwie parę słów poświęciłem koncepcji „laboratoriów wirtualnych”. Nasze doświadczenia znaleźć można w kilku publikacjach (z lat 2000–2005): [1], [2], [3], [4], [5].Natomiast warto zajrzeć na strony Center for System Design (CSD) gdzie znaleźć można jakieś informacje o laboratoriach wirtualnych, ale w kontekście, który nigdy nas zbytnio nie interesował, to znaczy symulacji różnego rodzaju eksperymentów. Nie jest to bez sensu. tu, na przykład Free vibration of cantilever beam. Ale większość stron jest niedostępna…
  4. Kolejny poruszony temat to były „notatniki” pozwalające na prowadzenie interaktywnych obliczeń z wykorzystaniem profesjonalnego oprogramowania (na przykład Mathematica czy profesjonalne biblioteki numeryczne dostępne w Pythonie albo obliczenia z użyciem języka analiz statystycznych R).Jeżeli ktoś zechce może zapoznać się z ideą wykorzystania takiego oprogramowania na przykładzie Jupytera. Zachęcałem studentów do korzystania z niego na zajęciach z Metod Numerycznych i tam odsyłam zainteresowanych.
  5. Parę uwag poświęciłem też przygotowywaniu bibliografii. Pracując w redakcji czasopisma e-Informatica Software Engineering Journal mam jak najgorsze doświadczenia. Z moich doświadczeń wynika, że informacje bibliograficzne przygotowywane są bardzo niestarannie.Cały problem polega na tym, że dzisiejsze metody oceny zaczynają się (i bardzo często kończą) na kilku bibliometrycznych wskaźnikach. Wydaje się, że warto walczyć o wysoką jakość bibliografii — być może przełoży się to kiedyś na oceny.Bardzo interesujący (choć zapewne reklamowy) artykuł pod tytułem „Śledzenie, wizualizacja oraz ocena dorobku naukowego z wykorzystaniem bazy Scopus” opisuje możliwości zastosowania serwisu do prowadzenia analiz dorobku.
  6. Jeżeli wziąć pod uwagę, że to fizyk wymyślił wskaźnik rządzący dziś nauką światową nie powinien dziwić inny artykuł Hierarchical organization of H. Eugene Stanley scientific collaboration community in weighted network representation napisany przez fizyków z Instytutu Fizyki Jądrowej w Krakowie. Omówienie po polsku przedstawia główne idee artykułu i pozwala obrazować „zależności” pomiędzy publikacjami i prezentowanymi tam ideami (co widać na rys. 1).

    PIC

    Rysunek 1: Grafy ilustrujące powiązania naukowe Paula Erdősa, Edwarda Wittena, Marcela Ausloosa i Harry’ego E. Stanleya. W sieci Wittena wyraźnie widać trzy podsieci odpowiadające konkretnym tematom. (Źródło: [6])


    Podobne, ale nieco amatorskie, zależności pomiędzy współautorami z naszej katedry prezentuje rysunek 2. Uzyskany on został automatycznie na podstawie analizy bazy danych BibTeXa.


    pict

    Rysunek 2: Graficzna prezentacja prac współlokatorskich prof. Marka Rybaczuka; wyraźnie widać podsieci różnych zainteresowań


  7. Ostatnim tematem była sztuczna inteligencja. Wszystkie wątpliwości związane ze sztuczną inteligencją najlepiej ilustruje komiks z serwisu xkcd (rys. 3).

    PIC

    Rysunek 3: Łatwo dosyć jest stworzyć sztuczną inteligencję, która coś naśladuje (powtarzajac)


    Oczywiście sprawa nie jest tak prosta jak się wydaje na pierwszy rzut oka, ale…

    W prezentacji wspomniałem o dwu przykładach działania sztucznej inteligencji pierwszy dotyczył inteligentnego skalowania fotografii [7]. Efekty nie są może „porażające”, ale widać, że algorytm „stara się”.

    Potencjalnie znacznie ciekawszy jest drugi przykład tworzenia realistycznych „fotografii” na podstawie opisu słownego [8]. Ale trzeba sobie zdawać, że tak na prawdę, jest to zadanie „odwrotne” do zadania klasyfikacji: zaleźć trzeba punkt w przestrzeni cech możliwie najbliższy prototypom o opisanych cechach.

    groch1

Trudna sztuka cytowania (i tworzenia bibliografii)

System LaTeX posiada (może nie znakomite, ale całkiem niezłe) narzędzie do tworzenia bibliografii. Jest to system BibTeX.

Działa on w ten sposób, że tworzymy bazę danych zawierające wszelkie niezbędne informacje o publikacjach, a pisząc pracę odwołujemy się do rekordów tej bazy. Każdy rekord powinien posiadać swój unikatowy identyfikator służący do tworenia odwołań. Każdy rekord powinien zawierać minimalny, niezbędny zestaw informacji bibliograficznych. Zestaw ten jest różny dla różnych publikacji: inny dla artykułu, a inny dla książki. W najprostszym wypadku w tekście umieszczamy polecenie \cite{identyfikator_rekordu} i o sprawie ,,zapominamy”.

Druga część systemu to mechanizm pozwalający podczas kompilacji dokumentu wyciągnąć z bazy danych informacje o cytowanych dokumentach i sformatować je zgdonie z wymaganym szablonem, a następnie wszystko połączyć w całość: w miejscu tekstu gdzie pojawiło się odwołanie do rekordu ( \cite{identyfikator_rekordu}) pojawi się odpowiedni symbol cytowania (na przykład liczba w nawiasach kwadratowych: [123]), a w innym miejscu (na przykład na końcu dokumentu) pojawi się ułożona w zdefiniowanej kolejności (alfabetycznie, według nazwisk pierwszego autora, albo chronologicznie według dat publikacji, albo w kolejnosci cytowania w pracy) lista prac (oznaczonych odpowiednimi symbolami). Numerkami w nawiasach kwadratowych, na przykład. Co więcej bibliografia będzie sformatowana zgdonie z wymaganiami wydawcy (co, swoją drogą jest sporym problemem: dobrzy wydawcy dostarczają odpowiednie szablony, kiepscy mają jedynie wskazówki jak powinien wyglądać wpis dotyczący książki, artykułu, referatu konferencyjnego,… Wówczas Autor musi albo taki szablon stworzyć (nie zawsze jest to łatwe) albo wybrać taki, który jak najbardziej jest zgodny z oczekiwaniami wydawcy. To też nie jest łatwe.

Osobną kwestią jest wypełnienie bazy danych rekordami. Tak się składa, że system BibTeX jest jednym z niewielu standardów udostępniania informacji bibliograficznych powszechnie uznanych i stosowanych przez naukowców na całym świecie (choć niekoniecznie w Polsce). W związku z tym bardzo wielu wydawców i większość publikacyjnych baz danych oferuje metadane artykułów w tym formacie. Istnieją również narzędzia pozwalające na podstawie DOI odzyskanie metadanych w formacie BibTeXa (http://www.doi2bib.org/).

Najlepszą metodą tworzenia takiej bazy jest metoda ręczna: jak mamy w ręku oryginał tekstu, który chcemy w niej zachować, wpisujemy do bazy niezbędny zestaw informacji. Program JabRef podpowie, które pola są niezbędne. Nie jest to wielka praca, ale trzeba ją wykonać wtedy kiedy oryginał mamy w ręku.

Z drugiej strony cytujemy często prace które znajdujemy w Internecie poszukując określonych słów kluczowych albo fraz. Google Scholar oferuje możliwość udostępnienia informacji blibliograficznych. Załóżmy że szukamy tekstu zatytułowanego The alternating decision tree learning algorithm. Google Scholar znajduje nawet tekst źródłowy, co więcej informuje, że artykuł jest całkiem popularny (jest tam informacja ile razy był cytowany).

Jest wreszcie informacja pozwalająca mająca, w zamierzeniu Autorów systemu, ułatwić zacytowanie artykułu. Klikamy w ,,Cytuj” i w następnym okienku znajdujemy możliwość uzyskania cytowania w formacie BibTeXa.

Bardzo wielu PT Twórców mając coś takiego wkleja odpowiedni rekord do swoje bazy danych. Wyszukiwarka jest wspaniała! Znalazła nam pożyteczny tekst, znalazła jego wersję elektroniczną i jeszcze oferuje metadane. A wszystko za darmo!

Problem pojawi się na znacznie późniejszym etapie, podczas formatowania bibliografii, gdyż jako tytuł książki w której ukazał się artykuł konferencyjny mamy podanie ,,icml”, a cytowana praca objawia się tak:

[50] Y. Freund and L. Mason, The alternating decision tree learning algorithm,” in icml, Vol. 99, 1999, pp. 124–133.

I takie kursywiane icml przyciąga uwagę i, właściwie, nie pozwala na odnalezienie oryginału w sposób klasyczny (to znaczy nie korzystając z Internetu). Można, oczywiście, machnąć na to ręką: jak ktoś nie ma Internetu niech zajmie się czym innym niż pisaniem prac. Sam tytuł pozwala dosyć łatwo pracę odnaleźć (i wielu PT Autorów wychodzi z tego założenia dostarczając czasami tylko tytuł, albo tytuł i nazwisko jednego z twórców). W tym przypadku zaprotestowała Redakcja Techniczna czasopisma: zadając pytanie ,,To gdzie ta praca została opublikowana?” Ale Google Scholar podaje tylko ten wynik. Bo najlepszy, bo z tekstem źródłowym.

Po przełączeniu się na wyszukiwarkę normalną dostajemy nieco więcej informacji. Znajdujemy odsyłacz do biblioteki elektronicznej ACM, gdzie jest już nieco więcej informacji na temat źródła, co więcej również tu możemy poprosić o rekord zawierający metadane referatu w formacie BibTeXa:

I mamy już tytuł i wydawcę pracy.

Cóż zatem można radzić? Tworzenie Nauki powinno opierać się na korzystaniu ze źródeł ,,pierwotnych”. I tego się trzymajmy.

Bibliometria i więcej: kilka uwag nie na temat

Po wielu latach przerwy (poprzedni raz konferencję KOWBAN odwiedzałem w roku 1994) postanowiłem zobaczyć co się tam dzieje. I w jesienny dzień pojechałem do Polanicy-Zdroju żeby przedstawić tam parę uwaga na temat, który mocno mnie (od dłuższego już czasu) nurtuje. Dokładniej na temat ekspozycji metadanych.

Od czasu rewelacji ogłoszonych przez Edwarda Snowdena (ale też kilku poważnych wpadek firm korzystających ze zbierania metadanych na temat naszych zachowań w Internecie) metadane nie mają najlepszej prasy, delikatnie mówiąc.

Z drugiej strony życie na uczelni całkowicie podporządkowane jest różnym fetyszyzowanym wskaźnikom bibliometrycznym, takim jak indeks h, liczba cytowań, Lista Filadelfijska. Co gorsza, nie należy spodziewać się, że to się zmieni w najbliższym czasie: dla urzędników (zwłaszcza tych co oceniają jednostki albo przyznają środki) bibliometria jest podstawowym narzędziem. Opierają się na niej również wszystkie rankingi uczelni.

Stąd w jasny sposób wynika, że powinno nam (na uczelniach) zależeć aby metadane wszystkich prac naukowych były jak najszerzej udostępniane: od tego zależy jak jesteśmy widoczni (co mocno łączy się z tym jak jesteśmy cytowani).

Poniżej znajdują się slajdy mojego wystąpienia:

biblio_prez

Dostępny jest również tekst pracy przedstawianej na konferencji (i opublikowanej w materiałach konferencyjnych): Bibliometria i więcej: kilka uwag nie na temat.

Szablony BibTeXa

Ponieważ już jakiś czas temu opracowałem szablon bibliografii, który mimo że nie jest idealny, jakoś sprawdza się w publikacjach składanych dla Oficyny Wydawniczej Politechniki Wrocławskiej, postanowiłem go udostępnić publicznie.

Dodatkowo, podczas dyskusji kuluarowych pojawił się problem wyróżniania  nazwiska wybranego autora. Szablon został zmodyfikowany.

Wszystko dostępne na stronach:

Co jeszcze RefWorks może dla nas zrobić?

Możemy, oczywiście, ręcznie wpisywać dane bibliograficzne publikacji korzystając z wbudowanego edytora. Nie jest to jednak specjalnie wygodne, a poza tym, żmudne (i można się pomylić). Ideałem byłaby możliwość automatycznego wypełniania bibliograficznej bazy danych.

I takie możliwości RefWorks oferuje.

Skryptozakłądka RefGrab-It
Skryptozakłądka RefGrab-It

Dostęp do wielu czasopism mamy elektroniczny, więc jest naturalne, że chcielibyśmy szybko i sprawnie przepisać informacje ze strony czasopisma. W tym celu można skorzystać ze „skryptozakładki” RefGrab-It. Dodaje się ją do paska zakładek w przeglądarce (podobnie jak dodaje się do ulubionych adresy stron WWW). Opisane jest to na stronach RefWorks. A następnie, przeglądając stronę na której spodziewamy się dostępnych metadanych „uruchamiamy ją”.

Weszliśmy na stronę czasopisma Archives of Civil and Mechanical Engineering i zainteresował nas artykuł „Performance analysis of Civil Engineering Journals based on the Web of Science® database”. Uznaliśmy że powołamy się na niego w opracowywanej publikacji. Trzeba zatem dane zapisać. Uruchamiamy RefGrab-It. Zaznaczamy artykuł i importujemy go do bazy danych.

Pobieranie danych bibliograficznych artykułu (na stronie czasopisma)
Pobieranie danych bibliograficznych artykułu (na stronie czasopisma)

Załóżmy, że przeglądając Internet natrafiliśmy na interesującą informację na blogu. Jest tam powołanie na ciekawy artykuł i wpis na kolejnym blogu. Wszystko jest na tyle interesujące, że będziemy chcieli powołać się na to. Tylko trzeba zanotować źródła. Jeżeli jest to dobry blog — może być to bardzo łatwe.

Posłużę się (prawem kaduka) moim wpisem na stronie katedralnej: Standardy prezentacji danych w publikacjach naukowych.
Uruchomimy tam RefGrab-It, które znajduje dane trzech dokumentów: wpisu, który czytamy, artykułu i innego wpisu na który się powołuję. Możemy wszystko to, za jednym zamachem, skopiować do bazy danych. (Niestety, aby było to możliwe, strona musi być odpowiednio przygotowana to znaczy udostępniać metadane omawianych publikacji. Nie ma takich stron zbyt wiele.)

Dane bibliograficzne ze specjalnie przygotowanej strony WWW
Dane bibliograficzne ze specjalnie przygotowanej strony WWW

W podobny sposób możemy zapisywać metadane znalezionych artykułów w bibliograficznych bazach danych (Scopus, Web of Knowledge,…), dobrych katalogach bibliotecznych, dobrych księgarniach (Amazon), wyszukiwarkach publikacji naukowych (Google Scholar) czy z dobrze zarządzanych stron gazet i czasopism. Wszystko zależy od tego, czy twórca serwisu przewidział taką możliwość.

RefWorks zapewnia równiez możliwość importu metadanych zapisanych w innych formatach.

Część pierwsza: Używamy menedżera cytowań – RefWorks.

Część druga: RefWorks — piszemy artykuł.

RefWorks — piszemy artykuł

Gdy już mamy bazę danych w RefWorks możemy zabrać się za korzystanie z niej. Baza całkiem nieźle współpracuje z „procesorami do przetwarzania tekstu” (czyli różnymi programami typu MS Office czy LibreOffice.

W pierwszej kolejności powinniśmy przeczytać dokładnie wskazówki dla autorów czasopisma, do którego trafić ma artykuł. Bardzo często będą tam informację jakiego stylu cytowania należy użyć i jak ma być sformatowania bibliografia. Niektóre czasopisma mówią, że można użyć dowolnego stylu (bibliografia i tak zostanie przeformatowana w procesie produkcji), byle tylko używać go konsekwentnie.

I tak na przykład dla czasopisma Journal of Biomaterials Applications właściwy styl to Sage Vancouver (cokolwiek to znaczy).
Osobną kwestią jest przygotowywanie artykułów do czasopism polskich: nie zawsze korzystają one ze „standardowych” stylów używanych w świecie, czasami mają własne wymagania, czasami starają się korzystać z tego co proponuje odpowiednia norma. Zostawmy ten problem na razie.

Po zalogowaniu się do menedżera musimy sprawdzić czy potrafi on obsłużyć nasz styl cytowań. Jeżeli nie — mamy kłopot, ale można prosić wsparcie firmy o zaimplementowanie odpowiedniego stylu.

refworks2
Output Style Manager

Z menu Bibliography wybieramy Output Style Manager i szukamy stylu. Gdy go znajdziemy zaznaczamy i przenosimy go do ulubionych (Favorities).

refworks3
Dodajemy styl do ulubionych
Bibliografia w style IEEE
Bibliografia w style IEEE
Widok bibliografii w stylu Sage Vancouver
Widok bibliografii w stylu Sage Vancouver

Tak przy okazji, typowy styl stosowany w pracach technicznych, to taki, w którym cytowania umieszczone są w nawiasach kwadratowych. Najbliższy jest mu styl IEEE (na przykład Proceedings of the IEEE).
Dla każdego stylu możemy podejrzeć jak będą wyglądały cytowania i bibliografia (zaznaczmy styl i naciskamy klawisz Preview Output Style). Zmieniając styl można porównywać zmiany. Gotowe style, w pewnym zakresie, można modyfikować, ale nie poświęcimy temu, przynajmniej na razie, większej uwagi.
Nasz styl jest w ulubionych. Zaczynamy pisanie pracy. Ja będę korzystał z programu LibreOffice. RefWorks przełączamy z trybu Standard View (po prawej stronie nad listą publikacji) w tryb „One Line/Cite View) i szukamy publikacji, którą chcemy zacytować, przeglądając listę lub korzystając z pola wyszukiwania. Znalezioną pracę (znalezione prace) zaznaczamy i naciskamy ikonkę z dwoma nawiasami klamrowymi. Otworzy się mniejsze okienko z dziwnym (na pierwszy rzut oka) podświetlonym tekstem. Kopiujemy go i wklejamy. Procedurę powtarzamy wielokrotnie (tyle razy ile trzeba) i zapisujemy gotowy artykuł na dysku.

Cytowanie
Cytowanie
Tekst z cytowaniem w LibreOffice
Tekst z cytowaniem w LibreOffice

W kolejnym etapie klikamy w klawisz Bibliography (widoczny, na przykład, w okienku Citaton Viewer) i wybieramy styl (z krótkiej listy ulubionych) i wysyłamy na serwer RefWorks nasz artykuł. Po

Przesłanie artykułu na serwer i odbiór wyników
Przesłanie artykułu na serwer i odbiór wyników

przetworzeniu otwiera się malutkie okienko w którym możemy albo plik ściągnąć, albo poprosić o wysłanie go na nasz adres poczty elektronicznej. Po zapisaniu na dysku plik będzie nosił nazwę Final-<nazwa pliku źródłowego>.odt. Plik zawiera odwołania i sformatowaną bibliografię.

Cytowanie i bibliografia w stylu IEEE
Cytowanie i bibliografia w stylu IEEE

Zmiana stylu cytowania skutkować będzie innym formatowaniem odwołań w tekście i innym wyglądem bibliografii.

Cytowanie i bibliografia w stlue Sage Vancouver
Cytowanie i bibliografia w stlue Sage Vancouver

Część pierwsza: Używamy menedżera cytowań – RefWorks.

Część trzecia: Co jeszcze RefWorks może dla nas zrobić?.

Używamy menedżera cytowań – RefWorks

Politechnika Wrocławska ogłosiła właśnie, że można (choć, na razie, tylko w trybie beta) eksportować wyniki wyszukiwania z bazy DONA do menedżera cytowań RefWorks.

Dobra to informacja, choć nie wiem na ile oczekiwana. Nie wiem ile osób korzysta z jakiegokolwiek menedżera bibliografii.

Ponieważ dostępna jest całkiem obszerna dokumentacja systemu:

nie będę (na razie) zajmował się samym oprogramowaniem. Wspomnieć należy, że jest to oprogramowanie pracujące on-line, a całą obsługa odbywa się z wykorzystaniem przeglądarki WWW.

Żeby zacząć korzystać z systemu trzeba sobie założyć tam konto (darmowe). Opisane jest to w wystarczający sposób na stronach Biblioteki Głównej.

Załóżmy, że mamy to za sobą (nie jest to procedura specjalnie kłopotliwa). Pamiętajmy, że aby wykonać wszystkie poniższe czynności trzeba być zalogowanym do swojego konta w RefWorks!

Korzystamy z wyszukiwarki DONA żeby dodać do bazy wszystkie swoje udokumentowane w niej prace. Korzystam w tym celu z „formularza autora” wpisując w odpowiednie pola nazwisko i imię i naciskając klawisz Dalej. W wynikach wyszukiwania zaznaczam „wyeksportowanie wykazu prac do Reforks”.

refworks

Naciskamy klawisz Szukaj. W przeglądarce otwiera się kolejne okno (jeżeli jeszcze nie zezwoliliśmy stronom Biblioteki na otwieranie „wyskakujących” okienek, trzeba to zrobić), wybieramy z listy interesujące nas prace lub naciskamy klawisz „Zaznacz wszystko” i „Export to RefWorks”. Operacja chwilę potrwa i otworzy się okienko z informacjami diagnostycznymi.

refworks1

Nasze publikacje są w bazie danych.

Uwaga: Jak w każdym przypadku automatycznej konwersji warto sprawdzić rezultat, poszukując błędów „grubych” (źle skonwertowany typ publikacji) jak i „drobnych” — literówki, nadmiarowe znaki przestankowe, itp.

Część druga: RefWorks — piszemy artykuł.

Część trzecia: Co jeszcze RefWorks może dla nas zrobić?.

(Ciąg dalszy nastąpi…)

Niestandardowe wykorzystanie DOI

System DOI (o którym już wspominałem tutaj) to coś więcej niż tylko prosty konwerter identyfikatorów cyfrowych na URL (czy URI) strony www udostępniającej zasób.
DOI to również baza danych zawierająca metadane (czyli podstawowe informacje o zasobie takie jak autor, tytuł, tytuł czasopisma, w którym opublikowano, rok publikacji, itd, itp). Można zatem użyć DOI do automatycznego uzyskania podstawowych informacji bibliograficznych na tema zasobu cyfrowego.

Powstał nawet specjalny serwis pozwalający na podstawie DOI uzyskać rekord w formacie bazy danych BibTeX. Nazywa się on doi2bi.

Zasób o identyfikatorze DOI 10.4028/www.scientific.net/KEM.598.81 generuje rekord następujący:

Można go porównać z rekordem umieszczonym na naszych stronach pod adresem http://kmim.wm.pwr.edu.pl/kaleta/wp-publications/kaleta2014c/.

Informacje bibliograficzne z bazy danych DOI potrafi „wyciągać” również każdy dobry menedżer bibliografii (na przykład Zotero).
Można te dane wyciągnąć samemu, korzystając, na przykład, z programu curl (dostępny w każdej porządnej dystrybucji Linux, ale i na inne systemy: http://curl.haxx.se/). curl to program, uruchamiany z linii poleceń, pozwalający ściągnąć i zapisać zawartość dowolnej strony. Różni się od przeglądarki tym, że nie przedstawia tego w pięknie sformatowanej postaci tylko zapisuje na dysku.
Polecenie

spowoduje zwrot sformatowanej informacji bibliograficznej na tema artykułu , w postaci:

Kaleta, J., Królewicz, M., Lewandowski, D., & Przybylski, M. (2014). Investigations of Magnetorheological Elastomers Subjected to Cyclic Loading. Key Engineering Materials, 598, 81–85. doi:10.4028/www.scientific.net/kem.598.81

Niestandardowe zachowanie serwisu dx.doi.org wymusza dodatkowa informacja wysyłana przez program, a zawarta w parametrze -H „Accept: text/bibliography”. Jest to specjalna informacja mówiąca jakiego rodzaju informację zwrotną jesteśmy w stanie zaakceptować.
Można zażądać informacji bibliograficznej w jednym ze standardowych stylów cytowania, dodając style=apa lub style=ieee

żeby dostać

[1] J. Kaleta, M. Królewicz, D. Lewandowski, and M. Przybylski, “Investigations of Magnetorheological Elastomers Subjected to Cyclic Loading,” Key Engineering Materials, vol. 598, pp. 81–85, Jan. 2014.

W szczególności style=bibtex zwraca informację w postaci rekordu bibtex, a zapytanie postaci:

zwróci rekord bibliograficzny w formacie RDF.