Archiwa tagu: BibTeX

Cicer cum caule czyli groch z kapustą

30 stycznia 2018 Wojciech Myszka Jeden komentarz

Podczas seminarium mówiłem o:

Szablonie prezentacji. Informacje o nim znaleźć można w dziale Projekty.
O studiach dualnych nie ma zbyt wielu informacji na stronach Politechniki Wrocławskiej.
Ledwie parę słów poświęciłem koncepcji „laboratoriów wirtualnych”. Nasze doświadczenia znaleźć można w kilku publikacjach (z lat 2000–2005): [1], [2], [3], [4], [5].Natomiast warto zajrzeć na strony Center for System Design (CSD) gdzie znaleźć można jakieś informacje o laboratoriach wirtualnych, ale w kontekście, który nigdy nas zbytnio nie interesował, to znaczy symulacji różnego rodzaju eksperymentów. Nie jest to bez sensu. tu, na przykład Free vibration of cantilever beam. Ale większość stron jest niedostępna…
Kolejny poruszony temat to były „notatniki” pozwalające na prowadzenie interaktywnych obliczeń z wykorzystaniem profesjonalnego oprogramowania (na przykład Mathematica czy profesjonalne biblioteki numeryczne dostępne w Pythonie albo obliczenia z użyciem języka analiz statystycznych R).Jeżeli ktoś zechce może zapoznać się z ideą wykorzystania takiego oprogramowania na przykładzie Jupytera. Zachęcałem studentów do korzystania z niego na zajęciach z Metod Numerycznych i tam odsyłam zainteresowanych.
Parę uwag poświęciłem też przygotowywaniu bibliografii. Pracując w redakcji czasopisma e-Informatica Software Engineering Journal mam jak najgorsze doświadczenia. Z moich doświadczeń wynika, że informacje bibliograficzne przygotowywane są bardzo niestarannie.Cały problem polega na tym, że dzisiejsze metody oceny zaczynają się (i bardzo często kończą) na kilku bibliometrycznych wskaźnikach. Wydaje się, że warto walczyć o wysoką jakość bibliografii — być może przełoży się to kiedyś na oceny.Bardzo interesujący (choć zapewne reklamowy) artykuł pod tytułem „Śledzenie, wizualizacja oraz ocena dorobku naukowego z wykorzystaniem bazy Scopus” opisuje możliwości zastosowania serwisu do prowadzenia analiz dorobku.
Jeżeli wziąć pod uwagę, że to fizyk wymyślił wskaźnik rządzący dziś nauką światową nie powinien dziwić inny artykuł Hierarchical organization of H. Eugene Stanley scientific collaboration community in weighted network representation napisany przez fizyków z Instytutu Fizyki Jądrowej w Krakowie. Omówienie po polsku przedstawia główne idee artykułu i pozwala obrazować „zależności” pomiędzy publikacjami i prezentowanymi tam ideami (co widać na rys. 1).

Rysunek 1: Grafy ilustrujące powiązania naukowe Paula Erdősa, Edwarda Wittena, Marcela Ausloosa i Harry’ego E. Stanleya. W sieci Wittena wyraźnie widać trzy podsieci odpowiadające konkretnym tematom. (Źródło: [6])

Podobne, ale nieco amatorskie, zależności pomiędzy współautorami z naszej katedry prezentuje rysunek 2. Uzyskany on został automatycznie na podstawie analizy bazy danych BibTeXa.

Rysunek 2: Graficzna prezentacja prac współlokatorskich prof. Marka Rybaczuka; wyraźnie widać podsieci różnych zainteresowań
Ostatnim tematem była sztuczna inteligencja. Wszystkie wątpliwości związane ze sztuczną inteligencją najlepiej ilustruje komiks z serwisu xkcd (rys. 3).

Rysunek 3: Łatwo dosyć jest stworzyć sztuczną inteligencję, która coś naśladuje (powtarzajac)

Oczywiście sprawa nie jest tak prosta jak się wydaje na pierwszy rzut oka, ale…

W prezentacji wspomniałem o dwu przykładach działania sztucznej inteligencji pierwszy dotyczył inteligentnego skalowania fotografii [7]. Efekty nie są może „porażające”, ale widać, że algorytm „stara się”.

Potencjalnie znacznie ciekawszy jest drugi przykład tworzenia realistycznych „fotografii” na podstawie opisu słownego [8]. Ale trzeba sobie zdawać, że tak na prawdę, jest to zadanie „odwrotne” do zadania klasyfikacji: zaleźć trzeba punkt w przestrzeni cech możliwie najbliższy prototypom o opisanych cechach.

groch1

Trudna sztuka cytowania (i tworzenia bibliografii)

27 czerwca 2017 Wojciech Myszka

System LaTeX posiada (może nie znakomite, ale całkiem niezłe) narzędzie do tworzenia bibliografii. Jest to system BibTeX.

Działa on w ten sposób, że tworzymy bazę danych zawierające wszelkie niezbędne informacje o publikacjach, a pisząc pracę odwołujemy się do rekordów tej bazy. Każdy rekord powinien posiadać swój unikatowy identyfikator służący do tworenia odwołań. Każdy rekord powinien zawierać minimalny, niezbędny zestaw informacji bibliograficznych. Zestaw ten jest różny dla różnych publikacji: inny dla artykułu, a inny dla książki. W najprostszym wypadku w tekście umieszczamy polecenie \cite{identyfikator_rekordu} i o sprawie ,,zapominamy”.

Druga część systemu to mechanizm pozwalający podczas kompilacji dokumentu wyciągnąć z bazy danych informacje o cytowanych dokumentach i sformatować je zgdonie z wymaganym szablonem, a następnie wszystko połączyć w całość: w miejscu tekstu gdzie pojawiło się odwołanie do rekordu ( \cite{identyfikator_rekordu}) pojawi się odpowiedni symbol cytowania (na przykład liczba w nawiasach kwadratowych: [123]), a w innym miejscu (na przykład na końcu dokumentu) pojawi się ułożona w zdefiniowanej kolejności (alfabetycznie, według nazwisk pierwszego autora, albo chronologicznie według dat publikacji, albo w kolejnosci cytowania w pracy) lista prac (oznaczonych odpowiednimi symbolami). Numerkami w nawiasach kwadratowych, na przykład. Co więcej bibliografia będzie sformatowana zgdonie z wymaganiami wydawcy (co, swoją drogą jest sporym problemem: dobrzy wydawcy dostarczają odpowiednie szablony, kiepscy mają jedynie wskazówki jak powinien wyglądać wpis dotyczący książki, artykułu, referatu konferencyjnego,… Wówczas Autor musi albo taki szablon stworzyć (nie zawsze jest to łatwe) albo wybrać taki, który jak najbardziej jest zgodny z oczekiwaniami wydawcy. To też nie jest łatwe.

Osobną kwestią jest wypełnienie bazy danych rekordami. Tak się składa, że system BibTeX jest jednym z niewielu standardów udostępniania informacji bibliograficznych powszechnie uznanych i stosowanych przez naukowców na całym świecie (choć niekoniecznie w Polsce). W związku z tym bardzo wielu wydawców i większość publikacyjnych baz danych oferuje metadane artykułów w tym formacie. Istnieją również narzędzia pozwalające na podstawie DOI odzyskanie metadanych w formacie BibTeXa (http://www.doi2bib.org/).

Najlepszą metodą tworzenia takiej bazy jest metoda ręczna: jak mamy w ręku oryginał tekstu, który chcemy w niej zachować, wpisujemy do bazy niezbędny zestaw informacji. Program JabRef podpowie, które pola są niezbędne. Nie jest to wielka praca, ale trzeba ją wykonać wtedy kiedy oryginał mamy w ręku.

Z drugiej strony cytujemy często prace które znajdujemy w Internecie poszukując określonych słów kluczowych albo fraz. Google Scholar oferuje możliwość udostępnienia informacji blibliograficznych. Załóżmy że szukamy tekstu zatytułowanego The alternating decision tree learning algorithm. Google Scholar znajduje nawet tekst źródłowy, co więcej informuje, że artykuł jest całkiem popularny (jest tam informacja ile razy był cytowany).

Jest wreszcie informacja pozwalająca mająca, w zamierzeniu Autorów systemu, ułatwić zacytowanie artykułu. Klikamy w ,,Cytuj” i w następnym okienku znajdujemy możliwość uzyskania cytowania w formacie BibTeXa.

@inproceedings{freund1999alternating,
 title    ={The alternating decision tree learning algorithm},
 author   ={Freund, Yoav and Mason, Llew},
 booktitle={icml},
 volume   ={99},
 pages    ={124--133},
 year     ={1999}
}

@inproceedings{freund1999alternating,

title ={The alternating decision tree learning algorithm},

author ={Freund, Yoav and Mason, Llew},

booktitle={icml},

volume ={99},

pages ={124--133},

year ={1999}

}

Bardzo wielu PT Twórców mając coś takiego wkleja odpowiedni rekord do swoje bazy danych. Wyszukiwarka jest wspaniała! Znalazła nam pożyteczny tekst, znalazła jego wersję elektroniczną i jeszcze oferuje metadane. A wszystko za darmo!

Problem pojawi się na znacznie późniejszym etapie, podczas formatowania bibliografii, gdyż jako tytuł książki w której ukazał się artykuł konferencyjny mamy podanie ,,icml”, a cytowana praca objawia się tak:

[50] Y. Freund and L. Mason, The alternating decision tree learning algorithm,” in icml, Vol. 99, 1999, pp. 124–133.

I takie kursywiane icml przyciąga uwagę i, właściwie, nie pozwala na odnalezienie oryginału w sposób klasyczny (to znaczy nie korzystając z Internetu). Można, oczywiście, machnąć na to ręką: jak ktoś nie ma Internetu niech zajmie się czym innym niż pisaniem prac. Sam tytuł pozwala dosyć łatwo pracę odnaleźć (i wielu PT Autorów wychodzi z tego założenia dostarczając czasami tylko tytuł, albo tytuł i nazwisko jednego z twórców). W tym przypadku zaprotestowała Redakcja Techniczna czasopisma: zadając pytanie ,,To gdzie ta praca została opublikowana?” Ale Google Scholar podaje tylko ten wynik. Bo najlepszy, bo z tekstem źródłowym.

Po przełączeniu się na wyszukiwarkę normalną dostajemy nieco więcej informacji. Znajdujemy odsyłacz do biblioteki elektronicznej ACM, gdzie jest już nieco więcej informacji na temat źródła, co więcej również tu możemy poprosić o rekord zawierający metadane referatu w formacie BibTeXa:

@inproceedings{Freund:1999:ADT:645528.657623,
 author    = {Freund, Yoav and Mason, Llew},
 title     = {The Alternating Decision Tree Learning Algorithm},
 booktitle = {Proceedings of the Sixteenth International Conference on Machine Learning},
 series    = {ICML '99},
 year      = {1999},
 isbn      = {1-55860-612-2},
 pages     = {124--133},
 numpages  = {10},
 url       = {http://dl.acm.org/citation.cfm?id=645528.657623},
 acmid     = {657623},
 publisher = {Morgan Kaufmann Publishers Inc.},
 address   = {San Francisco, CA, USA},
}

@inproceedings{Freund:1999:ADT:645528.657623,

author = {Freund, Yoav and Mason, Llew},

title = {The Alternating Decision Tree Learning Algorithm},

booktitle = {Proceedings of the Sixteenth International Conference on Machine Learning},

series = {ICML '99},

year = {1999},

isbn = {1-55860-612-2},

pages = {124--133},

numpages = {10},

url = {http://dl.acm.org/citation.cfm?id=645528.657623},

acmid = {657623},

publisher = {Morgan Kaufmann Publishers Inc.},

address = {San Francisco, CA, USA},

}

I mamy już tytuł i wydawcę pracy.

Cóż zatem można radzić? Tworzenie Nauki powinno opierać się na korzystaniu ze źródeł ,,pierwotnych”. I tego się trzymajmy.

Bibliografia, Biblioteka

Bibliometria i więcej: kilka uwag nie na temat

23 listopada 2016 Wojciech Myszka Jeden komentarz

Po wielu latach przerwy (poprzedni raz konferencję KOWBAN odwiedzałem w roku 1994) postanowiłem zobaczyć co się tam dzieje. I w jesienny dzień pojechałem do Polanicy-Zdroju żeby przedstawić tam parę uwaga na temat, który mocno mnie (od dłuższego już czasu) nurtuje. Dokładniej na temat ekspozycji metadanych.

Od czasu rewelacji ogłoszonych przez Edwarda Snowdena (ale też kilku poważnych wpadek firm korzystających ze zbierania metadanych na temat naszych zachowań w Internecie) metadane nie mają najlepszej prasy, delikatnie mówiąc.

Z drugiej strony życie na uczelni całkowicie podporządkowane jest różnym fetyszyzowanym wskaźnikom bibliometrycznym, takim jak indeks h, liczba cytowań, Lista Filadelfijska. Co gorsza, nie należy spodziewać się, że to się zmieni w najbliższym czasie: dla urzędników (zwłaszcza tych co oceniają jednostki albo przyznają środki) bibliometria jest podstawowym narzędziem. Opierają się na niej również wszystkie rankingi uczelni.

Stąd w jasny sposób wynika, że powinno nam (na uczelniach) zależeć aby metadane wszystkich prac naukowych były jak najszerzej udostępniane: od tego zależy jak jesteśmy widoczni (co mocno łączy się z tym jak jesteśmy cytowani).

Poniżej znajdują się slajdy mojego wystąpienia:

biblio_prez

Dostępny jest również tekst pracy przedstawianej na konferencji (i opublikowanej w materiałach konferencyjnych): Bibliometria i więcej: kilka uwag nie na temat.

Bibliografia

Szablony BibTeXa

10 grudnia 2014 Wojciech Myszka

Ponieważ już jakiś czas temu opracowałem szablon bibliografii, który mimo że nie jest idealny, jakoś sprawdza się w publikacjach składanych dla Oficyny Wydawniczej Politechniki Wrocławskiej, postanowiłem go udostępnić publicznie.

Dodatkowo, podczas dyskusji kuluarowych pojawił się problem wyróżniania nazwiska wybranego autora. Szablon został zmodyfikowany.

Wszystko dostępne na stronach:

Strony WWW

Po co to wszystko?

3 lipca 2014 Wojciech Myszka Jeden komentarz

Czy korzystacie Państwo z jakiegoś menedżera bibliografii? Nie…
To, być może, powinienem napisać, że sprawa was nie dotyczy. Ale napiszę, że powinniście zacząć korzystać.

Osobne pytanie jest takie co to ma wspólnego z naszymi stronami WWW?

Wyobraźmy sobie, że ktoś w wyszukiwarkę wpisał hasło „plasma structure during extracorporeal circulation” (celowo wygrałem tak długą sekwencję wyrazów…) i trafił na naszą stronę. Jest ona po polsku (ale jest szansa, że niewielka ilość informacji go nie zniechęci, tym bardziej, że są jakieś tytuły prac konferencyjnych). A kliknięcie w tytuł przenosi do treści czy to całego artykułu, czy to streszczenia. Jeżeli mu się spodoba — może zechce zacytować? Żeby zacytować musi pracowicie przepisać dane referatu. Chyba, że korzysta z menedżera bibliografii/publikacji. Wówczas podstawowe dane bibliograficzne powinny być łatwo dostępne. I wspomniana strona tak właśnie je udostępnia. Po pierwsze można ściągnąć plik w formacie BibTeX (znakomita większość menedżerów bibliografii pozwala na import takiego pliku). Natomiast dane bibliograficzne zakodowane są w samej stronie www i dobry menedżer bibliografii sam to zauważy i pozwoli na zapisanie pozycji do bazy. Strona jest tak skonstruowany, że wyszukiwarki internetowe (Google Scholar, na przykład) również mają łatwy dostęp do informacji bibliograficznych.

Takie strony dają (niezbyt wielką, ale jednak) szansę na przyciągnięcie uwagi. Czy do samej zawartości stron, czy też do naszych publikacji. A to jest szansą zwiększenie widoczności uczelni, ~~instytutu~~ katedry i tematyki którą się zajmujemy.

I uznałem realizację ego właśnie celu za najistotniejszy sens istnienia „stron katedralnych”.