Jak to działa

Poniżej wyjaśnimy w jaki sposób to wszystko funkcjonuje. W skrócie - stworzyliśmy robota, który robi większość czynności za nas, korzystając z otwartych informacji polskiej Wikipedii.

Tworzenie listy roślin występujących w Polsce

Robot czyta nazwy łacińskie roślin wyszczególnionych w następujących artykułach z Wikipedii:

Sprawdzanie poprawności nazw i poszukiwanie synonimów

Po zebraniu nazw łacińskich roślin, robot korzysta z bazy The Plant List sprawdzając, czy dana nazwa jest nazwą główną, czy synonimem. Jeśli okazuje się synonimem - korzysta z nazwy głównej. .

Pobieranie informacji z Wikipedii

Robot ściąga artykuły dla roślin obecnych w Wikipedii, a następnie przetwarza je tak, by uzyskać jak najwięcej informacji na temat morfologii. Uzyskane w ten sposób cechy grupuje w sposób zdefiniowany przez nas i dodaje do bazy danych atlasu.

Następnie robot poszukuje taksonomii danej rośliny w bazie GBIF i dodaje wynik do bazy atlasu. W ostatnim etapie, korzystając z API Wikipedii, robot pobiera zdjęcia roślin z polskiej Wikipedii oraz z Wikimedia. Informacje o autorstwie zdjęć i zasadach udostępniania są pobierane z użyciem API wmflabs.

Dodatkowe zdjęcia robot pobiera ze strony http://www.actaplantarum.org/acta/galleria.php udostępnianych na zasadach Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License oraz z http://www.biolib.de udostępniającej skany z książek botanicznych, które przeszły do Domeny Publicznej.

Potwierdzanie informacji

Wpisy dotyczące nowych roślin są przeglądane przez człowieka, cechy charakterystyczne są na tym etapie ewentualnie modyfikowane. Zduplikowane zdjęcia również są usuwane. Uwaga: nie jesteśmy w stanie na bieżąco przeglądać bazy (zapraszamy do współpracy!), dlatego zawsze podchodź do prezentowanych tu informacji ostrożnie i potwierdź w innych źródłach.

Zawartość bazy danych

Baza zawiera 2358 roślin rosnących dziko bądź w uprawie na terenie Polski. Baza zawiera również 80564 miejsc występowania roślin z bazy GBIF oraz 298 wprowadzonych przez Użytkowników atlasu. Dla łatwiejszej identyfikacji, baza zawiera 67744 zdjęć (+ 369 dodanych przez Użytkowników) różnych części roślin udostępnianych w Internecie na zasadach Creative Commons bądź będących w domenie publicznej.
Nie wszystkie rośliny występują w bazie: z informacji o roślinach występujących w Polsce [1, 2, 3] wynika, że brakuje nam około 971 roślin (zobacz poniżej jak możesz to zmienić), co więcej - w przypadku 69 roślin nie posiadamy zdjęć co znacznie utrudnia ich identyfikację (zobacz poniżej jak możesz to zmienić). Wierzymy, że z upływem czasu baza będzie systematycznie uzupełniana, m.in. dzięki Wam.

Histogram liczby cech przypisanych roślinom

Statystyki poszczególnych cech przypisanych roślinom

GrupaCecha# roślin
ogólne krzewinka 32
ogólne drzewo 279
ogólne krzew 210
ogólne roślina wodna 110
ogólne roślina trująca 298
ogólne roślina lecznicza 452
ogólne roślina jadalna 257
ogólne roślina miododajna 169
barwa kwiatów płatki pomarańczowe 53
barwa kwiatów płatki białe 803
barwa kwiatów płatki różowe 508
barwa kwiatów płatki czerwone 341
barwa kwiatów płatki fioletowe 466
barwa kwiatów płatki niebieskie 176
barwa kwiatów płatki żółte 718
barwa kwiatów płatki zielone 326
barwa kwiatów płatki brązowe 92
kształt korony korona o płatkach zrośnietych 2
kształt korony korona o płatkach wolnych 1
kształt korony kwiaty zwisające 141
kształt korony kwiatostan 590
kształt korony baldachy 230
kształt korony kwiat złożony 30
liczba płatków płatki trzy i mniej 43
liczba płatków płatki cztery 79
liczba płatków płatków pięć 212
liczba płatków płatków sześć i więcej 16
symetria kwiatu kwiat promienisty 80
symetria kwiatu kwiat grzbiecisty 129
symetria kwiatu kwiat motylkowy 77
blaszka liściowa liście okrągłe 94
blaszka liściowa liście lancetowate 706
blaszka liściowa liście nerkowate 39
blaszka liściowa liście wąskie i wydłużone 287
blaszka liściowa liście najszersze w połowie długości 37
blaszka liściowa liście najszersze przy końcu 187
blaszka liściowa liście najszersze przy nasadzie 86
blaszka liściowa igły 62
blaszka liściowa bez zielonych liści 2
blaszka liściowa liście sercowate 213
blaszka liściowa liście jajowate 796
ulistnienie ząbkowany 362
ulistnienie karbowany 148
ulistnienie całobrzegie 271
ulistnienie piłkowane 224
ulistnienie liście pierzaste 398
ulistnienie liście skrętoległe 268
ulistnienie naprzeciwległe 228
ulistnienie dłoniastodzielne 9
ulistnienie okółkowe 17
ulistnienie naprzemianległe 42
ulistnienie liście owłosione 643
ulistnienie ogonek liściowy obecny 444
ulistnienie bezogonkowe 336
ulistnienie u dołu łodygi lub odziomkowe 357
ulistnienie wcinane (wrębne, sieczne i klapowane) 283
kolor owoców białe 61
kolor owoców pomarańczowe 26
kolor owoców żółte 136
kolor owoców zielone 107
kolor owoców niebieskie 17
kolor owoców czarne 118
kolor owoców brązowe 209
kolor owoców czerwone 153
kolor owoców fioletowe 11
kształt owoców łuszczyna 81
kształt owoców rozłupki 141
kształt owoców mieszek 44
kształt owoców skrzydełka 108
kształt owoców torebki 480
kształt owoców jagoda 135
kształt owoców kuliste 278
kształt owoców niełupki 242
kształt owoców duże 19
kształt owoców ziarniak 60
kształt owoców strąki 96
kształt owoców orzechy 202
powierzchnia owocu pomarszczona 32
powierzchnia owocu żeberkowana 53
powierzchnia owocu gładka 84
powierzchnia owocu szorstka 10
powierzchnia owocu owłosiona 201
powierzchnia owocu kanciasta 48
sok pędu sok mleczny 16
wygląd łodygi łodyga trójkanciasta 47
wygląd łodygi łodyga czterokanciasta 68
wygląd łodygi łodyga gałęzista 674
wygląd łodygi łodyga szorstka 107
wygląd łodygi łodyga owłosiona 648
wygląd łodygi łodyga żebrowana 6
wygląd łodygi łodyga gładka 341
wygląd łodygi łodyga pełzająca 206
szacowana wysokość łodygi do kostki (0 < x < 15 cm) 120
szacowana wysokość łodygi od kostki do kolana (15< x <60 cm) 2
szacowana wysokość łodygi od kolana do pasa (60 < x < 100 cm) 353
szacowana wysokość łodygi od pasa do wysokości człowieka (100 < x < 200 cm) 225
szacowana wysokość łodygi wyższa od człowieka (> 200 cm) 263
zapach łodygi zapach aromatyczny 19
zapach łodygi zapach czosnkowy 2
zapach łodygi zapach nieprzyjemny 11
pora kwitnienia grudzień 2
pora kwitnienia luty 8
pora kwitnienia marzec 65
pora kwitnienia kwiecień 225
pora kwitnienia maj 598
pora kwitnienia czerwiec 980
pora kwitnienia lipiec 1057
pora kwitnienia sierpień 832
pora kwitnienia wrzesień 419
pora kwitnienia październik 121
pora kwitnienia listopad 8

Aktualizacja bazy danych

Korzystając z powyżej przedstawionego schematu, robot sprawdza co tydzień czy pojawiły się nowe rośliny w polskiej Wikipedii oraz czy obecne już w naszej bazie rośliny nie zostały zaktualizowane - jeśli tak, nanosi poprawki w atlasie.

Jak wynika z powyższego opisu, by uaktualnić bazę atlasu należy uaktualnić polską Wikipedię. Zachęcamy do samodzielnego dodawania artykułów o polskich roślinach (można to zrobić bez zakładania konta) - nie tylko wzbogacisz Wikipedię, ale jednocześnie atlas. Oczywiście Wikipedia (czy bardziej ogólnie - Wikimedia) umożliwia również dodawanie zdjęć roślin.

Jeśli jesteś zainteresowana/y dodaniem nowych roślin do Wikipedii, poniżej przygotowaliśmy spis pozycji, które prawdopodobnie występują w Polsce, ale nie występują w Wikipedii:

Warto pamiętać, że polscy Wikipedyści tworzą artykuły dotyczące roślin według pewnego schematu, który jest opisany tutaj.

Jeśli brakuje w atlasie rośliny, która jest obecna w Wikipedii, możesz albo nam o tym napisać, albo uzupełnić któryś z poniższych spisów roślin w Wikipedii:

Rozpoznawanie roślin na podstawie zdjęć

Rozpoznawanie wykorzystuje sieć neuronową resnet 101 wytrenowaną na podstawie zdjęć z atlasu za pomocą mxnet. Model można pobrać tutaj (licencja GPL).

Dokładność algorytmu rozpoznawania roślin na podstawie zdjęcia*:

w 77%przypadków roślina ze zdjęcia pojawia sięjako pierwsza na liście wyników
w 91%w pierwszej piątce
* - wyniki dla 25642 losowych, ogólnodostępnych w internecie zdjęć roślin, po wyłączeniu zdjęć użytych do trenowania sieci neuronowej (validation set, dlatego w rzeczywistości dokładność będzie nieznacznie mniejsza)

Licencja

Zawartość atlasu udostępniana jest na zasadach licencji Creative Commons BY-SA 3.0, ponieważ pochodzą one z Wikipedii. Zdjęcia natomiast opatrzone są informacją o licencji i autorstwie przy powiększeniu ich do pełnego rozmiaru. Jest to zazwyczaj licencja z rodziny Creative Commons lub domena publiczna. Jeśli Twoje zdjęcie znalazło się tu wbrew licencji, zgłoś to nam korzystając z przycisku Zgłoś błąd po prawej stronie okna.

Kod źródłowy

Kod źródłowy atlasu roślin jak i aplikacji na telefony mobilne można pobrać z repozytorium. Kod udostępniany jest na wolnej licencji GPL.