Jak to działa

Poniżej wyjaśnimy w jaki sposób to wszystko funkcjonuje. W skrócie - stworzyliśmy robota, który robi większość czynności za nas, korzystając z otwartych informacji polskiej Wikipedii.

Tworzenie listy roślin występujących w Polsce

Robot czyta nazwy łacińskie roślin wyszczególnionych w następujących artykułach z Wikipedii:

Sprawdzanie poprawności nazw i poszukiwanie synonimów

Po zebraniu nazw łacińskich roślin, robot korzysta z bazy The Plant List sprawdzając, czy dana nazwa jest nazwą główną, czy synonimem. Jeśli okazuje się synonimem - korzysta z nazwy głównej. .

Pobieranie informacji z Wikipedii

Robot ściąga artykuły dla roślin obecnych w Wikipedii, a następnie przetwarza je tak, by uzyskać jak najwięcej informacji na temat morfologii. Uzyskane w ten sposób cechy grupuje w sposób zdefiniowany przez nas i dodaje do bazy danych atlasu.

Następnie robot poszukuje taksonomii danej rośliny w bazie GBIF i dodaje wynik do bazy atlasu. W ostatnim etapie, korzystając z API Wikipedii, robot pobiera zdjęcia roślin z polskiej Wikipedii oraz z Wikimedia. Informacje o autorstwie zdjęć i zasadach udostępniania są pobierane z użyciem API wmflabs.

Dodatkowe zdjęcia robot pobiera ze strony http://www.actaplantarum.org/acta/galleria.php udostępnianych na zasadach Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License oraz z http://www.biolib.de udostępniającej skany z książek botanicznych, które przeszły do Domeny Publicznej.

Potwierdzanie informacji

Wpisy dotyczące nowych roślin są przeglądane przez człowieka, cechy charakterystyczne są na tym etapie ewentualnie modyfikowane. Zduplikowane zdjęcia również są usuwane. Uwaga: nie jesteśmy w stanie na bieżąco przeglądać bazy (zapraszamy do współpracy!), dlatego zawsze podchodź do prezentowanych tu informacji ostrożnie i potwierdź w innych źródłach.

Zawartość bazy danych

Baza zawiera 2355 roślin rosnących dziko bądź w uprawie na terenie Polski. Baza zawiera również 80529 miejsc występowania roślin z bazy GBIF oraz 220 wprowadzonych przez Użytkowników atlasu. Dla łatwiejszej identyfikacji, baza zawiera 67615 zdjęć (+ 318 dodanych przez Użytkowników) różnych części roślin udostępnianych w Internecie na zasadach Creative Commons bądź będących w domenie publicznej.
Nie wszystkie rośliny występują w bazie: z informacji o roślinach występujących w Polsce [1, 2, 3] wynika, że brakuje nam około 973 roślin (zobacz poniżej jak możesz to zmienić), co więcej - w przypadku 70 roślin nie posiadamy zdjęć co znacznie utrudnia ich identyfikację (zobacz poniżej jak możesz to zmienić). Wierzymy, że z upływem czasu baza będzie systematycznie uzupełniana, m.in. dzięki Wam.

Histogram liczby cech przypisanych roślinom

Statystyki poszczególnych cech przypisanych roślinom

GrupaCecha# roślin
ogólne krzewinka 31
ogólne drzewo 288
ogólne krzew 210
ogólne roślina wodna 111
ogólne roślina trująca 298
ogólne roślina lecznicza 451
ogólne roślina jadalna 255
ogólne roślina miododajna 170
barwa kwiatów płatki pomarańczowe 53
barwa kwiatów płatki białe 802
barwa kwiatów płatki różowe 509
barwa kwiatów płatki czerwone 340
barwa kwiatów płatki fioletowe 466
barwa kwiatów płatki niebieskie 176
barwa kwiatów płatki żółte 715
barwa kwiatów płatki zielone 327
barwa kwiatów płatki brązowe 93
kształt korony korona o płatkach zrośnietych 1
kształt korony korona o płatkach wolnych 1
kształt korony kwiaty zwisające 140
kształt korony kwiatostan 586
kształt korony baldachy 228
kształt korony kwiat złożony 30
liczba płatków płatki trzy i mniej 43
liczba płatków płatki cztery 78
liczba płatków płatków pięć 208
liczba płatków płatków sześć i więcej 16
symetria kwiatu kwiat promienisty 78
symetria kwiatu kwiat grzbiecisty 130
symetria kwiatu kwiat motylkowy 77
blaszka liściowa liście lancetowate 704
blaszka liściowa liście nerkowate 39
blaszka liściowa liście wąskie i wydłużone 286
blaszka liściowa liście najszersze w połowie długości 36
blaszka liściowa liście najszersze przy końcu 187
blaszka liściowa liście najszersze przy nasadzie 85
blaszka liściowa igły 62
blaszka liściowa bez zielonych liści 2
blaszka liściowa liście sercowate 211
blaszka liściowa liście jajowate 793
blaszka liściowa liście okrągłe 94
ulistnienie karbowany 148
ulistnienie całobrzegie 271
ulistnienie piłkowane 223
ulistnienie liście pierzaste 397
ulistnienie liście skrętoległe 264
ulistnienie naprzeciwległe 227
ulistnienie dłoniastodzielne 9
ulistnienie okółkowe 15
ulistnienie naprzemianległe 42
ulistnienie liście owłosione 640
ulistnienie ogonek liściowy obecny 442
ulistnienie bezogonkowe 334
ulistnienie u dołu łodygi lub odziomkowe 357
ulistnienie wcinane (wrębne, sieczne i klapowane) 283
ulistnienie ząbkowany 363
kolor owoców pomarańczowe 26
kolor owoców żółte 135
kolor owoców zielone 106
kolor owoców niebieskie 17
kolor owoców czarne 117
kolor owoców brązowe 206
kolor owoców czerwone 150
kolor owoców fioletowe 11
kolor owoców białe 60
kształt owoców rozłupki 141
kształt owoców mieszek 44
kształt owoców skrzydełka 108
kształt owoców torebki 477
kształt owoców jagoda 134
kształt owoców kuliste 273
kształt owoców niełupki 242
kształt owoców duże 19
kształt owoców ziarniak 60
kształt owoców strąki 96
kształt owoców orzechy 202
kształt owoców łuszczyna 81
powierzchnia owocu żeberkowana 53
powierzchnia owocu gładka 84
powierzchnia owocu pomarszczona 32
powierzchnia owocu szorstka 10
powierzchnia owocu owłosiona 197
powierzchnia owocu kanciasta 48
sok pędu sok mleczny 16
wygląd łodygi łodyga czterokanciasta 67
wygląd łodygi łodyga gałęzista 671
wygląd łodygi łodyga szorstka 107
wygląd łodygi łodyga owłosiona 644
wygląd łodygi łodyga żebrowana 6
wygląd łodygi łodyga gładka 340
wygląd łodygi łodyga pełzająca 207
wygląd łodygi łodyga trójkanciasta 47
szacowana wysokość łodygi do kostki (0 < x < 15 cm) 119
szacowana wysokość łodygi od kolana do pasa (60 < x < 100 cm) 353
szacowana wysokość łodygi od pasa do wysokości człowieka (100 < x < 200 cm) 226
szacowana wysokość łodygi wyższa od człowieka (> 200 cm) 264
zapach łodygi zapach aromatyczny 18
zapach łodygi zapach czosnkowy 2
zapach łodygi zapach nieprzyjemny 10
pora kwitnienia grudzień 2
pora kwitnienia luty 8
pora kwitnienia marzec 66
pora kwitnienia kwiecień 225
pora kwitnienia maj 597
pora kwitnienia czerwiec 979
pora kwitnienia lipiec 1058
pora kwitnienia sierpień 832
pora kwitnienia wrzesień 418
pora kwitnienia październik 121
pora kwitnienia listopad 8

Aktualizacja bazy danych

Korzystając z powyżej przedstawionego schematu, robot sprawdza co tydzień czy pojawiły się nowe rośliny w polskiej Wikipedii oraz czy obecne już w naszej bazie rośliny nie zostały zaktualizowane - jeśli tak, nanosi poprawki w atlasie.

Jak wynika z powyższego opisu, by uaktualnić bazę atlasu należy uaktualnić polską Wikipedię. Zachęcamy do samodzielnego dodawania artykułów o polskich roślinach (można to zrobić bez zakładania konta) - nie tylko wzbogacisz Wikipedię, ale jednocześnie atlas. Oczywiście Wikipedia (czy bardziej ogólnie - Wikimedia) umożliwia również dodawanie zdjęć roślin.

Jeśli jesteś zainteresowana/y dodaniem nowych roślin do Wikipedii, poniżej przygotowaliśmy spis pozycji, które prawdopodobnie występują w Polsce, ale nie występują w Wikipedii:

Warto pamiętać, że polscy Wikipedyści tworzą artykuły dotyczące roślin według pewnego schematu, który jest opisany tutaj.

Jeśli brakuje w atlasie rośliny, która jest obecna w Wikipedii, możesz albo nam o tym napisać, albo uzupełnić któryś z poniższych spisów roślin w Wikipedii:

Rozpoznawanie roślin na podstawie zdjęć

Rozpoznawanie wykorzystuje sieć neuronową inception-bn wytrenowaną na podstawie zdjęć z atlasu za pomocą mxnet.

Dokładność algorytmu rozpoznawania roślin na podstawie zdjęcia*:

w 50%przypadków roślina ze zdjęcia pojawia sięjako pierwsza na liście wyników
w 70%w pierwszej piątce
w 77%w pierwszej dziesiątce
w 82%w pierwszej dwudziestce
* - wyniki dla 52590 losowych, ogólnodostępnych w internecie zdjęć roślin, po wyłączeniu zdjęć użytych do trenowania sieci neuronowej

Licencja

Zawartość atlasu udostępniana jest na zasadach licencji Creative Commons BY-SA 3.0, ponieważ pochodzą one z Wikipedii. Zdjęcia natomiast opatrzone są informacją o licencji i autorstwie przy powiększeniu ich do pełnego rozmiaru. Jest to zazwyczaj licencja z rodziny Creative Commons lub domena publiczna. Jeśli Twoje zdjęcie znalazło się tu wbrew licencji, zgłoś to nam korzystając z przycisku Zgłoś błąd po prawej stronie okna.

Kod źródłowy

Kod źródłowy atlasu roślin jak i aplikacji na telefony mobilne można pobrać z repozytorium. Kod udostępniany jest na wolnej licencji GPL.