Co drzemie w bazie CEPiK

16 proc. pojazdów zarejestrowanych w Warszawie nie spełnia norm emisji spalin obowiązujących w Berlinie – to tylko jedna z informacji, jakie można wygrzebać z Centralnej Ewidencji Pojazdów i Kierowców, w skrócie zwanej CEPiK-iem.

Publikacja: 08.03.2017 10:42

Zgromadzone tam dane to źródło wielu ciekawych i cennych informacji, które dotąd leżały odłogiem. Jednak zaledwie osiem tygodni wystarczyło młodej, polskiej spółce technologicznej PiLab do zintegrowania danych z Centralnej Ewidencji Pojazdów (CEP) i Kierowców (CEK) i przeprowadzenia kilkudziesięciu analiz dotyczących statystyki pojazdów, Stacji Kontroli Pojazdów, czy uprawnień kierowców.

Młoda, innowacyjna firma PiLab - w ramach projektu pilotażowego, zrealizowanego w oparciu o platformę analityczną DataWalk - zweryfikowała jakość danych z baz CEK i CEP oraz przetestowała wybrane hipotezy analityczne. Przeprowadzone badania wykazały, że skala występowania błędów w bazie CEPiK waha się od 0,1 do 14,5 proc. wszystkich danych. Sytuacje te najczęściej dotyczą błędnie wprowadzonych danych lub ich braku.

- Dzięki nawiązanej współpracy analizy, które wcześniej trwały wiele godzin lub dni i wymagały zaawansowanych kompetencji bazodanowych, wykonywane są w kilka minut za pomocą intuicyjnego i w pełni interaktywnego interfejsu, pozwalającego swobodnie filtrować dane i przechodzić pomiędzy zbiorami - mówi dyrektor Dorota Cabańska z resortu cyfryzacji.

W ramach projektu sprawdzono różne ciekawostki, np. okazało się, że z danych wynika, iż ledwie 1,27 proc. pojazdów ma niższy stan licznika na kolejnym badaniu technicznym, co oznacza cofnięty licznik. Natomiast podłączając dane zewnętrzne, zawierające normy emisji spalin obowiązujące na terenie Unii Europejskiej, okazało się, że 16 proc. pojazdów zarejestrowanych w Warszawie mogłoby mieć zakaz poruszania się po Berlinie.

- Ten projekt pokazał, że wykorzystanie polskiej, innowacyjnej technologii w polskiej administracji może przynosić wielowymiarowe, realne korzyści – komentuje Piotr Woźny, wiceminister cyfryzacji.

Jak zaznacza, z jednej strony niestandardowe podejście i otwartość młodych firm przyspiesza prace nad kluczowymi projektami, z drugiej strony dla młodych firm takie projekty są dużym doświadczeniem, które będzie procentowało w przyszłości.

- Rozwój polskich firm technologicznych, tworzących własne rozwiązania, jest w interesie całej polskiej gospodarki - dodaje wiceminister.

PiLab to polska spółka technologiczna, która stworzyła platformę analityczną DataWalk. Pozwala ona łączyć duże zbiory danych w czasie liczonym w dniach. Platforma DataWalk jest wykorzystywana w sektorze finansowym i ubezpieczeniowym m.in. do wykrywania wyłudzeń, przeciwdziałania praniu brudnych pieniędzy czy analizowania i monitorowania procesów biznesowych. PiLab posiada spółkę-córkę w USA (działa pod nazwą DataWalk Inc.).

Zgromadzone tam dane to źródło wielu ciekawych i cennych informacji, które dotąd leżały odłogiem. Jednak zaledwie osiem tygodni wystarczyło młodej, polskiej spółce technologicznej PiLab do zintegrowania danych z Centralnej Ewidencji Pojazdów (CEP) i Kierowców (CEK) i przeprowadzenia kilkudziesięciu analiz dotyczących statystyki pojazdów, Stacji Kontroli Pojazdów, czy uprawnień kierowców.

Młoda, innowacyjna firma PiLab - w ramach projektu pilotażowego, zrealizowanego w oparciu o platformę analityczną DataWalk - zweryfikowała jakość danych z baz CEK i CEP oraz przetestowała wybrane hipotezy analityczne. Przeprowadzone badania wykazały, że skala występowania błędów w bazie CEPiK waha się od 0,1 do 14,5 proc. wszystkich danych. Sytuacje te najczęściej dotyczą błędnie wprowadzonych danych lub ich braku.

2 / 3
artykułów
Czytaj dalej. Subskrybuj
Ekonomia
Witold M. Orłowski: Słodkie kłamstewka
Ekonomia
Spadkobierca może nic nie dostać
Ekonomia
Jan Cipiur: Sztuczna inteligencja ustali ceny
Ekonomia
Polskie sieci mają już dosyć wojny cenowej między Lidlem i Biedronką
Ekonomia
Pierwsi nowi prezesi spółek mogą pojawić się szybko