fbTrack
REKLAMA
REKLAMA

Wywiady

Jakość danych statystycznych nie ucierpiała na pandemii

materiały prasowe
Covid-19 zmienił sposób funkcjonowania służb statystycznych, ale nie wpłynęło to negatywnie na jakość i kompletność gromadzonych danych – zapewnia dr Dominik Rozkrut, prezes GUS.

"Rzeczpospolita": Prof. Leszek Balcerowicz w „Trzeba się bić” wspomina, że na początku transformacji gospodarczej w Polsce oficjalne dane wyolbrzymiały skalę załamania aktywności ekonomicznej, bo obejmowały głównie państwowe przedsiębiorstwa, które upadały, nie obejmowały zaś powstających w ich miejsce prywatnych firm. Statystyka publiczna nie nadążała za zmianami strukturalnymi. Dziś mierzymy się z największym od transformacji gospodarczym wstrząsem. Czy mamy podobny jak wtedy problem ze statystyką? Jesteśmy w stanie uchwycić tak turbulentną rzeczywistość?

dr Dominik Rozkrut: Od tamtego czasu wiele się w statystyce publicznej zmieniło. Prowadzimy badania znacznie lepiej, korzystając z nowocześniejszych metod. Cały program badań jest też dobrze przemyślany, aby oddawał najistotniejsze procesy w gospodarce i społeczeństwie. Ta jakościowa zmiana to jest też wynik postępującej integracji i harmonizacji systemów statystycznych na poziomie międzynarodowym, nie tylko na szczeblu UE. Nie podpisałbym się pod tezą, że badania, które są efektem wieloletnich prac ekspertów z całego świata, nie odpowiadają na potrzeby informacyjne, nawet te, które pojawiły się w czasie epidemii. To prawda, że mamy do czynienia z istotnymi zmianami w gospodarce, ale jesteśmy w stanie je poprawnie zidentyfikować. Wymaga to jednak często zgłębienia metodyki badań, aby poprawnie zinterpretować jej wyniki. Zwykle w dyskursie publicznym pomija się np. to, że dane dotyczące przeciętnego wynagrodzenia w sektorze przedsiębiorstw obejmują tylko podmioty z co najmniej 10 pracownikami. My zawsze to w komunikatach podkreślamy, ale potem w mediach to umyka. Mam wrażenie, że w trakcie epidemii zainteresowanie takimi szczegółami i poprawną interpretacją publikowanych przez nas wskaźników wzrosło. To pozytywne zjawisko.

Wiele osób odkryło, że przeciętne zatrudnienie w sektorze przedsiębiorstw nie informuje o liczbie pracowników, tylko o liczbie pełnych etatów. Ten niuans radykalnie zmienia interpretację ostatnich spadków tak liczonego zatrudnienia. Okazuje się, że były to w dużej mierze pożądane skutki tarcz antykryzysowych, które zachęcały do ograniczania wymiaru czasu pracy zamiast zwalniania pracowników.

Tak. Spadek przeciętnego zatrudnienia wynikał także z korzystania z zasiłków opiekuńczych, których dostępność w trakcie pandemii została zwiększona. Pracownicy przebywający na takich zasiłkach odpowiednio długo nie są ujmowani wśród zatrudnionych. Wyjaśnialiśmy to w naszych komunikatach. Przyznaję jednak, że właściwej interpretacji danych nie ułatwia to, że GUS prowadzi wiele różnych badań w określonym obszarze tematycznym. Na przykład badając zatrudnienie w sektorze przedsiębiorstw uwzględniamy tylko podmioty z co najmniej 10 pracownikami, a w badaniu popytu na pracę także mniejsze podmioty.

Z dwóch różnych źródeł pochodzą dane dotyczące bezrobocia, które też budzą sporo kontrowersji. Z jednej strony mamy wskaźnik obejmujący osoby zarejestrowane jako bezrobotne w urzędach pracy, z drugiej zaś osoby, które w badaniu aktywności ekonomicznej ludności (BAEL) deklarują, że nie mają pracy, ale jej szukają. Od dawna wiadomo, że te dwa zbiory się nie pokrywają, ale epidemia pogłębiła te rozbieżności. Pojawiło się sporo osób, które straciły pracę, ale nie spełniają żadnej definicji bezrobotnego, bo nie szukają chwilowo nowego zatrudnienia. Jednocześnie wśród bezrobotnych pojawili się ludzie, którzy pracowali za granicą i gdy tylko pojawi się taka możliwość, znów wyjadą. Czy dostrzega pan potrzebę publikowania kilku różnych wskaźników bezrobocia, z których każdy opierałby się na nieco innej definicji? Taki system istnieje np. w USA.

Bylibyśmy w stanie to zrobić. BAEL, o którym pan wspomniał, to badanie prowadzone zgodnie z ogólnoeuropejską metodologią, które zapewnia porównywalność wyników między krajami. I to badanie obejmuje też wszystkie te osoby, których związek z rynkiem pracy jest nietypowy. Jeśli będzie taka potrzeba, przeanalizujemy te dane tak, aby sprawdzić, na ile liczba takich osób wzrosła w związku z pandemią i jak to zaburza statystyki bezrobocia.

Pytanie o to, czy nasze podstawowe wskaźniki makroekonomiczne przystają do zmienionej rzeczywistości, nie było zawoalowaną krytyką GUS. Takie problemy mają też prywatne instytucje. Zawodny okazał się np. PMI, popularny wskaźnik koniunktury w przemyśle i usługach bazujący na ankiecie wśród menedżerów przedsiębiorstw. PMI jest tak skonstruowany, że na jego poziom pozytywnie wpływa czas dostaw, który zwykle wydłuża się wraz ze wzrostem popytu. W okresie pandemii wydłużał się jednak z powodu zaburzeń w handlu międzynarodowym. To ograniczało spadki PMI sugerując, że aktywność w przemyśle jest większa niż była w rzeczywistości.

Zgadzam się, że obecnie, aby właściwie interpretować dane, trzeba mieć duże wyczucie co do tego, jak się zmieniły pewne procesy i zależności ekonomiczne. W przypadku wskaźników opartych na badaniach opinii, jak PMI czy nasze wskaźniki koniunktury, duże wahania są naturalne i nigdy nie można ich traktować dosłownie. Spadek takiego wskaźnika o 50 proc. nie znaczy, że tak samo zmalała produkcja. Takie wskazanie to tylko pewne podsumowanie subiektywnych opinii przedsiębiorstw, które oczywiście ma walor poznawczy, ale nie tak bezpośredni.

Jak rozumie pan to, że publikacje PMI odbijają się na rynkach finansowych i w mediach większym echem niż publikacje ankietowych wskaźników koniunktury GUS?

PMI faktycznie odbiera nieco uwagi naszym wskaźnikom koniunktury, ale to nie wynika z tego, że te drugie są gorsze. Przeciwnie. Nie chcę deprecjonować wartości PMI, ale wskaźniki koniunktury GUS bronią się same. Powstają na podstawie comiesięcznego badania przeszło 22 tys. podmiotów, a mimo to jest to nasza najszybsza publikacja (ukazuje się pod koniec miesiąca, którego dotyczy; PMI jest dostępny tylko dla polskiego przemysłu, bazuje na ankiecie wśród ponad 200 firm i ukazuje się pierwszego roboczego dnia po zakończeniu miesiąca, którego dotyczy – red.). Skala naszych badań jest tak duża, że pozwala na analizę sytuacji w pojedynczych sekcjach PKD (polska klasyfikacja działalności – red.). Osobiście sądzę, że wskaźniki koniunktury GUS są niedoceniane.

Ma pan poczucie, że GUS nie wykorzystuje potencjału danych, które gromadzi?

Odkąd zostałem z prezesem jednym z moich priorytetów jest to, żebyśmy lepiej analizowali i prezentowali nasze dane. Zrezygnowaliśmy z publikowania samych tablic z danymi. Obecnie publikacje mają charakter bardziej analityczny, są opatrzone wprowadzeniem do tematyki. Chcemy, żeby odbiorcy naszych publikacji mogli z nich jak najwięcej wyciągnąć. Mamy jeszcze w tym obszarze sporo do zrobienia, ale też ta strategia ma pewne limity. GUS w pierwszym rzędzie powinien udostępniać dane pierwotne, dostarczając innym materiału do analiz. Mimo to będziemy chcieli zwiększyć liczbę publikacji, które wychodzą poza sztampę statystyczną, łączą dane z różnych źródeł i wchodzą w głąb natury procesów ekonomicznych i społecznych. Przykładem takiej publikacji są doroczne raporty o sytuacji makroekonomicznej w Polsce.

Być może danych jest tak dużo, że pozwalałyby na skonstruowanie jakichś nowych, syntetycznych i szybkich wskaźników aktywności w gospodarce? Zapotrzebowanie na nie z pewnością jest. PKO BP i Pekao skonstruowały własne wskaźniki, oparte m.in. na danych dotyczących transakcji kartami oraz ruchu na drogach, pokazujące aktywność w gospodarce z częstotliwością nawet większą niż miesięczna. GUS ma coś podobnego w planach?

Statystyka publiczna stara się realizować badania i dostarczać wyniki w sposób obiektywny. Syntetyczne wskaźniki wymagają zaś przyjęcia pewnych założeń, które z natury rzeczy mają charakter subiektywny. Obawiam się, że konstruując takie wskaźniki narazilibyśmy się na zarzut, że próbujemy wpływać na przekaz, na interpretację wyników. Dlatego takie formuły analityczne zostawiamy zewnętrznym podmiotom. Natomiast żeby oni mogli to robić, my musimy dostarczać możliwie często możliwie dokładnych danych. Tu na pewno istnieje duża przestrzeń do poprawy, ale wymaga to rozwiązania problemu, którym zajmuję się na poziomie europejskim jako przewodniczący grupy zadaniowej ds. dostępu do danych prywatnych przez urzędy statystyczne. Chodzi o to, że prywatne firmy często dysponują danymi, które mogłyby być przydatne w statystyce publicznej. Np. operatorzy telefoniczni mają dane dotyczące przemieszczania się posiadaczy telefonów, które mogłyby ułatwić walkę z epidemią Covid-19. Moim zdaniem istnieje potrzeba rozszerzenia roli urzędów statystycznych, aby stały się opiekunami ładu informacyjnego (ang. data steward), czyli nie tylko zbierały dane i produkowały na ich podstawie pewne wskaźniki, ale też dbały o jakość i bezpieczeństwo całego ekosystemu danych.

GUS stałyby się platformą, która udostępniałaby wszelkie statystyki dotyczące Polski, nawet nie pochodzące z własnych badań? Dzisiaj te dane są rozproszone po wielu różnych instytucjach, także państwowych.

Tak, chodzi o to, żeby wszystko było spójne, dopasowane, zharmonizowane. I żeby użytkownicy mieli do tych danych łatwy dostęp, na przykład z wykorzystaniem oferowanych przez nas API, czyli mechanizmów pozwalających na automatyczne pobieranie zasobów. To są rozwiązania przyszłości, które dają sektorowi prywatnemu możliwość tworzenia rozmaitych aplikacji bazujących na naszych zbiorach danych.

Wróćmy do pandemii. Jak wpłynęła ona na możliwości prowadzenia badań przez GUS?

Mieliśmy już wcześniej przygotowany plan działania w warunkach kryzysu, ale on dotyczył problemów o charakterze lokalnym, takich jak powódź. Ten kryzys, zupełnie inny, obejmujący cały kraj, był dla nas, jak dla wszystkich urzędów, ogromnym zaskoczeniem. Musieliśmy bardzo szybko zareagować i uważam, że wyszło nam to bardzo dobrze. Byliśmy jednym z pierwszych urzędów centralnych, które zadecydowały się przejść na pracę zdalną. To było wyzwanie informatyczne, z którym sobie poradziliśmy. Zastosowaliśmy podpis cyfrowy i w pełni elektroniczny obieg dokumentów. Te doświadczenia mogą pozwolić lepiej zorganizować pracę GUS ale też innych struktur publicznych w przyszłości. Jedną z najtrudniejszych decyzji było wycofanie się z bezpośrednich wywiadów z gospodarstwami domowymi. Wbrew obawom, nie doprowadziło to do spadku kompletności i jakości uzyskiwanych danych. Co więcej, na początek kwietnia mieliśmy zaplanowany spis próbny do spisu powszechnego, który odbędzie się w 2021 r. Planujemy korzystać z wielu źródeł danych, m.in. informacji z urzędów, wywiadów telefonicznych i internetowych, a także jeśli będzie możliwość, z wywiadów bezpośrednich. Przeprowadziliśmy ten próbny spis eliminując jednak wywiady bezpośrednie, dzięki czemu jesteśmy przygotowani na wypadek, gdyby właściwy spis przyszło nam realizować w warunkach epidemii.

Bezpośrednie wizyty ankieterów GUS są wykorzystywane także w badaniach cen. Z tego też było trzeba zrezygnować, co było jedną z przyczyn jednomiesięcznej przerwy w publikacji tzw. szybkich szacunków inflacji. Jak teraz zbierane są dane na temat cen?

Tradycyjnie te dane zbierali ankieterzy wizytujący punkty handlowe. Ale już od dwóch lat prowadzimy szeroko zakrojony program, który zmierza do wykorzystania w badaniach cen narzędzi big data i danych z kas (ang. scanner data), które uzyskujemy od wielu sieci handlowych. Teraz mogliśmy się tymi danymi posłużyć. Coraz więcej danych o cenach otrzymujemy też od ich gestorów, np. centrali Orlenu. W trakcie epidemii w tych punktach handlowych, które normalnie byłyby odwiedzane przez ankieterów, zbieraliśmy informacje telefonicznie lub mailowo. Od początku lipca, wraz ze stopniowym poluzowaniem obostrzeń, dopuściliśmy ponownie wizyty ankieterów w jednostkach handlowych, ale tylko w wyjątkowych przypadkach. Rezygnacja z publikacji szybkiego szacunku inflacji w marcu wynikała z innego problemu. Niektóre jednostki handlowe, np. targowiska i punktu usługowe zostały zamknięte. Potrzebne były międzynarodowe ustalenia, aby to ograniczenie wszędzie obchodzić w ten sam sposób.

Niedostępność niektórych usług, zamknięcie części sklepów, a także ograniczenia kontaktów społecznych wyraźnie wpłynęły na strukturę wydatków konsumpcyjnych. To zwiększyło rozdźwięk między odczuciami inflacyjnymi a oficjalnymi jej szacunkami. Przykładowo, w ostatnich miesiącach mocno potaniały paliwa, co ciągnęło w dół inflację, ale konsumenci mogli tego nie odnotować, bo znacznie rzadziej korzystali z samochodów. Czy to unaoczniło potrzebę częstszej aktualizacji koszyka dóbr i usług, który jest podstawą do pomiarów inflacji, a który powinien odzwierciedlać strukturę wydatków przeciętnego konsumenta?

To jest bardzo ciekawy temat, rozmawiamy o tym w gremiach międzynarodowych. Problemem jest jednak szybkie zebranie aktualnych danych o strukturze wydatków (zwykle służy temu trwające cały rok badanie budżetów gospodarstw domowych – red.). Gdyby jednak taki wskaźnik inflacji powstał, to będzie miał charakter uzupełniający, służący temu, żeby zobaczyć, jak kryzys wpłynął na wydatki. Wraz z zanikiem zagrożenia epidemicznego struktura konsumpcji powinna się jednak zbliżyć do tej sprzed kryzysu i wtedy jej badanie z częstotliwością roczną będzie wystarczające.

Sporo takich zmian strukturalnych w gospodarce, najprawdopodobniej przejściowych, GUS już wychwycił. W komunikatach dotyczących wyników sprzedaży detalicznej pojawiła się informacja o udziale sprzedaży przez internet.

Cały czas zastanawiamy się, co możemy zrobić, żeby dostarczyć więcej danych na temat przebiegu epidemii i jej gospodarczych konsekwencji. Mieliśmy świadomość, że rola zakupów przez internet może wzrosnąć, więc postanowiliśmy to monitorować. Dane na ten temat zawsze były gromadzone, tylko wcześniej nie było potrzeby ich pokazywania. Ale też pod wpływem Covid-19 zaczęliśmy prowadzić również dodatkowe badania. I byliśmy jednym z pierwszych urzędów statystycznych na świecie, który to zrobił, i jednym z najbardziej ambitnych jeśli chodzi o zakres tych pandemicznych badań.

Daje się to zauważyć we wspomnianych badaniach koniunktury.

To było pierwsze badanie, w którym dodaliśmy pytania podyktowane epidemią, co spotkało się z dużym zainteresowaniem odbiorców. Rozszerzyliśmy zarówno badanie wśród przedsiębiorstw, jak i wśród gospodarstw domowych. Ale takich wzbogaconych publikacji jest naprawdę wiele. Na stronie internetowej GUS jest specjalna zakładka, gdzie można je wszystkie znaleźć. W niektórych krajach, np. w USA i Kanadzie, urzędy statystyczne zdecydowały się przeprowadzić dodatkowe, oddzielne badania na stosunkowo małych próbach. My poszliśmy inną drogą, rozszerzając bieżące badania cykliczne.

Zapotrzebowanie na informacje o kondycji przedsiębiorstw wrosło w trakcie pandemii na tyle, że własne badania zaczęły prowadzić organizacje biznesowe, ale też np. Polski Instytut Ekonomiczny. Czy przedsiębiorstwa, z których wiele znalazło się w trudnej sytuacji, nie odmawiają udziału w tych wszystkich ankietach?

Też zastanawiałem się, czy taki efekt wystąpi. Ale nie wystąpił. Wszystkie dodatkowe pytania zostały wprowadzone na zasadzie dobrowolności i okazało się, że respondenci chętnie na nie odpowiadają. Przedsiębiorstwa są przyzwyczajone do naszych badań i mam wrażenie, że zdają sobie sprawę z tego, że ostatecznie to one same są beneficjentami tego, że dysponujemy w kraju dobrej jakości danymi. Tym tłumaczę sobie to, że prowadzone w trakcie pandemii badania były równie kompletne co zawsze i nawet nie było trzeba wysyłać więcej niż zwykle ponagleń.

A abstrahując od pandemii, jak zmienia się w czasie kompletność badań ankietowych? Chodzi mi o te formularze, które firmy mają obowiązek wypełniać. Nie tylko w Polsce istnieje teoria z gatunku spiskowych, wedle której publiczne statystyki są coraz gorszej jakości, bo opierają się na coraz mniejszych próbach. Podobno firmy są tak obciążone rozmaitymi obowiązkami regulacyjnymi, że niechętnie wypełniają formularze.

Prawdą jest, że na całym świecie mamy do czynienia z wieloletnim trendem spadku kompletności badań statystycznych. To jest powolny, ale systematyczny spadek. Dlatego zaczęliśmy zwiększać liczbę źródeł danych, z których korzystamy. Chodzi przede wszystkim o źródła administracyjne, takie jak Ministerstwo Finansów, urzędy skarbowe i ZUS. Dzięki temu możemy zmniejszać obowiązki sprawozdawcze firm, szczególnie te, które są zdublowane.

MF niechętnie dzieli się danymi. Wiadomo, że zeznania podatkowe to bardziej wiarygodne źródło danych o rozkładzie dochodów w Polsce niż ankietowe badania, na podstawie których ten rozkład ocenia GUS. Ale MF dopiero w ub.r. po raz pierwszy zdecydował się na publikację takiej analizy.

Uzyskanie dostępu do danych MF rzeczywiście było zawsze dużym wyzwaniem, ale w ub.r. udało się pokonać największe bariery. Zawarliśmy z MF porozumienie, które będzie prowadziło do zmniejszenia obciążeń sprawozdawczych firm, a jednocześnie statystyk będzie więcej i będą ciekawsze. W ramach tego porozumienia uzyskaliśmy też dostęp do nowych zasobów MF, np. danych z jednolitych plików kontrolnych. W tym miejscu chciałbym podkreślić, że na tej podstawie będziemy generowali tylko informację zbiorczą, stanowiącą swego rodzaju dobro publiczne. W rozporządzeniu o ochronie danych osobowych służby statystyki publicznej mają na to zgodę.

Sądzi pan, że GUS wróci z czasem wróci do poprzednich praktyk badawczych, czyli np. wizyt ankieterów w punktach handlowych w przypadku badania inflacji?

Obecne praktyki na pewno się utrwalą, nie ma od nich odwrotu. Mówimy o nowej normalności, zdecydowanie innej niż wcześniejsza. W przypadku badania cen, wizyty ankieterów w punktach handlowych są potrzebne w ograniczonym zakresie. Latem istotne są pewne produkty sezonowe, o których informacje da się zebrać tylko w taki tradycyjny sposób.

Jakie jeszcze alternatywne źródła danych, oprócz kas fiskalnych i baz innych organów administracji publicznej, wykorzystuje dziś GUS?

Przede wszystkim rozwijamy narzędzia big data, korzystamy ze sztucznej inteligencji. Już dwa lata temu w urzędach regionalnych zaczęliśmy tworzyć ośrodki inżynierii danych, które angażują się w badania eksperymentalne z wykorzystaniem nowych danych. W niektórych z tych badań mamy sukcesy na skalę światową. Przykładowo, korzystamy ze zdjęć satelitarnych do oceny produkcji rolnej. Wykorzystujemy też dane geolokalizacyjne statków do produkcji nowych statystyk związanych z ochroną środowiska. Docelowo tak samo będziemy mogli wykorzystywać dane z bramownic na drogach. Kolejnym narzędziem jest web scrapping, czyli automatyczne gromadzenie danych z internetu. Na przykład publikowane co miesiąc dane dotyczące obłożenia bazy turystycznej oraz cen noclegów w dużej mierze pochodzą z takich eksperymentalnych źródeł. Przymierzamy się do wykorzystania tej samej metody w badaniu rynku pracy. Ale już kilka lat temu web scrapping pomagał nam oceniać nakłady na badania i rozwój.

W zeszłym roku głośno było o podejrzeniach, jakoby GUS manipulował danymi dotyczącymi inflacji, aby pokazać, że jest ona niższa niż w rzeczywistości. W dyskusjach w mediach społecznościowych widać, że ten pogląd jest do dziś dość powszechny. Takie spiskowe teorie to efekt niewiedzy na temat tego, jak mierzy się inflację?  

Tak sądzę. Oczywiście w sposób obiektywny należy stwierdzić, że badania statystyczne, w tym inflacji, to dość skomplikowana materia. Staramy się reagować w dwojaki sposób. Dbamy o transparentność realizacji badań, udostępniamy ich metodologię, spotykamy się z interesariuszami, na bieżąco staramy się wyjaśniać pojawiające się wątpliwości. Strategicznie natomiast staramy się intensywnie wpierać i rozwijać edukację statystyczną i mam nadzieję, że z czasem takie nieporozumienia będą coraz rzadsze. Przykładowo, w naszej olimpiadzie statystycznej rok w rok bierze udział około 3 tys. uczniów ze szkół średnich. Myślę, że w ciągu 10 lat będziemy więc mieli armię 30 tys. osób, które lepiej będą znać i doceniać statystykę publiczną.

Źródło: Rzeczpospolita
REKLAMA
REKLAMA
REKLAMA
REKLAMA
NAJNOWSZE Z RP.PL
REKLAMA
REKLAMA
REKLAMA