Edukacja

Skąd brać dane gospodarcze do szerszych analiz? Otwarte rejestry vs. płatne rozwiązania


Kompleksowe zarządzanie ryzykiem biznesowym wymaga nie tylko dostępu do danych ze sprawozdań finansowych, ale i szeregu komplementarnych informacji wspierających decyzje na poszczególnych etapach. KRS, CEIDG, REGON, MSiG, CRBR i Biała Lista to tylko niektóre z wiarygodnych źródeł popularnie wykorzystywanych w biznesie.

Informacje z rejestrów handlowych i innych wiarygodnych źródeł danych wykorzystywane są w dużych i średnich firmach przede wszystkim w trzech procesach:

 1. Dodawaniu nowego kontrahenta do systemu (znanym również jako onboarding B2B)
 2. Weryfikacji wiarygodności kontrahenta, którego firma już posiada w swojej bazie w celu podjęcia decyzji (np. o przyznaniu kredytu)
 3. Monitoringu poziomu ryzyka w portfelu aktualnych klientów.

W zależności od organizacji, wszystkie te procesy mogą albo należeć do obowiązków działu ryzyka albo mogą być rozbite na różne działy – np. procesem nr 1 może zajmować się dział CRM czy dział wsparcia sprzedaży, a procesami 2 i 3 dział ryzyka. Warto tu również wspomnieć o tym, że w przypadku produktów online typu szybkie pożyczki na małe kwoty, całość procesów coraz częściej odbywa się w sposób w pełni zautomatyzowany – potencjalny klient jedynie wpisuje numer NIP firmy, a pozostałe dane zostają automatycznie uzupełnione z rejestrów. Decyzja o przyznaniu kredytu jest wówczas wydawana na podstawie wyników silnika scoringowego, którego reguły opracował wcześniej wewnętrzny dział ryzyka firmy.

 

Jakie dane są najczęściej poszukiwane przez działy ryzyka?

Na pierwszym miejscu zwyczajowo stawia się dane ze sprawozdań finansowych z elektronicznego Krajowego Rejestru Sądowego (eKRS) prowadzonego przez Ministerstwo Sprawiedliwości. To jednak nie wyczerpuje ani potrzeb onboardingu B2B ani potrzeb weryfikacji kontrahenta. Podstawowa ocena ryzyka wymaga też sprawdzenia m.in. daty rejestracji firmy, numerów rejestrowych, adresu, reprezentacji firmy, struktury właścicielskiej i powiązań kapitałowych z innymi podmiotami. Właściwymi źródłami informacji są tu obok KRS, baza CEIDG oraz baza REGON. Z nich można wyciągnąć nie tylko surowe dane, ale i odpowiedzi na konkretne pytania, np. czy firma istnieje dłużej niż rok, czy w przeciągu ostatnich 12 miesięcy obniżano jej kapitał zakładowy albo czy została niedawno zawieszona. W ramach podstawowej weryfikacji sprawdza się również status VAT firmy – wiarygodnym źródłem jest tu Biała Lista.

 

Na pierwszym miejscu zwyczajowo stawia się dane ze sprawozdań finansowych z elektronicznego Krajowego Rejestru Sądowego (eKRS) prowadzonego przez Ministerstwo Sprawiedliwości. To jednak nie wyczerpuje ani potrzeb onboardingu B2B ani potrzeb weryfikacji kontrahenta.

 

W bardziej zaawansowanej analizie bierze się pod uwagę ewentualne długi i należności firmy – zarówno te wpisane w IV dział KRS i na publicznych giełdach wierzytelności, jak i te, które przetwarzane są ustawowo wyłącznie przez Biura Informacji Gospodarczej (BIG). Sprawdza się też czy strona internetowa firmy istnieje, czy adres siedziby nie jest adresem wirtualnym, kiedy nastąpiły ostatnie zmiany w zarządzie, jaki jest wiek poszczególnych członków zarządu, a także księgi wieczyste gruntów i nieruchomości. Niektóre organizacje weryfikują również środki pomocowe, które zostały przyznane podmiotowi, np. czy korzystał z Tarczy antyinflacyjnej. Odpowiednim źródłem danych w tym celu jest baza SUDOP.

W przypadku organizacji finansowych i kilku innych branż, dochodzi do tego weryfikacja AML na listach sankcyjnych, w bazach PEP oraz sprawdzenie beneficjentów rzeczywistych w rejestrze CRBR.

 

Sposoby pozyskiwania danych gospodarczych dla biznesu

W zależności od wielkości organizacji, jej dojrzałości i przyjętych polityk ryzyka i compliance, a także wielkości portfela klientów, organizacje działające w Polsce decydują się na:

 • manualną weryfikację kontrahenta w publicznych rejestrach (jest to rozwiązanie bezpłatne, jednak czasochłonne z uwagi na ilość różnych źródeł i obarczone większym ryzykiem błędów wynikających z przepisywania informacji tudzież nieuwagi pracowników),
 • pobieranie danych przez rządowe, otwarte API (istnieje API KRS, API CEIDG i API Biała Lista – warto tu jednak mieć na uwadze fakt, iż oficjalne API KRS udostępnia dane wyłącznie o spółkach, tj. bez osób biznesowych, API CEIDG cechuje limit 1000 zapytań na godzinę, a API Biała Lista limit 300 zapytań dziennie),
 • pobieranie danych po API wystawionym przez profesjonalnych dostawców danych gospodarczych (na rynku istnieje kilka firm, które odpłatnie dostarczają dane ze wszystkich rejestrów i wykazów, a nawet zapewniają automatyczny monitoring zmian rejestrowych. Ci najlepsi oferują SLA na poziomie 99%, nawet gdy oryginalne źródła mają przerwy techniczne, a także zestaw gotowych metod wyszukiwania danych (np. sprawdzenia jednym zapytaniem jednocześnie KRS, CEIDG i REGON, co przydaje się szczególnie w przypadkach, gdy posiadamy NIP, ale nie wiemy z jakiego typu podmiotem mamy do czynienia). API wyceniane są na podstawie szacowanego wolumenu zapytań miesięcznie),
 • zakup gotowych raportów handlowych po API lub przez platformy online u dostawców danych gospodarczych i w BIG (wówczas do firmy trafiają nie tyle surowe dane, ale już przetworzone i odpowiednio zaprezentowane. Każdy raport bazuje na kilku-kilkunastu źródłach informacji, prezentując skrót najważniejszych w KYC KYB danych. Dostawcy sprzedają zarówno pojedyncze raporty, jak i ich paczki w różnej wielkości abonamentach),
 • wzbogacenie swojego wewnętrznego systemu płatnymi bazami danych, będącymi replikami rejestrów handlowych 1:1 (jest to rozwiązanie stosowane w organizacjach posiadających własne działy IT/działy data management/CRM. W ten sposób zakupione dane mogą zasilić jednocześnie wiele procesów – nie tylko te w dziale ryzyka, ale i te w dziale sprzedaży, controllingu czy analiz. Kluczowa (i problematyczna) jest w tym przypadku możliwość zakupu pełnych rejestrów, a nie tylko ich wycinków oraz ustalenie z dostawcą, że zaktualizowane pełne rejestry mają być dostarczane np. codziennie lub co tydzień – dane koniecznie muszą być bowiem aktualne. Główną zaletą tego rozwiązania jest maksymalna poufność portfela klientów (z uwagi na fakt, że od razu pobieramy cały rejestr, dostawca nie ma wglądu w to, jakie firmy weryfikujemy). Ponadto, decydując się na taki produkt, mamy do czynienia ze stałą roczną opłatą, która choć nie jest niska, to i tak jest kilka razy niższa niż pozyskanie tych samych danych przez wewnętrzny dział IT. Co więcej, cena nie zmienia się wraz ze skalowaniem użycia, tj. na koszty nie wpływa to, że poza zasilaniem silnika decyzyjnego, pozyskane dane wykorzystywane są również np. w aplikacji sprzedażowej do oceny leadów B2B czy w wewnętrznych raportach).

 

Co wybrać? Bezpłatne, otwarte rejestry czy płatne rozwiązania?

Prawidłowa odpowiedź brzmi: “to zależy”.

Jeżeli organizacja nie posiada własnego działu IT, ma małe potrzeby poniżej 500 weryfikacji miesięcznie i odpowiednio duże zasoby ludzkie w postaci działu analityków, którzy nie są przytłoczeni kolejką kontrahentów do oceny,  to prawdopodobnie najbardziej opłacalnym okaże się ręczne pozyskiwanie danych z rejestrów, wspierane zakupem płatnych raportów handlowych. Ryzykiem, z którym należy się tu liczyć (a o którym często nie wiedzą dyrektorowie) jest to, że wyszukiwarki rejestrów miewają od czasu do czasu przerwy techniczne, które potrafią trwać nawet kilkanaście godzin i większość rządowych stron posiada CAPTCHA, które znacznie spowalniają wyszukiwanie informacji. Innymi słowy, może się okazać, że pomimo wszelkich możliwych wysiłków pracowników, zdarzy się, że któryś cel nie zostanie zrealizowany w założonym terminie czasowym.

W przypadku, gdy organizacja stawia na automatyzację procesów i ich przyspieszenie, a także jej dział compliance wymaga gwarancji pewności ciągłości działania, wówczas pod uwagę bierze się API i bazy danych od profesjonalnych dostawców danych. Dlaczego nie rządowe API? Tak, jak już wspomnieliśmy, nie zapewnia ono żadnego SLA, ma limity i braki w danych. Gdyby zrzucić zadanie pozyskiwania danych własnemu wewnętrznemu zespołowi IT, to nie tylko organizacja zablokowałaby jego i tak niską zazwyczaj przepustowość, ale finał finałów zapłaciłaby za to więcej niż wynagrodzenie dla dostawcy danych. Utrzymanie kilku doświadczonych programistów seniorów ze specjalizacją w rejestrach handlowych to wydatek rzędu ok. miliona złotych rocznie – finansowo się to nie kalkuluje, skoro istnieją dostawcy specjalizujący się w temacie, pobierający za swoje usługi kilka razy mniej.

 

Najważniejsze w ocenie ryzyka źródła danych

 • Krajowy Rejestr Sądowy (KRS)

Na obecny moment w Krajowym Rejestrze Sądowym widnieje ponad 710 tysięcy podmiotów gospodarczych oznaczonych jako aktywnie działające. Ok. 80% z nich to spółki handlowe. W KRS znajdziemy aktualne i historyczne odpisy KRS zawierające numery rejestrowe, dane adresowe, informacje o formie prawnej i sposobie reprezentacji oraz zarządzie i udziałowcach (w tym daty urodzenia i numery PESEL), należności z IV działu KRS, statut podmiotu, kapitał zakładowy. W bazie eKRS, jako osobna zakładka, dostępna jest również wyszukiwarka dokumentów finansowych.

 • Centralna Ewidencja i Informacja o Działalności Gospodarczej (CEIDG)

Aktywnych jednoosobowych działalności gospodarczych zarejestrowanych w CEIDG jest aktualnie ponad 2,8 miliona. Rejestr ten udostępnia znacznie węższy wachlarz danych niż KRS, szczególnie, że nie wszystkie pola są obowiązkowe do uzupełnienia przez przedsiębiorcę. Wśród podstawowych informacji znajdziemy imiona i nazwiska właściciela, pełną nazwę działalności, numery NIP i REGON, dane kontaktowe, adres www, miejsce wykonywania działalności, kody PKD, datę rozpoczęcia, zawieszenia, wznowienia i zaprzestania wykonywania działalności.

 • Rejestr Gospodarki Narodowej (REGON)

Prowadzona przez GUS baza REGON stanowi źródło komplementarne do KRS i CEIDG, ponieważ znajdziemy w niej podmioty z obu rejestrów handlowych, a także spółki cywilne, których nie ma ani w KRS, ani w CEIDG. Wśród udostępnianych przez REGON informacjach znajdują się m.in. numery rejestrowe (NIP, REGON, KRS), status NIP, kody PKD, nazwa, forma prawna, sąd, adres. W sekcji tylko dla spółek cywilnych znajdziemy imię, nazwisko i numer REGON działalności gospodarczej wspólnika, dzięki czemu możliwym staje się sprawdzenie przedsiębiorcy w CEIDG.

 • Wykaz Podatników VAT (Biała Lista)

Uruchomiona w 2020 roku Biała Lista udostępnia takie informacje, jak status podatnika VAT na aktualny dzień oraz dzień historyczny, przynależne firmie konta bankowe, numery REGON, KRS i NIP, adres, datę rejestracji jako podatnik VAT, w tym daty wykreśleń oraz przywróceń, imiona i nazwiska prokurentów, wspólników i osób uprawnionych do reprezentowania podmiotu.

 • Centralny Rejestr Beneficjentów Rzeczywistych (CRBR)

CRBR gromadzi dane wyłącznie o wybranych spółkach (Sp. z o. o., S.A., P.S.A., Sp. k., spółkach jawnych i partnerskich). W źródle tym znajdziemy informacje o osobach fizycznych posiadających min. 25% udziałów lub kontrolujących firmy – ich imiona, nazwiska, wielkość udziału, funkcje i uprawnienia, numery PESEL, kraj zamieszkania i obywatelstwa, a także nazwę i numery rejestrowe firmy.

 • Monitor Sądowy i Gospodarczy (MSiG)

MSiG nie jest typowo rejestrem, lecz dziennikiem urzędowym, który pojawia się w mało wygodnych do czytania plikach PDF. Stanowi odpowiednie źródło danych, gdy poszukujemy informacji o upadłościach konsumenckich oraz obwieszczeniach o likwidacjach spółek rejestrowanych w KRS. Co więcej, w MSiG publikowane są sprawozdania finansowe podmiotów, które podlegają obowiązkowemu badaniu przez biegłego rewidenta, ale nie składają sprawozdań do KRS.

 • System Udostępniania Danych o Pomocy Publicznej (SUDOP)

Prowadzona przez UOKiK internetowa baza SUDOP umożliwia sprawdzenie czy firma korzysta lub korzystała z pomocy publicznej. Przykładem takiej pomocy są m.in. środki antykryzysowe, zwolnienia z podatku i pomoc de minimis. SUDOP pozwala zweryfikować nazwę i numer konkretnego środka pomocowego, wartość pomocy brutto w PLN i datę udzielenia pomocy.

 • Biura Informacji Gospodarczej (BIG)

Biura Informacji Gospodarczej nie są jednostkami rządowymi a komercyjnymi. W Polsce jest ich 5 i legitymuje je specjalna ustawa. Ich zadaniem jest gromadzenie i udostępnianie danych o dłużnikach – zarówno firmach, jak i osobach fizycznych.

 • Listy sankcyjne

Są to listy, na których znajdują się osoby, organizacje oraz rządy, na które zostały nałożone pewne określone zakazy i ograniczenia. Największe organizacje weryfikują kontrahentów na ponad 30 różnych listach. Wśród najważniejszych wymienia się listy sankcji UE CFSP, listę OFAC, FSF, listę sankcji ONZ, a także naszą polską listę sankcji, którą utworzono w kwietniu 2022.

 • Listy osób eksponowanych politycznie (PEP)

To bazy danych, które budzą największe kontrowersje w świecie informacji z uwagi na fakt, że nie istnieje żaden oficjalny rządowy rejestr, który byłby jednoznacznym źródłem danych. Stąd listy PEP kupuje się od dostawców danych, którzy w praktyce ręcznie je aktualizują (nie mają bowiem wyjścia – nie ma skąd pobrać niektórych danych). Według ustawy AML w definicję PEP wchodzi aż 215 stanowisk (m.in. posłowie, marszałkowie, burmistrzowie, starości, szereg prezesów publicznych jednostek).

 


Au­tor ar­ty­ku­łu:

Arkadiusz Hajduk

CEO Transparent Data, firmy technologicznej specjalizującej się w dostarczaniu danych gospodarczych i automatyzacji procesów związanych z danymi. Należy do prestiżowego FEBIS oraz Związku Przedsiębiorstw Finansowych w Polsce. Jest jednym z ekspertów rządowej grupy roboczej ds. strategicznych kierunków zarządzania danymi, a wcześniej, w latach 2018-2020, był członkiem grupy roboczej ds. otwartych danych przy Ministerstwie Cyfryzacji. W 2018 roku uczestniczył w rozmowach rewizyjnych w sprawie Dyrektywy PSI w siedzibie Komisji Europejskiej. Od lat dzieli się swoją wiedzą i praktycznym know-how występując jako prelegent na konferencjach o tematyce open data i RegTech.

 

1486 czytano

Write a comment...

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *