95% pilotaży AI nie trafia do produkcji — i nie chodzi o kod
Twój pilot działa. Model odpowiada poprawnie, demo zachwyca zarząd, zespół developerski bije brawo. Trzy miesiące później projekt leży w szufladzie. Nie dlat…
Twój pilot działa. Model odpowiada poprawnie, demo zachwyca zarząd, zespół developerski bije brawo. Trzy miesiące później projekt leży w szufladzie. Nie dlatego, że coś się zepsuło — dlatego, że nikt nie zmienił procesu, który miał wspierać.
95% pilotaży AI nie trafia do produkcji — i nie chodzi o kod
Co MIT NANDA naprawdę zmierzył (i czego nie zmierzył)
Raport MIT NANDA Initiative "The GenAI Divide: State of AI in Business 2025" oparty jest na 150 wywiadach z liderami na poziomie C-suite i VP, ankiecie przeprowadzonej wśród 350 pracowników oraz analizie 300 publicznych wdrożeń AI. Wynik: tylko 5% inicjatyw AI w fazie pilotażu generuje szybki, mierzalny wzrost przychodów. Pozostałe 95% nie ma żadnego wpływu na P&L organizacji [1].
Warto jednak wiedzieć, co MIT faktycznie mierzył — i co ta liczba oznacza. Badacze nie liczyli projektów, które "się posypały" technicznie. Mierzyli brak wpływu na wynik finansowy. Część ekspertów wskazuje, że to istotna różnica: pilot może działać bez zarzutu, a jednocześnie nie generować żadnego zwrotu [6]. To nie jest pocieszenie dla decydenta — to jest precyzja, której potrzebujesz, żeby postawić właściwą diagnozę.
Demo działa, biznes nie — dlaczego to dwie różne rzeczy
Demo AI i produkcyjne wdrożenie AI to dwa fundamentalnie różne problemy [5]. Demo żyje w kontrolowanym środowisku: czyste dane, jeden scenariusz, zaangażowany zespół projektowy. Produkcja to brudne dane z trzech systemów, pracownicy którzy mają swoje nawyki, i proces, który nikt nie przeprojektował pod nowe narzędzie.
Kiedy demo trafia na zderzenie z rzeczywistością operacyjną, najczęściej nie wybucha — po prostu cichnie. Nikt oficjalnie nie ogłasza porażki. Projekt jest "w trakcie", "wymaga dopracowania", "czeka na zasoby". Po roku znika z roadmapy.
Trzy organizacyjne pułapki, które zabijają AI między pilotem a skalą
Pułapka 1: narzędzie wdrożone, proces niezmieniony
MIT NANDA nazywa to wprost: "tool-first, process-later" [1]. Firma kupuje licencję na narzędzie AI, integruje je z jednym systemem i ogłasza wdrożenie. Nikt nie zadaje pytania: jak zmienia się przepływ pracy? Kto podejmuje decyzje inaczej niż przed wdrożeniem? Co pracownik przestaje robić ręcznie?
Przykład operacyjny: dział obsługi klienta wdraża AI do kategoryzacji zgłoszeń. Model działa z dokładnością 89%. Ale konsultanci nadal ręcznie weryfikują każdą kategorię, bo "nie ufają systemowi" i nikt nie zmienił ich KPI. Czas obsługi zgłoszenia nie spada. ROI wynosi zero.
Narzędzie bez przeprojektowanego procesu to drogi gadżet.
Pułapka 2: luka kompetencyjna — pracownicy nie wiedzą, co zmienić
Drugi główny czynnik z raportu MIT to "learning gap" [1]. Organizacje wdrażają AI, ale nie uczą pracowników, jak realnie zmienić swoje działanie wokół nowego narzędzia. Szkolenie trwa dwie godziny, kończy się certyfikatem i nie zmienia niczego w codziennej pracy.
To nie jest problem techniczny. To problem zmiany organizacyjnej. Pracownik, który przez pięć lat budował raporty w Excelu, nie zmieni nawyku dlatego, że dostał dostęp do dashboardu AI. Zmieni go, jeśli ktoś pokaże mu konkretnie, które trzy kroki w jego procesie teraz wykonuje model — i co on robi z tym czasem.
Polskie firmy mają tu dodatkowe wyzwanie: według danych z raportu, luka kompetencyjna jest szczególnie widoczna w organizacjach, gdzie decyzja o wdrożeniu AI zapadła na poziomie zarządu, ale implementacja spoczęła na barkach IT bez wsparcia dla linii biznesowej [4].
Pułapka 3: brak integracji z danymi transakcyjnymi
Trzecia przyczyna z MIT NANDA: AI wdrożone w oderwaniu od systemów transakcyjnych firmy [1]. Model operuje na danych eksportowanych raz w tygodniu do Excela, podczas gdy rzeczywiste decyzje wymagają danych z ERP aktualizowanych co godzinę.
W polskim kontekście enterprise — firmy działające na Comarch ERP, Symfonia czy SAP — integracja AI z systemem transakcyjnym to projekt sam w sobie. Często kosztuje więcej i trwa dłużej niż sam pilot. Decydenci, którzy nie wliczają tego w budżet pilota, odkrywają problem dopiero wtedy, gdy model zaczyna rekomendować decyzje na podstawie nieaktualnych danych.
Złe dane niszczą 85% projektów AI zanim model w ogóle zobaczy produkcję
Czym jest "zdrowie danych" i dlaczego demo tego nie testuje
Firmy konsultingowe i integratorzy danych wskazują, że 85% projektów AI kończy się niepowodzeniem z powodu złej jakości danych [3]. To liczba niezależna od statystyki MIT — i dotyczy innej fazy projektu. MIT mierzy brak ROI po wdrożeniu. Zła jakość danych zabija projekty wcześniej, zanim model trafi do produkcji.
"Zdrowie danych" to mierzalny zestaw cech: kompletność (czy brakuje kluczowych pól?), spójność (czy ta sama wartość ma tę samą definicję w różnych systemach?), aktualność (czy dane są odświeżane z właściwą częstotliwością?) i dokładność (czy dane odzwierciedlają rzeczywistość operacyjną?) [3].
Demo nie testuje zdrowia danych, bo demo korzysta z danych przygotowanych przez zespół projektowy. Produkcja korzysta z danych generowanych przez organizację — z wszystkimi jej nawykami, błędami i wyjątkami.
Jak ocenić gotowość danych przed startem pilota
Zanim uruchomisz pilota, sprawdź trzy rzeczy. Po pierwsze: skąd pochodzą dane, na których model będzie działał w produkcji — i czy masz do nich dostęp w czasie rzeczywistym czy tylko w eksportach. Po drugie: kto jest właścicielem tych danych i kto odpowiada za ich jakość — jeśli nikt nie potrafi odpowiedzieć na to pytanie, masz problem organizacyjny, nie techniczny. Po trzecie: czy dane z ostatnich 12 miesięcy zawierają anomalie, które model może zinterpretować jako wzorzec — na przykład lockdowny, jednorazowe promocje, zmiany w strukturze sprzedaży.
Jeśli nie możesz odpowiedzieć na te pytania przed startem pilota, pilot nie jest gotowy.
Jak wygląda 5%, którym się udało — wzorzec udanego wdrożenia
Wspólne cechy firm z mierzalnym ROI z AI
Firmy z grupy 5%, które generują mierzalny zwrot z AI, mają kilka wspólnych cech widocznych w analizie MIT NANDA [1]. Przede wszystkim: zaczynają od procesu, nie od narzędzia. Najpierw mapują, gdzie w organizacji jest wąskie gardło z mierzalnym kosztem — potem szukają AI, które ten koszt obniża.
Druga cecha: mają właściciela biznesowego wdrożenia, nie tylko właściciela technicznego. Ktoś z linii biznesowej odpowiada za to, że proces zmieni się wokół narzędzia — i ma KPI, które to mierzą.
Trzecia: definiują sukces liczbowo przed startem pilota. Nie "AI ma poprawić obsługę klienta", tylko "AI ma skrócić średni czas pierwszej odpowiedzi z 4,2 godziny do 1,8 godziny w ciągu 90 dni".
Metryki, które odróżniają pilota od wdrożenia produkcyjnego
Pilot mierzy, czy model działa technicznie. Wdrożenie produkcyjne mierzy, czy zmienił się wynik biznesowy. To nie jest ta sama metryka.
Pilot: dokładność modelu 91%, czas odpowiedzi 1,2 sekundy, brak awarii przez 30 dni. Wdrożenie: czas obsługi procesu skrócony o 40%, koszt jednostkowy operacji spadł o 18%, pracownicy wykonują o 6 godzin tygodniowo mniej pracy manualnej. Jeśli po zakończeniu pilota masz tylko metryki z pierwszej listy — nie masz jeszcze wdrożenia.
Checklista: 7 pytań, które musisz zadać zanim ogłosisz "wdrożenie AI"
Pytania dla decydenta — strategia i proces
1. Który konkretny proces zmieniamy — i jak mierzyliśmy go przed wdrożeniem?
Bez baseline'u nie ma porównania. Jeśli nie wiesz, ile kosztuje proces teraz, nie udowodnisz, że AI go poprawiło.
2. Kto jest biznesowym właścicielem tego wdrożenia i jakie ma KPI?
Jeśli właścicielem jest wyłącznie IT — wdrożenie nie ma szans trafić do produkcji. Ktoś z linii biznesowej musi odpowiadać za zmianę procesu.
3. Co pracownicy przestają robić ręcznie po wdrożeniu — i co robią z odzyskanym czasem?
Jeśli nie ma odpowiedzi na to pytanie, narzędzie zostanie dodane do procesu, a nie zastąpi jego część. Koszty wzrosną.
4. Jak wygląda plan zmiany kompetencji zespołu — nie szkolenie, tylko zmiana nawyków?
Dwugodzinne szkolenie nie zmienia nawyków. Potrzebujesz planu, który pokazuje, jak konkretna rola działa inaczej w tygodniu 1, 4 i 12 po wdrożeniu.
Pytania dla operatora — dane i integracje
5. Skąd model bierze dane w produkcji i z jaką częstotliwością są odświeżane?
Jeśli odpowiedź brzmi "z eksportu raz dziennie" — sprawdź, czy decyzje, które model wspiera, mogą czekać 24 godziny na aktualizację danych.
6. Czy dane produkcyjne przeszły audyt jakości — kompletność, spójność, aktualność?
Demo działało na danych przygotowanych przez zespół. Produkcja działa na danych generowanych przez organizację. To nie to samo.
7. Jaki jest plan działania, gdy model zwróci błędną odpowiedź — i kto to wykryje?
Każdy model halucynuje lub myli się w edge case'ach. Jeśli nie masz procesu weryfikacji i eskalacji, jeden błąd modelu może kosztować więcej niż cały pilot.
Jeśli na którekolwiek z tych siedmiu pytań nie masz odpowiedzi — masz pilota, nie wdrożenie. Wróć o krok wstecz i odpowiedz na nie zanim ogłosisz sukces. Albo zanim podpiszesz kolejną licencję.
Źródła
[1] MIT NANDA Initiative, The GenAI Divide: State of AI in Business 2025, omówienie: MIT Sloan Management Review Polska — https://mitsmr.pl/dane-i-sztuczna-inteligencja/ai-nie-dziala-w-prozni-dlaczego-95-wdrozen-konczy-sie-porazkai-jak-znalezc-sie-w-tych-5-ktorym-sie-udalo/
[2] Raport MIT szokuje. 95 proc. projektów AI w firmach to kompletna porażka, PurePC — https://www.purepc.pl/raport-mit-szokuje-95-proc-projektow-ai-w-firmach-to-kompletna-porazka-dlaczego-miliardy-dolarow-ida-w-bloto
[3] Dlaczego większość projektów AI kończy się niepowodzeniem i jak zdrowie danych może uratować Twój projekt, Britenet — https://britenet.eu/pl/blog-post/dlaczego-wiekszosc-projektow-ai-konczy-sie-niepowodzeniem-i-jak-zdrowie-danych-moze-uratowac-twoj-projekt/
[4] Dlaczego aż 95% wdrożeń AI w firmach kończy się porażką?, PIKP — https://pikp.pl/dlaczego-az-95-wdrozen-ai-w-firmach-konczy-sie-porazka/
[5] Why Your AI Demo Will Die in Production, Towards Data Science — https://towardsdatascience.com/why-your-ai-demo-will-die-in-production/
[6] No, 95% of AI pilots aren't failing, Reddit r/accelerate — https://www.reddit.com/r/accelerate/comments/1myrfk3/no_95_of_ai_pilots_arent_failing/
Founder Aion Automation. Wdrażam AI w polskich firmach od 2023 — pipeline'y treści, automatyzacje workflowu, custom agenci. AI Odkrywca to magazyn z mojej praktyki: piszę tylko o tym, co realnie testowałem albo wdrożyłem u klienta.