Jednorożce w świecie Big Data

W polskich serwisach rekrutacyjnych jeszcze nie znajdziemy 
dla nich ofert pracy. W USA jest to jeden z najbardziej pożądanych zawodów. Naukowiec ds. danych. Amerykanie 
uznali go za najbardziej sexy profesję XXI w.

Naukowcy ds. danych zatrudniani są w korporacjach po to, aby odnajdywać skarby w informacyjnym chaosie. To specjaliści z najwyższej półki. Mają nie tylko doskonałe wykształcenie, ale też dociekliwość i wrodzoną ciekawość. Dokonują przełomowych odkryć w wielkich zbiorach danych (big data).

Nazwa tego stanowiska powstała w 2008 r., a jej autorami są Dhanurjay „DJ" Patil i Jeff Hammerbacher. Pracowali wtedy w firmach LinkedIn i Facebook, odpowiadając za dane i analizy. Patil, który pracował też w Skypie, PayPalu czy eBayu, od początku tego roku piastuje stanowisko pierwszego głównego naukowca ds. danych w Białym Domu. Jego zadanie? Pomóc w kształtowaniu praktyk, dzięki którym USA pozostaną liderem w dziedzinie innowacji.

Produktywni paranoicy

W firmach naukowcy ds. danych mają podsuwać pomysły i rozwiązania, dzięki którym uda się generować lepsze wyniki finansowe. Muszą nie tylko docierać poprzez analizę wielu danych do problemu, ale też stawiać trafiające w sedno pytania i formułować listę hipotez do zbadania. Nic dziwnego, że rolę naukowca ds. danych często sprowadza się do określenia „w połowie analityk, w połowie artysta". – To człowiek dociekliwy, który patrzy na dane i dostrzega konkretne trendy – mówi Anjul Bhambhri, wiceprezes działu produktowego big data w IBM.

Specjaliści ds. danych nazywani są też produktywnymi paranoikami, którzy ciągle zadają pytanie „a co, jeśli?". Jednym z nich jest np. Bill Gates, który intuicyjnie zadawał sobie to pytanie, kiedy wprowadzał na rynek system Windows. Na przekór sugestiom współpracowników, którzy odradzali rozwijanie Windows, bo na rynku był już IBM OS/2.

W przeciwieństwie do Gatesa lat 80. i 90. paranoicy nie muszą dziś czekać na bieg wydarzeń, zanim będą mogli zweryfikować swoje rację. Nie muszą być też wizjonerami dostrzegającymi pełny obraz tego, jak będzie zmieniał się rynek. Mają bowiem dostęp do wielkich zbiorów danych i mogą kwestionować istniejące założenia i procesy, tworzyć wnikliwe analizy i zalecenia dla całej organizacji. Zamiast opierać wizję na intuicji i domysłach, opierają ją na konkretnych liczbach.

Firmy, szukając takich specjalistów, rekrutują osoby z wykształceniem w naukach fizycznych i społecznych. Dla przykładu George Roumeliotis, szef zespołu naukowców ds. danych w firmie Intuit z Doliny Krzemowej, ma doktorat z astrofizyki. Gdy Roumeliotis rozmawia z kandydatem na stanowisko naukowca ds. danych, ocenia nie tylko podstawy z matematyki, statystyki czy informatyki, ale też sprawdza, czy dany specjalista potrafi się utożsamiać z klientami, rozumie, z jakimi problemami mogą się zmagać.

Jon Greenberg, naukowiec ds. danych w firmie Playstudios, która zajmuje się tworzeniem gier, przyznaje, że jego praca czasem bywa nużąca. Na co dzień zwykle pobiera dane z serwera i następnie umieszcza je w platformie do analizowania Revolution R. – W ten sposób dowiadujemy się, jak określona grupa użytkowników wykorzystuje np. nową funkcję w grze – wyjaśnia Greenberg. Podkreśla, że uwielbia swoje zajęcie. – Ale ma ono jednak swoje minusy. To czas spędzony na oczyszczaniu danych, czyli usuwaniu niepotrzebnych informacji. Ta część pracy nie jest ekscytująca, a pochłania dużo czasu.

Naukowcy ds. danych, mimo dużej wiedzy i ponadprzeciętnego wykształcenia, najczęściej nie marzą o dyrektorskim fotelu lub pozycji prezesa. Bycie gwiazdą korporacji ich wręcz krępuje. Bardziej cieszą się z pracy zespołowej, dzieląc się informacjami ze współpracownikami z różnych działów i angażując się w różne projekty prowadzone wewnątrz organizacji. Dan Mallinger, który zarządza zespołem Data Science Practice w firmie Think Big specjalizującej się w analizie wielkich zbiorów danych, podkreśla znaczenie pracy zespołowej. – Nie zatrudniasz hydraulika, aby zbudował ci dom – mówi. – Oczekujesz, że będzie współpracował z innymi specjalistami i słuchał się architektów.

Podobnie jest z fachowcami od danych. Firmy nie mogą oczekiwać, że zatrudnienie jednego eksperta zapewni im automatycznie gigantyczny wzrost przychodów. To, jak ich wiedza zostanie wykorzystana, zależy od reszty zespołu.

Sukcesy, do których przyczynili się naukowcy ds. danych, można długo wyliczać. Na przykład LinkedIn testuje hipotezy podsuwane przez tych specjalistów do opracowywania nowych funkcji w serwisie. General Electric optymalizuje warunki kontraktów serwisowych i ustala lepszą częstotliwość przeglądów konserwacyjnych dla sprzętu przemysłowego. Google polega na ekspertyzie naukowców przy projektowaniu i poprawianiu algorytmów stosowanych w wyszukiwarce i innych usługach online. Z kolei wypożyczalnia Netflix zorganizowała konkurs Netflix Prize, w którym zwyciężył zespół naukowców ds. danych. Opracował sposób na poprawę funkcjonowania systemu rekomendowania filmów do obejrzenia.

Haker, analityk, doradca...

Brytyjski dziennik „The Guardian" nazywa osoby wykonujące ten zawód „jednorożcami", bo tak trudno je znaleźć. Określenie to nie wzięło się znikąd. Znalezienie naukowca, który będzie miał zdolności hakera, analityka, doradcy biznesowego i nie okaże się introwertykiem, graniczy z cudem. Dlatego niektóre firmy, w tym Google, próbują zastąpić takiego eksperta wyrafinowanym algorytmem komputerowym. Niezależnie od tego, czy korporacja szuka leku na raka czy specjalizuje się w wyświetlaniu reklam w internecie, stara się zautomatyzować niektóre prace wykonywane przez naukowców ds. danych. Powstają więc algorytmy, które po zetknięciu z surową bazą danych są w stanie stworzyć raporty na podstawie konkretnych słów czy wykresów. – Czasami 
algorytm może znaleźć wzorce, których nie zauważy analityk danych – mówi Zoubin Ghahramani, profesor inżynierii informacji na Uniwersytecie w Cambridge.

Ghahramani otrzymał od Google'a 750 tys. dol. w ramach wsparcia finansowego, które ma pomóc w stworzeniu zautomatyzowanego statystyka. Profesor wierzy, że gotowa wersja będzie dostępna w internecie jeszcze w tym roku. Później planuje skupić się na stworzeniu wersji komercyjnej, którą firmy będą mogły „wypożyczać" w ramach opłat abonamentowych.

Dan Mallinger nie kryje sceptycyzmu. – To nieporozumienie, algorytmy nie zastąpią człowieka – mówi. I tłumaczy, że naukowiec dużo czasu poświęca na rozwijanie hipotez, badanie odkrytych wzorców i snucie marzeń, w jaki sposób mogą oddziaływać na poszczególne obszary firmy.

Najbardziej sexy

Producenci dysków twardych ostrzegają, że za pięć lat zabraknie miejsca na dane. W 2020 r. świat ma generować 40 zettabajtów danych rocznie, czyli ponad 5,2 tys. gigabajtów na każdą osobę. Dodajmy, że w 2003 r. całkowita ilość danych utworzonych od początku świata wynosiła 5 eksabajtów, a już w 2014 r. 5 eksabajtów danych przybywało co dwa dni. W świecie, w którym mamy do czynienia z prawdziwą eksplozją informacji, producenci nośników pracują nad nową technologią magazynowania plików. Z kolei naukowcy ds. danych zacierają ręce, bo zapotrzebowanie na ich usługi rośnie z każdą minutą.

Co więcej, ci ludzie za chwilę przestaną kojarzyć się wyłącznie z branżą IT. Świadczone przez nich usługi będą potrzebne również sieciom supermarketów, branży odzieżowej czy instytucjom rządowym. Motywujące jest również wynagrodzenie. Wymagania wobec naukowców ds. danych mogą sugerować, że firmy szukają osób określanych mianem człowiek orkiestra. Ale również przewidziane dla nich honoraria opiewają na kwoty jak dla całej orkiestry.

Według analiz firmy Glassdoor, pomagającej w znajdowaniu pracy i rekrutacji najlepszych talentów, tacy naukowcy zarabiają średnio 118 tys. dol. rocznie. Dla porównania programista, który również w Polsce postrzegany jest jako bardzo dobrze płatny zawód, może liczyć na ok. 64,5 tys.

Do 2018 r. tylko w USA ma brakować ok. 170 tys. osób z szerokimi umiejętnościami analitycznymi. Nic więc dziwnego, że redaktorzy amerykańskiej edycji „Harvard Business Review" uznali ten zawód za „najbardziej sexy" w XXI w.