Už pred dvoma rokmi sme vedeli, že potrebujeme ľudí, ktorí budú tvoriť datasety pre trénovanie špecializovaných neurónových sietí. Po začatí vojny, keď milióny našich ukrajinských susedov muselo opustiť svoje domovy, sme sa rozhodli vytvoriť tím pre zber dát a zamestnať ich.
Čo môže byť lepšie, ako keď sa stretne dopyt firmy v jednej ruke so záujmom zamestnanca v druhej ruke?
To sa udialo aj v našom prípade. „Už dlhšie sme potrebovali vytvoriť tím pre tvorbu datasetov,“ vysvetľuje Daniela Vačková z HR Innovatrics. A bolo isté, že ľudia utekajúci pred vojnou na Ukrajine budú potrebovať robotu, aby uživili svoje rodiny.
Na prácu, ktorú u nás robí zatiaľ päť Ukrajincov, primárne žien, nebolo potrebné mať špeciálne vzdelanie a to vrátane jazykových znalostí. „Takže mohli začať prakticky okamžite,“ hovorí Daniela. Ich náplň spočíva v narábaní s kamerou, fotoaparátom a počítačom, kde zhromažďujú dáta. „Sú to všetko veci, ktoré sa dajú veľmi rýchlo naučiť. A keďže máme už niekoľko rokov kolegu – programátora, ktorý pochádza z Ukrajiny, nemali sme medzi sebou ani jazykovú bariéru, keď sme ich v prvý onboardingový deň zaúčali.“
V súčasnosti robia pre tím SmartFace pracujúci na rozpoznávaní tvárí vo videu. „Trénujú algoritmus na overovanie živosti, aby nebolo možné oklamať biometrické systémy,“ opisuje Michal Világi, ktorí vedie nový tím pre zber dát.
Na trénovanie potrebujeme tisícky a tisícky fotografií. Už pred poldruha rokom, keď sme sa bavili s naším šéfom R&D tímu Mariánom Beszédešom, poukazoval na to, že potrebujeme vytvárať zmysluplné datasety pre trénovanie špecializovaných neurónových sietí. Pretože verejné datasety, ktoré by sme mohli využívať, neexistujú. Ako vidno, už dlhšie sme pociťovali potrebu získať dátových špecialistov, ktorí by sa o všetko postarali. Istý čas pracovali na zbere dát práve ľudia v Mariánovom tíme. Ale nebolo to ideálne riešenie, pretože sa museli sústrediť na svoje prioritné úlohy.
Ako teda vyzerá práca našich nových kolegýň? Majú scenáre ako vytvárať rôzne typy fotiek, na ktorých sa potom trénujú naše algoritmy. Robia fotografie s rôznym svetlom, polohou tváre, v maskách aj bez nich. Následne fotky spracujú, uložia v rôznych rozlíšeniach a presne označujú. „Labeling, teda označovanie je veľmi dôležité, pretože ak sa to nespraví správne alebo úplne, fotografie sa nedajú dobre využiť pre machine learning,“ vysvetľuje Michal. Práve vďaka nemu dokážeme ešte viac zdokonaľovať naše algoritmy.
A keďže všetky naše produktové tímy majú veľký záujem o zber dát a spracovanie rôznych druhov scenárov, budeme náš nový tím pre zber dát rozširovať. „Pravdepodobne najmeme ďalších päť ľudí, ktorí budú neskôr pracovať aj pre DOT (Digital Onboarding Toolkit) tím, ktorý pracuje na overovaní osôb na diaľku,“ hovorí Daniela. Scenáre a požiadavky na prácu však pridávame postupne, sú rozložené v čase kvôli efektivite, zabezpečeniu kvality, zvládnutiu organizácie, ale aj z dôvodu plánovania dlhodobejšej, nielen krátkodobej pomoci Ukrajincom.
Aby sme našim novým kolegyniam čo najviac spríjemnili prácu a pomohli im aj s deťmi, zriadili sme pri ich pracovných priestoroch aj detský kútik. Vybavili sme ho darovanými hračkami. Okrem toho majú k dispozícii kuchynku, oddychové sedenie, terasu, občerstvenie. Čo je však pre nich asi dosť podstatné je, že tvoria ucelený a zohratý tím, vzájomne si pomáhajú, delia si aj prácu a starostlivosť o deti.
„Práca, ktorú pre nás robia, je pre nás veľmi cenná a dôležitá. A zároveň je pre našu firmu podstatné, že sme mohli pomôcť našim susedom so zamestnaním, zázemím a vytvorením bezpečného priestoru,“ uzatvára Daniela.