2020 ја започнуваме безкомпромисно кога станува збор за Data Science.

Најпрво, се пополни и втората група на Академијата за Data Science. Новите 23 учесници се веќе во подготвителна програма и на 17 февруари почнуваат со настава преку првиот модул SQL. Во меѓувреме, реализиравме и нов продукт – курс Вовед во Data Science што ќе ги реши сите “почетнички“ маки на оние што не знаат од каде да почнат со обука и пат до кариера. Но, не застанавме тука и веќе силниот тим на инструктори го засиливме со уште едно врвно име од Data Science сцената во Македонија – Кирил Цветков.

Кирил е Machine Learning Engineer во Symphony.is со голема пасија за Computer Vision и Deep Learning. Работи на проекти што имаат повеќе допирни точки со sci-fi сферата отколку нашата реалност и категорично стои зад тоа дека овие технологии се водечки во Data Science и на дигиталната трансформација воопшто. Ќе биде инструктор на Академијата на модулите за Machine Learning и Big Data, како и на најновиот курс Вовед во Data Science. Често ќе се гледаме со него, па од таму решивме да организираме запознавање како што доликува.

Затоа, на 16-ти јануари ќе имаме Бесплатно онлајн предавање – Вовед во Deep Learning на кое покрај вовед во овој тип на учење и неговата примена, Кирил ќе има и отворена Q&A сесија во која ќе можете да го прашате сè што ве интересира од светот на Data Science.

 

Кире, welcome to the team! Да почнеме од “длабокото“ – Keras, Tensorflow, или PyTorch? Go.

Keras најчесто подлежи на Tensorflow и ни дава high-level API апстракција на разни имплементации на невронски слоеви и примарната намена е да се изгради брз прототип. Во комбинација со Tensorflow, подржува и можност да се креираат разни невронски архитектури и модели за да се навлезе подлабоко. Но, јас лично го користам кога сакам да пробам нешто набрзина.

Tensorflow, од друга страна, овозможува поголема флексибилност “микроскопски” да навлеземе во сите сегменти кај невронските мрежи. Особено е брз, ефикасен и оптимизиран за работа со големи податоци, но принципот на “dataflow“ програмирање лично ми ја отежнуваше работата на дебагирање и барање грешки, а и кодот често знаеше да стане хаотичен и нечитлив.

Јас лично највеќе се пронаоѓам во Pytorch, ми се допаѓа принципот на дизајн и развој на архитектури на невронски мрежи, каде дури и дизајнот на кодот се вклопува со оној на традиционалното софтверско инженерство. Полесно се дебагира, се пронаоѓаат грешки и полесно се пишуваат тестови.
За разликa од Tensorflow и Keras, во Pytorch куцаме повеќе код, но придобивката од тоа е што лесно може да се одржи уреден. Го препорачувам за поголеми и подолготрајни проекти.

Популарноста и примената на Deep Learning продолжува да расте и според многу експерти, токму во овој домен лежи иднината на Data Science. Колку го делиш ова мислење и што можеме да очекуваме од бесплатниот вебинар на 16-ти јануари?

Секојдневно во областа на невронски мрежи имаме нови пронајдоци и нови подобрувања во решенијата на разни проблеми, со секој нов пронајдок добиваме различна форма на “лего коцка”, која може да се вклопи и да подобри некој друг проблем. Deep Learning е гранка која се повеќе се осамостојува и се идентификува како посебна, и затоа верувам и гледам голема иднина во неа.

На вебинарот, ќе се научиме како навистина се конструирани невронските мрежи. Предавањето е наменето за луѓе кои не работеле во оваа област, како и за оние кои веќе работеле, па преку ова би имале можност додатно да се инспирираат. Понатаму ќе дискутираме за тоа како невронските мрежи учат преку позната нумеричка метода за оптимизација и како се оптимизираат преку конволуциски слоеви за решавање на проблеми од компјутерска визија. На крај, преку практична примена ќе видиме кул имплементација на “автономно” возило кое само ќе учи како да вози по патека, каде податоците за учење се конструирани од човековото однесување.

 

Ти си автор на програмата на курсот Вовед во Data Science. Еден брз поглед на материјата – од unsupervised и supervised learning, преку Python, NumPy, Matplotlib, регресии, и невронски мрежи… Ова е реален fast-track до клучните Data Science основи. Зошто одлучи вака да го структуираш курсот?

Мојата идеја беше да почнеме со вовед и предавања на теми во кои јас се “заљубив” кога почнав да работам Data Science. Сакам да ја споделам пасијата кон други луѓе и со тоа да ги мотивирам да продолжат да работат на ова поле. Ќе ги изучиме основните работи кои во иднина секому ќе помогнат да решаваат практични проблеми запознавајќи ги потребните компоненти, кои ќе помогнат да се сфати како работи “мозокот” во виртуелниот свет.

На курсот ќе ги поминеме темелите во оваа област – двете клучни разлики на концептите на учење во светот на вештачката интелигенција, ќе се запознаеме со воведните команди во Python – најкористениот програмски јазик за решавање на проблеми од овој тип, преку Numpy ќе научиме за просторна т.е димензионална манипулација на податоците и визуелизација и презентација ќе работиме во Matplotlib.
Преку регресија и невронски мрежи студентите ќе може да научат како да ги користат податоците за да ги предвидат и препознаат врските помеѓу нив и да решат практични проблеми со истите.

Раскажи ни нешто повеќе за себе. Со оглед на почетоците како софтверски инженер, каков беше твојот пат до кариера во Data Science?

Ме интересираат софтверски прашања каде може да се примени природното размислување, алгоритамски вештини, одредено ниво на математичка теорија и можност за решавање на проблем кој досега не бил решен доволно добро. Така дојдов до патот на обработка и анализа на податоци, невронски мрежи и обучување на агенти (reinforcement learning). Во мојот случај желбата за учење и пасијата беа доволни за да навлезам во оваа област, како и упорноста и посветеното време.

Низ еден off-record разговор спомна дека голем дел од твоето Data Science знаење го имаш стекнато сам. Како изгледаше тоа? И од тоа искуство, што според тебе е потребно за квалитетна едукација во оваа област?

Денес живееме во свет во кој интернетот ни дава можност за разни поврзувања, размена на знаење со други луѓе во open-source светот, читање научни трудови и постови. Оттаму, заклучив дека и сам можеш да го научиш она што го сакаш и притоа да ги опфатиш сегментите кои лично те интересираат. Секако, истото си одзема време.

Сè си има своја убавина и според мене, доколку некој сака своето знаење да го монетизира во бизнис или пак да го искористи во креирање реален продукт во производство, треба да посвети време на само-унапредување, работење и едукација во одредена заедница. Од друга страна пак, доколку некој сака да стане научник и да работи на истражувања, треба да тргне кон академската страна. Оние кои што се поамбициозни може да ги балансираат и двете страни.

Како изгледа еден твој работен ден? На што точно работиш во моментов?

Моментално сум посветен на повеќе проекти. Работам како Machine Learning Engineer во Symphony.is каде секојдневно сум опкружен со прекрасни луѓе и пријатна заедница. Исто така, пишувам неколку научни трудови кои треба да излезат наскоро што се во склоп со моите постдипломски студии. Покрај тоа, работам и на сопствена “start-up” апликација со уште еден пријател, која целосно користи AI и треба да излезе многу скоро за IOS. Звучи премногу, но доколку времето се испланира како што треба, може да се преживее 😊.

Во повеќето дигитални вештини работите се менуваат дури и деноноќно. Во дигиталниот маркетинг, на пример, доволна е една ситна промена во алгоритмот на Facebook и цела стратегија да ти падне во вода. Каков е случајот во ML и Data Science? Tensor Flow 2.0 беше примен со овации, но дали понекогаш “апдејтите“ ти создаваат проблем?

Со апдејтите е исто секаде, не само во IT светот. Нова верзија на оперативен систем на компјутер или телефон, нови трендови во музика, мода или show business. Некому се допаѓаат, некому не, на некого може да влијаат позитивно или пак негативно, но времето минува и најчесто секоја промена го поправа недостатокот од претходникот. Мислам дека, секоја промена вреди и заслужува добро да се проба и да се вкуси, доколку навистина вреди, треба да бидеме флексибилни и “лукави” и да ја прифатиме, извлекувајќи максимум.

Од Kaggle и LinkedIn веќе подолго време тврдат дека иако има изобилство од отворени позиции за entry-level Data Scientists, постои реален недостиг на сениор кадри со повеќегодишно искуство. Дали 2020 е апсолутно критична година кога треба да почнеме да се обучуваме за Data Science?

Пред една деценија, бизнисот и во светски рамки не можеше да го идентификува ова поле вака како што изгледа денес. Пред 5-6 години, Македонија беше далеку од оваа област и работа за вакви кадри не постоеши.
Но, времињата се сменети, бизнисот сфати колку оваа област е потребна за да се таргетираат групи, предвидат трендови, минимизраат трошоци или пак да се искористи вештачката интелигенција за да се креираат апликации кои ќе му го подобрат секојдневието на човекот или пак ќе му го направат поинтересно.
Па така, опкружени сме со отворени позиции во светот, дури и во нашата земја работите се менуваат и тоа на големо. Денес може да се потврди дека Data Science e “најжешка” работна позиција во светски рамки.

Токму поради овие причини, AutoML (Automated Machine Learning) е експлозивна и контраверзна тема во моментов. Што мислиш за овој нов тренд во Data Science?

😊 Ова нè очекува порано или подоцна. Сè што е направено денес и има дадено добар резултат ќе се автоматизира и утре ќе може да се искористи дури и со кликање на едно копче на интерфејс.

Но, зошто да не? Замислете само еден доктор во медицина кој не знае ништо од областа, но сака да примени ML во некое негово истражување, со негови податоци. Преку ваква алатка дури и визуелизирана, тој ќе може да дојде до револуционерни откритија во неговото научно поле.

Истото важи и за останатите природни области како биологија, физика, астрономија, хемија, па и дел од општествените: бизнис и економија. Да не ги заборавам и автоматизираните процеси што се случија во софтверското инженество. Тие донесоа револуција и им помогнаа на програмерите и ИТ заедницата да продуцираат софтвер многу побрзо.

Автоматизацијата на ML ќе може да им помогне на луѓето чие знаење подлежи на разни природни и општествени гранки во светот, па дури можно е да се издвои како посебна научна гранка. Секој автоматизиран процес отвара можност за нови работи и истражувања.

За втората група на Академијата за Data Science имавме рекорден број на апликации и овие кандидати и учесници ќе поминат солиден дел од програмата со тебе оваа година. Која е твојата порака до сегашните и идните студенти на Академијата за Data Science?

Вреди да се проба она што е ново и она што е непознато. Треба да имаме јасно дефинирана цел која сакаме да ја постигнеме и доколку се пронајдете во она што ќе го научите, навистина вреди да се посвети време и труд во истото, каде цената е излегување од комфор зоната и рутинските ваши навики.
Кога ќе го вкусите успехот, би биле посреќни и поисполнети во себе затоа што сте се пронашле и сте успеале во вашата замисла.

Не го испуштај Бесплатното онлајн предавање со Кирил на тема Вовед во Deep Learning на 16.01.2019.

Ако имаш интерес за кариера во Data Science, курсот Вовед во Data Science е твојата идеална појдовна точка. Фати си место тука.