Се поголемата експанзија на Академијата за Data Science во поглед на нови групи и интернационални пазари доведе до неопходна потреба за проширување во тимот кој стои зад истата. Но, да се стане дел од овој тим не е баш лесна задача имајќи ги предвид високите критериуми и стандарди што се наметнати од веќе постоечките членови.

Затоа денес ни е особено задоволство да ви го претставиме Игор Трпевски кој е новиот инструктор на Академијата на модулите по Machine Learning и Python. Игор е Data Science консултант со долги години искуство во Академија и индустрија од кои 4 има поминато во реномираната компанија Procter & Gamble. Воедно на 23-ти март Игор ќе одржи бесплатно онлајн предавање на тема “Како до успешен Data Science резултат на Kaggle” преку кое ќе ни пренесе конкретни техники и практики кои се користат на “олимпијадата за Data Science”.

 

За следната група на Академијата за Data Science се останати само уште 2 слободни места! Аплицирај веднаш и започни со учење на 5-ти април!

 

Игор, твоето професионално портфолио содржи 7 години како истражувач во МАНУ и 4 години како Data Science консултант во Procter & Gamble. Кажи ни вака од прва рака, кои се разликите кога се работи Data Science за истражување и во бизнис/индустрија?

Па во академија проблемите на кои се работи може, но и не мора да имаат директна практична вредност. За разлика од тоа во индустрија мора да има некаков продукт кој ќе биде од некаква вредност за некој краен потрошувач. Многу се ретки компаниите кои финансираат истражувања чисто за доброто на општеството (на пример DeepMind). Исто така, постои многу поголем притисок во однос на рокови. 🙂

 

На 23 март ќе одржиш вебинар пред нашата публика на тема “Како до успешен резултат на Kaggle”? Што можат да очекуваат гледачите од овој вебинар и зошто го одбра Kaggle како тема на истиот?

Гледачите ќе може да се запознаат со најчесто користените чекори од Data Science кои би требало да ги направат при едно натпреварување на Kaggle за да стигнат до висок резултат. Значи data preprocessing, feature engineering, cross-validation, hyperparameter tuning и комбинирање на различни модели (ensembling). Сето ова ќе биде демонстрирано со конкретен пример од еден претходен Kaggle натпревар. 

 


 

Веќе неколку месеци си активен инструктор на Академијата за Data Science, како на домашните групи, така и интернационално. Имајќи ја предвид популарноста на Data Science на Западот, кое е твоето мислење за состојбата во Македонија од аспект на професионални кадри, потенцијал за учење, проекти итн?

Мислам дека во Македонија произведуваме солиден број на квалитетни кадри по глава на жител споредбено со регионот, примарно од факултетите на УКИМ (тука пред се мислам на ФИНКИ и ФЕИТ). Но таа бројка не е доволна за да се задоволат потребите на пазарот. И во контекст на ова мислам дека постои голем потенцијал кај многу луѓе кои не се определиле за претходно споменатите факлутети при нивните студии, но кои поседуваат логичко и математичко размислување за да се доспецијализираат на програми како Data Science програмата на Brainster. За тие што се упорни и посветени да вложат по барем 30 саати неделно за да се стекнат со овие вештини мислам дека нема да имаат проблем да најдат работа на пазарот. 

 

Твои модули на Академијата се Python и Machine Learning. Од тука, омилен Python IDE и омилена Machine Learning библиотека?

Во последно време се повеќе користам JupyterLab, а тежок е изборот за омилена библиотека бидејќи има многу добри… ај ќе речам Fast API. 

 

Според тебе, зошто Python се воспостави како индустриски стандард за Data Science. R исто така во конкуренција, но податоците велат дека Python е многу покористен. На што се должи тоа?

Веројатно поради тоа што во Data Science преминаа огромен број на кадри образувани на Computer Science програмите каде почесто се учи Python. R традиционално се предава на програми за Статистика кои произведувале помал број на кадри. Од технички аспект во моментот нема причина зошто би го одбрале Python пред R. Едноставно мислам дека за индустријата е полесно да најде Python кадри.

 

Од досегашното искуство, како си задоволен од прогресот на студентите на твоите модули? Дали има разлика од домашните и интернационалните групи?

Сега за сега не можам да кажам дека има генерална разлика помеѓу домашните и интернационалните групи на кои предавав. Се разбира има разлика од студент до студент, но можам да кажам дека од тие што се активни сум многу задоволен. 

 

 

Machine Learning стана клучен двигател зад се позабрзаната дигитална трансформација. Според тебе дали максимално го искористуваме овој потенцијал и кој степен на автоматизација можеме да го очекуваме во следните 10 години?

Постојат темни и светли точки од примената на Machine Learning во разни сегменти на автоматизација. Како светли точки би ги навел исклучителниот успек на Deep Learning алгоритмите во развојот на медицинската дијагностика. Како поинтересен пример ќе кажам дека денес постојат алгоритми кои можат да дијагностицираат срцеви удари при спиење само од звуците кои ги прави лицето додека спие, а кои се снимаат на апликација на нивниот телефон. Замислете, пациент со неправилно рчење во сонот кое е знак на срцев удар, резултира во автоматски повик на брза помош до домот на пациентот. 

Од друга страна, алгоритмите кои се користат во денешните системи за препорака на содржина на социјалните мрежи имаат една исклучително страшна, но често занемарена последица. Тие го поларизираат општеството на размер каков што досега не сме виделе, барем не од завршувањето на втората светска војна. Овие алгоритми засилуваат предрасуди кај огромни маси на луѓе со тоа што им нудат содржина преполна со лажни вести. 

 

Data Science како мултидисциплинарно поле бара доста учење и посветеност. Ова веќе го знаеме од нашите студенти, но никогаш не сме ги прашале инструкторите за нивниот пат од почеток до успешните кариери што ги имат. Што можеш да ни кажеш за себе во овој поглед? Колку посветеност и работа ти требаше на тебе за да ги совладаш овие вештини?

Искрено не постои краток пат, а и за да имате време да посветите на DataScience треба и да ви се поклопат малку коцките. Би рекол дека имав среќа да имам добар ментор со многу трпение додека бев во МАНУ кој ни овозможи на мене и уште неколку мои колеги да се стекнеме со доста широко знаење во годините поминати во МАНУ. 

 

Од друг аспект, дали сметаш дека е оправдан стравот што пошироката јавност го има од Data Science и програмирање? На што се должи тоа и ти како професионалец што би им препорачал на сите што се заинтересирани за кариера во оваа насока?

Мислам дека не е оправдан воопшто. Луѓето треба да пробаат без никаков притисок да научат некои основни работи, и доколку им се интересни да продолжат и да посветат повеќе време на деталите. Има многу многу примери на луѓе кои почнале во одредена област во кариерата па преминале во Data Science. Би им посочил на сите кои имаат страв да прочитаат кратко на Wikipedia за кариерата на Jeremy Howard. Човекот има студирано и завршено филозофија на факултет. 15тина години подоцна победува неколку Kaggle предизвици. Сега држи курсеви за Deep Learning за луѓе кои никогаш не програмирале во животот.

 

Како Игор  го поминува своето слободно време?

Имам многу голема мана во тоа што имам малку слободно а и тоа многу лошо го организирам. Генерално гледаме со сопругата двајцата да работиме во истите саати, па слободното време заедно да го минуваме. Исто така во периодов пробувам навечер да се посеветам на читање на Witcher книгите. Многу полесно се заспива кога ќе се премести човек во фиктивен универзум. Доволно време поминуваме мислејќи на проблемите од реалниот. 

 

На крај, која е твојата порака до сегашните и идните студенти на Академијата за Data Science? Можеби овој вебинар би бил одлична појдовна точка за почетниците?

Да посветат саати и саати, гледајќи код од постоечки алгоритми и да пробат да го разберат до детали. Потоа нека се посветат да еден Kaggle challenge и нека пробаат да дојдат до резултат кој ќе биде рангиран во top 30%. Тоа е одлично за почеток.

 

Уште две недели пред почетокот на следната група на Академијата за Data Science. Резервирај си го твоето место бидејќи бројот на учесници е ограничен!