Deep Dive Into Data Science со др. Христијан Ѓорески

Machine Learning. Актуелен buzzword и технологија што пред очи ни гo менува светот каков што го знаеме. Со се поголемата потреба за автоматизирање на процеси и енормниот опсег на можности што ги нуди, ML не само што навлезе во сите сектори на работење, туку се наметна и како основа на дигиталната трансформација што го зафати светот со френетична брзина.

Во тој опсег на можности се издвојува Wearable Computing или интердисциплинарното поле за развивање системи и уреди што можат да препознаваат активности, да детектираат стрес, да оценуваат потрошении калории како и да го мониторираат човечкото здравје. Со 3 победи на меѓународни ML натпревари, др. Христијан Ѓорески, доцент на ФЕИТ, е еден од најискусните и најдокажани експерти на ова поле. Христијан ќе биде и инструктор на првиот интензивен семинар – Deep Dive Into Data Science на кој ќе демонстрира како со Machine Learning и потреба на носливи уреди (wearables) можеш да препознаваш активности. 

Христијан, добредојде! На 4 и 5 април, ќе имаме нов тип на семинар, Deep Dive Into Data Science на тема: Recognizing human activities using wearable sensors and Machine Learning. Што можат да очекуваат учесниците од овој настан?

Ми претставува огромна чест и задоволство што токму јас ќе го отворам овој нов, едукативен серијал на предавања/работилници и уште повеќе што е во област која што релативно нова и малку позната кај нас.
На овој настан ќе се потрудам да го пренесам моето 11 годишно научно и истражувачко искуство во областа на машинското учење, со посебен аспект на носливите уреди (или wearables) и обработка на податоци кои што се добиваат од овие уреди.

На крај од дводневната работилница очекувам секој да знае да развие алгоритам кој што ќе ги препознава човечките активности преку користење на машинско учење (класификациски модел) применето на сензорските податоци што доаѓаат од овие уреди. Во принцип тоа ќе биде алгоритам што ќе работи со временски серии (time series), и релативно лесно може да се прилагоди на било кој проблем со сензорски податоци или временски серии.

Носливите уреди (или wearables) станаа хит последниве години, особено по појавата на Apple Watch. Но, малкумина знаат дека Apple не се првите што имаат интеграција на fall detection. Ти имаш да кажеш збор-два околу тоа… 🙂

Точно е… Apple не беа првите што имаа развиено алгоритам за автоматско препознавање на паѓање (fall detection), но беа најхрабри, најдобро бизнис и маркетиншки подготвени да го стават како smart feature во своите продукти.
Додека работев на Институтот Јожеф Стефан во Словенија, ние работевме на сличен алгоритам уште во 2010 година. Во тој момент на пазарот немаше речиси никаква конкуренција за ваков продукт. Постоеја само мануелни уреди, кои работеа на принцип на црвено копче, кое што кога ќе се притисне се вклучува некаков аларм и фиксен телефон ѕвонеше за помош. Паметните алгоритми што автоматски препознаваа паѓање сеуште беа во научни кругови, како прототипи. Токму и јас работев на проект каде што во тој момент имавме развиено еден од подобрите алгоритми.

Меѓутоа технологијата сеуште не беше спремна, немавме паметни уреди и часовници што ќе го имаат соодветниот сензор (акцелерометар) и соодветната батерија за да издржат повеќе од 24 часа. Некаде во 2015 година добивме уште еден европски проект (INLIFE) кој што ни даде можност да го доразвиеме алгоритмот и да го тестираме на паметен саат. Во 2016 година ние веќе имавме прототип паметен саат што автоматски препознаваше паѓање и повикуваше помош. Се обидовме да развиеме и бизнис концепт околу тоа, меѓутоа уште еднаш се покажа дека научниците не се најсоодветни за бизнис :). Веќе следната година Apple го претстави својот нов паметен саат кој што ја имаше вклучено опцијата за автоматска детекција на паѓање.

Affective Computing е доста напредна примена на Machine Learning и со развојот на медицинската и фитнес индустријата, носливите уреди покажаа огромен потенцијал. Дали сметаш дека тој потенцијал е искористен и каде гледаш нови можности и подобрувања?

Afftective Computing е уште една област во која работам и сум голем ентузијаст за апликациите и уредите што ќе ги видиме во иднина. Крајната цел на оваа научна дисциплина е да имаме уреди кои што ќе бидат способни (паметни) да ги препознаваат, интерпретираат, и дури и симулираат нашите човечки емоции, чувства (тага, среќа, љубов, гнев). Ова е релативно нова под-научна дисциплина, која што добива посебно внимание последниве 20-тина години посебно со развивањето на сензорските носливи технологии на една страна и на машинското учење на друга страна.

Моментално имаме соодветни сензорски технологии и алгоритми, и затоа се повеќе гледаме уреди кои што до некоја мера препознаваат емоции, стрес, возбуда и сл. Стресот би го издвоил како посебен бидејќи е исклучително важен во ова динамично време во кое живееме. Замислете да имаме паметен саат кој што прецизно ќе го препознава нашиот стрес во текот на денот преку паметен саат. Тоа е од исклучителна важност за нашето здравје, ако знаеме дека хроничниот стрес е главен фактор за намалување на нашиот имунитет и индиректно одговорен за голем број на болести.

Моментално не сме далеку од ова. Веќе постојат, прототип алгоритми кои што во лабораториски услови се доста точни, но им недостигаат уште неколку години да се доразвијат и да се користат во нашето секојдневие. Во принцип, алгоритмот кој што ќе го работиме на работилницата е многу сличен и може да се прилагоди и за вакви студии. На крајот од работилницата ќе презентирам и мои студии токму во областа на препознавање на стрес.

Се почесто читаме за употреба на Data Science за медицински цели. На пример, тим на MIT неодамна го откри Hallicin, целосно нов и многу моќен антибиотик, со помош на Machine Learning. Колку сме далеку од реалност кога со ML ќе можат да се превентираат и лечат терминални болести и тумори?

Машинското учење е прилично добра алатка кога имаме огромни количества на податоци, и кога треба да се испробаат и оптимизираат голем на комбинации на параметри, решенија и слично. Затоа во последно време се повеќе гледаме успешни апликации на машинско учење во медицина, каде што имаме неизмерни количества на податоци од пациенти, болести, експерименти, испитувања, лекови и сл.

Како последен пример би го издвоил алгоритмот што детектира Корона вирус за 20 секунди со анализирање на снимки од компјутерска томографија, притоа со точност од 96%. Импресивно во оваа вест е и тоа што алгоритмот е развиен за целосно нов вирус што воопшто не ни беше познат до пред 3 месеци. Ова е последица на интензивниот развој на областа Deep Learning и Transfer Learning во последниве неколку години, кои што овозможуваат модели научени на едно податочно множество, да можат да се искористат и за други, слични податочни множества.

Злобниците велат дека Auto ML (Automated Machine Learning) е голема закана за твојата професија. Кој е твојот став од персонална и стручна гледна точка?

Јас сум еден од тие што се залагаат за автоматизирање на се што може да се автоматизира, и соодветно да се прилагодуваме како луѓе и како општество на тоа. Воопшто не гледам проблем доколку дел и од мојата професија и процеси се автоматизираат. Напротив, работам на тоа :).

Во принцип, секаде каде што имаме добро дефиниран проблем, процеси што се повторуваат, и точно дефинирани правила како се прави процесот, машинското учење може поуспешно да го “сработи” целиот процес. Па така и AutoML, доколку проблемот е добро дефиниран и се повторува, голем дел од работите може да се автоматизираат. Меѓутоа, според мене далеку сме од некој паметен алгоритам и алатка што може да се прилагодува за различни проблеми и да ги замени целосно инженерите и научниците во оваа област.

Со оглед на тоа што си активен во академија и индустрија, како изгледа животот на еден современ Data Scientist?

Јас сум релативно кратко време наставник, Доцент и работата со студенти ми е релативно нова и предизвикувачка. Претходно работев исклучиво на истражувачки проекти, и бев целосно посветен на истражување. Работата со студенти ми дава една нова енергија што ме исполнува и мотивира после секое успешно предавање.

На друга страна е индустријата, која што се повеќе е отворена за Data Science, и нуди огромни можности за работа со реални податоци, и решавање на реални проблеми. Моментално се трудам да ги балансирам и двете, но понекогаш знае да биде тешко и напорно. Се трудам да направам тим околу мене, од млади соработници со цел да работиме подобро и на повеќе проекти.

Во една пригода ми спомна дека во Македонија забележуваш многу глад за учење. Бидејќи си предавач на ФЕИТ, дали сметаш дека токму Data Science игра голема улога во овој нов мотив за учење?

Да, еве веќе 2 години како сум вратен во Македонија, и сум импресиониран од желбата на младите да научат повеќе, посебно нови технологии како што се Вештачка Интелигенција и Машинско Учење. Можеби сум малку пристрасен бидејќи најчесто читам и се движам во такви кругови, но доколку споредам со Словенија, каде што бев 7 години, чувствувам разлика.

Само како пример, пред неполни 2 години ја основавме групата Data Science Macedonia која што веќе има над 910 членови, што е слично со истата група во Словенија, што е основана пред повеќе од 4 години – а исто така ние веќе имаме организирано повеќе настани од нив.

На крај, која е твојата порака за сите што ќе дојдат на Deep Dive Into Science?

Ќе се потрудам да направам позитивна атмосфера во која што секој ќе се пронајде и ќе успее да научи нешто ново. Ќе ви споделам дел од моето знаење во областа на машинското учење, работа со сензорски податоци, временски серии.

На крај ќе ви споделам искуство, совети и трикови како може да се победи на натпревар за машинско учење, нешто во кое што заедно со моите тимови успеав 3 пати во последниве неколку години. И секако, ќе пробам да одговорам на сите ваши прашања поврзани со работилницата, но и општо со ваши проекти или идеи поврзани со машинско учење.

Related Stories For You