Nothing hits hard like a proof of concept!
Конечно! По 12 месеци исполнети со многу работа, предавања, задачи и вежби, првата група од Академијата за Data Science ја комплетираше најинтензивната и најкомплексната програма што ја нуди Brainster.
На крајот од Академијата, 18-те учесници беа поделени во 4 тимови со цел изработка на завршните проекти. Сите работеа на проекти во напредни домени како Machine Learning, Computer Vision и Natural Language Processing кои се апсолутно зачудувачки за поединци со едногодишно портфолио во Data Science.
Денес ќе се запознаеме со Тим 1 кој работеше на Computer Vision проект, односно модел што препознава лица со и без маски во живо и притоа им ја утврдува возраста. Дел од Tим 1 се триото што ни доаѓа од НЛБ Банка – Иван Вукелиќ, Теодора Живковиќ и Димитар Михајлов кои работат во секторот на бизнис/финансиска анализа, Ангела Васовска – Советник за изготвување проекции во Министерство за финансии и Никола Настев – активен студент на ФИНКИ.
Ако сакаш да работиш на вакви проекти кои ќе влезат во твоето Data Science портфолио и ќе ти обезбедат голема предност на пазарот на труд, аплицирај за октомврискиот термин на Академијата за Data Science!
Колеги, пред сe честитки за комплетирањето на програмата и успешно изработениот завршен проект. Можеби звучи како клише прашање, но какво е чувството да се заврши оваа 12 месечна, интензивна, а неретко и исцрпувачка програма?
-Благодариме за честитките. Чувството е доста добро, брзо ни поминаa 12 месеци, а постигнавме нешто што искрено не се надевавме дека за тоа време ќе успееме. Се сеќаваме на почеток, кога од Brainster ни рекоа, дечки спремете се за 12 месеци напорна работа со многу пот и навистина така беше, но на крајот сфаќаш дека it was worth it. 🙂
-Чувството е микс од повеќе емоции. Среќа, гордост и привилегија заради поминатиот пат кој нѐ извади од комфорт зона, нѐ направи компетентни да решаваме big data проблеми, да работиме со бази на податоци, да создаваме предиктивни модели со машинско учење и длабоки невронски мрежи што имаат огромна примена и сеуште не се доволно имплементирани во македонските бизнис практики.
Меланхолија мала, од друга страна, затоа што лудото темпо на учење од година дена наеднаш престана, и сега е пред нас предизвикот да го примениме и споделиме стекнатото знаење. Прекрасно искуство, вредеше за сите пари и сите нерви! 🙂
Работевте на проект со кој лично допринесовте во борбата против COVID-19. Изработивте Computer Vision модел што детектира возраст кај луѓе како и дали одредено лице носи маска или не. Раскажете ни малку повеќе за мотивот и подготовката за овој проект?
-Согласни сме дека секој треба лично да придонесува со своето знаење во нешто што може да го промени на подобро, па уште на почеток кога ни соопштија на каков проект ќе работиме, сите од тимот бевме согласни дека сакаме лично да придонесеме во оваа борба која ги засега сите луѓе на планетата. Носењето на маска се смета за важна алатка за забавување и спречување на ширењето на Ковид-19 , особено ако се користи универзално во сите сфери на општеството. Постојат се повеќе докази дека маските покриваат и спречуваат луѓето кои имаат Ковид-19 да го шират вирусот на други. Советите и препораките од меѓународните авторитети и многу влади варираат од доброволно до задолжително носење маска на јавни места. Ова значи дека пролонгираната пандемија наметнува нов начин на секојдневно живеење и учење нови навики. Следењето на усогласеноста на јавни места е скапа операција.
Така, сметаме дека нашиот код како бесплатен ресурс што може да се имплементира за препознавање на лице што носи маска во реално време во систем за надзор, ќе помогне во следење на однесувањето на носењето маска на јавни места, како што се трговски центри, супермаркети, институции итн.
Ние силно веруваме дека секоја индивидуа треба да се труди да придонесе со својот капацитет за да се потисне ширењето на Ковид-19 и да се помогне во ставањето крај на пандемијата. Па, ова е еден од нашите начини за придонес :).
Интересно е што во проектот беше предвидено самите да креирате податочно множество (dataset) што верувам беше сериозен предизвик. Која е причината зад оваа одлука, како одеше процесот на креирање и со какво податочно множество завршивте на крај?
-Можеби една од најтешките задачи и најголем предизвик беше креирањето на dataset-от. Во комуникација со менторот имавме две опции како ќе го направиме податочното множество (1. Да избереме постоечко множество или 2. Да направиме ново уникатно множество). Се одлучивме за втората опција – да собереме слики што требаше да ги направиме без да користиме готови податоци и збирки на податоци што беа веќе создадени за вакви цели. Ние го сторивме тоа, така што нашата база на податоци содржи 80% од реалните слики што ги направивме како тим. Додавање на маска на лицето на синтетнички начин (со код) не беше применето како метод, така што создадовме вистинска и автентична база на податоци и поради тоа сме многу горди на тимскиот напор.
-Процесот на собирање фотографии понекогаш подразбираше и молби до нашите пријатели да се фотографираат и да ни достават фотографии по социјалните медиуми. Сепак, беше и забавен процесот, кога луѓето не знаеја точно како да се фотографираат или пак ни доставуваа смешни фотографии…
Покрај ова, со какви други предизвици се соочивте по пат?
-Тренирањето на моделот, секако беше предизвик. За таа цел, сите членови од тимот бевме задолжени да тренираме на што повеќе алгоритми, за да го добиеме моделот со најголема прецизност
-Изборот на соодветна невронска мрежа, комплексноста на слоевите и подесувањето на хиперараметрите наспроти брзината на тренирање на моделот, ресурсите кои ги бара мрежата, стабилноста на моделот и точноста/прецизноста/грешките како мерки за оценка на моделот беа барања кои мораше да бидат задоволени и доведени до оптимум/најдобар микс.
Ова е вашиот прв Data Science проект и прва допирна точка со она што ве очекува понатаму, а тоа е работа во продукциска средина. За додатен притисок, постоеше и временска рамка од само 3 недели. Колку беше важна комуникацијата внатре во тимот за успешноста на проектот? Како успеавте да се синхронизирате?
-Како за прв проект и воопшто работа на нешто што е целосно реално и применливо на продукција сме многу задоволни како се одвиваше целиот процес. Ова само дополнително ни даде мотив да продолжиме со она што сакаме да го работиме понатака а тоа е Data Science.
-Комуникацијата беше одлична. Ние, како членови на тимот, и пред овој проект имавме одлична комуникација и соработка, па така и се одлучивме да соработуваме за крајниот проект. После првата недела, едноставно си ги антиципиравме однесувањата помеѓу себе, што и беше многу битно за да има взаемна кохезија, која ќе ја надополни и онака високата продуктивност за целото времетраење на проектот. Навистина, задоволоство а да се работи во тим, во кој знаеш што да можеш очекуваш од секој член.
За потребите на проектот користевте Python, Jupyter Notebook, Keras, TensorFlow, NumPy, OpenCV итн. Како ви се чини совладувањето на овој toolkit поаѓајќи од нивото на вашите вештини пред да се запишете на Академијата?
-Она што ни изгледаше невозможно пред 12 месеци сега стана возможно.
-Пред да започнеме со академијата, навистина делуваше дека програмирањето во Python и совладувањето на сите библиотеки ќе претставува голем залак за нас. Но, со концептот на целата Академија и капацитетот на предавачите, секој модул е замислен, постепено да те воведува во светот на програмирањето. И навистина, кога дојде модулот Python, сето тоа веќе не делуваше невозможно, како претходно.
-Секако, аналитички ум, предзнаење од математика и логика, конзистентност и желба за доживотно учење се предуслови кој треба да ги исполнува секој кој сака да совлада ваква напорна програма.
Во Brainster веќе се разговара за план за имплементација на вашиот модел, но според вас, каде сметате дека би можел најефикасно да се примени?
-Како што напоменавме претходно, можностите ова решение да најде примена се големи. Така, на сите јавни места, пред влезови во банки, затворени трговски центри, институции, големи компании, зоолошки градини, забавни паркови, културни објекти (театри, МОБ, филхармонија, МКЦ и др.), односно сите тие кои располагаат со камери за вршење надзор можат со користење на нашето решение да вршат надзор во реално време со што ќе го регулираат носењето маска и ќе влијаат и придонесат директно за заштита на јавното здравје од ширење на КОВИД. Уште повеќе, самата употреба на вакво решение на што повеќе места има потенцијал за краток период да ја подигне свеста кај луѓето и да ги промени (на подобро) навиките на не/носење маска.
Да се навратиме уште еднаш на програмата. Од досегашните искуства, Статистика и Machine Learning заедно со Python се покажаа како најпредизвикувачки модули. Што би им порачале на актуелните студенти за полесно да се справат со најтешкиот дел од програмата?
-Редовно следење на програмата, навремено и квалитетно завршување на сите задачи зададен од менторот, и секако, во делот на Machine Learning – вежби, вежби и само вежби! На интернет може да се најдат модели за многу податочни множества со секакви алгоритми. Само потребно е тие да се пронајдат, имплементираат и да се градат (пробуваат) најразлични архитектури за да се дојде до најефикансото решение.
-Ефикасен time management, многу читање и многу работа.
Иако официјално завршивте со сите обврски на Академијата, дел од вас продолжуваат со работа како дел од нашиот Data Science Hub. Овој пат ќе работите на реален проект за Македонската берза. Колку ви помогна ваквиот пристап со практична работа да ги совладате клучните Data Science вештини?
-Секако дека Академијата ни даде одлична основа. Во текот на самата едукација работевме на доста проекти, со реални податочни множества, на реални и актуелни проблеми. Овој проект ќе биде природно продолжение на нашиот едукативен процес, зајакнување на нашите вештини и градење поголемо искуство.
На крај, во името на целиот тим на Brainster, сакам да ви се заблагодарам за учеството на Академијата и за проектот што го оставивте зад себе. За прв пат, од перспектива на некој што го изодел тешкиот пат, што би им порачале на сите што размислуваат да се запишат на Академијата и да тргнат кон кариера во Data Science?
-Повторно, ефикасен time management, многу читање и многу работа (види под бр.8 🙂
-Моментално Data Scientist се наоѓа помеѓу топ 5 најбарани професии во светот. Дали е потребен дополнителен коментар?
-Секако, воопшто не е наивна Академијата, таа бара вложување на максимален труд и посветеност. Но, ако навистина сакаш тоа да го работиш, ништо не е невозможно. Навистина, сега од оваа призма, сите дискутираме помеѓу нас и доаѓаме до единствен заклучок: Дека сите навистина уживавме во тоа што го правевеме 12 месеци. Дека не жалиме ниту за некои непроспиени ноќи, работејќи на некој проект, затоа што знаеме дека сето тоа вредеше!
*Детални информации и преглед на проектот на кој работеше Тим 1, на следниов линк: https://github.com/IvoVuk/Face-Mask-classification