Академија за Data Science – Завршен проект: Beautif.AI класификација | Тим 1

Живееме во дигитален свет каде сѐ што гледаме околу нас се податоци, и тоа огромен број на податоци. Знаењето како да извлечеме корисни информации од нив ни е од голема предност. Со користењето на различни алатки, алгоритми и различни принципи за машинско учење веќе сме спремни да покажеме што сè може да направиме со тие податоци.

Автономна кола, пребарувач кој ни дава корисни информации, комуницирање со chatbot за услуга на клиентите, препознавање посебни објекти од слика, предвидувањe (forecast) на одредени метрики за една година од сега и уште многу други реални апликации е остварливо во областа на Data Science.

Data Science е интердисциплинарна наука која се занимава со проучување на огромен број на податоци, без разлика дали се структурирани или неструктурирани, и нивно обработување со цел донесување заклучок или предвидување.

Со цел да ја комплетираат програмата, студентите на Академијата за Data Science, имаа задача да го изработат нивниот завршен проект. Проектот на којшто тие работеа е Beautif.AI – ios апликација за уредување и подобрување на слики на мобилен уред.

Целта на проектот беше да се изработи робусен класификатор кој ќе предвидува дали одредена слика има дневно небо, ноќно небо или нема да има небо воопшто. Неговото имплементирање во мобилна апликација е најинтересниот процес. Кога корисникот на апликацијата ќе направи некоја слика, класификаторот му нуди опција за уредување на небото доколку сака корисникот, и сл.

За успешно завршување на овој проект, задолжен беше тим 1 со членовите: Јасмина Лавчанска, Ивица Тодоровски, Тина Стефановска, Димитри Ќососки и Полад Емин.

 

 

Ако сакаш да работиш на вакви проекти кои ќе влезат во твоето Data Science портфолио и ќе ти обезбедат голема предност на пазарот на труд, аплицирај за октомврискиот термин на Академијата за Data Science!

 

Во продолжение си поразговаравме со Ивица, Тина, Полад, Јасмина и Димитри за искуството на Академијата и нивниот завршен проект

 

 

Честитки на комплетирањето на програмата и успешно завршениот проект! Ајде да почнеме од почеток, кажете ни нешто повеќе за себе и вашиот кариерен пат до почетокот на Академијата.

Благодариме за честитките! Ние сме еден мешовит тим по повеќе основи: возраст, образование и професионално искуство. Но, како што претпоставувате, заедничка ни е наклонетоста кон податоците и сите анализи кои може да се замислат со нив. Меѓу нас има економисти, инженери, магистри по меѓународни односи, но тоа му даде многу бои на овој тим и го направи комплетен.

 

Кои беа вашите вештини пред да влезете во светот на Data Science и дали имавте предзнаење од оваа област?

Како што споменавме, секој беше вешт во некоја област малку повеќе од другите. Но, не можеме да се пофалиме дека имавме значајни предзнаења. Особено не од програмирање, Python и Machine Learning моделите. Теоретски знаења од математика и статистика имавме сите, од времето на факултетските предавања ☺ Еден наш член имаше искуство и познавање на Java, нешто и од секојдневната работа со Excel и SQL, но тука некаде би завршила листата со предзнаења. Од тука бевме препуштени на Brainster инструкторите и нашата посветеност.

 

Тим 1: Јасмина Лавчанска

 

Вашиот тим работеше на Computer Vision класификација за апликацијата Beautif.Ai. Објаснете ни детално која е целта и мотивот на овој проектот.

Beautif.Аi е мобилна апликација за ios дизајнирана да подредува и подобрува слики на мобилен уред наменет за лична и деловна употреба. Целта на проектот е да се создаде обемен класификатор кој ќе може да открие дали сликата се состои од дневно светло, ноќно небо или без небо. Понатаму, за време на фазата на собирање на бази на податоци, тимот одлучи да се додаде уште една класа со цел да се утврди дали небото на ноќните фотографии е добро одвоено или не.

 

Ваша задача беше да соберете податоци и да направите датасет кој соодветно го поделивте во 4 класи. По направениот датасет, овие податоци требаше да се обработат и испроцесираат за да се спремат во соодветен формат што самиот модел би го примил и би се истренирал. Како вашиот тим успеа да го истренира моделот? 

За да го истренираме моделот, испробавме неколку класификатори на слики кои класифицираат една од четирите категории. За да го конструираме овој класификатор, користевме претходно обучен CNN. Пробавме навистина многу различни pre-trained CNN, ги модифициравме и трениравме. ResNet101 ни даде најдобри резултати, со 90.8%, со Batch Normalization и Drop Out за да ја направиме невронската мрежа помалку чувствителна на специфични тежини и да избегнеме overfit. На датасетот моравме да му направиме одредено ниво на аугументација (ротирање, зум, хоризонтално и вертикално изместување), имајќи на ум дека би се користел како дел од мобилна апликација, чии корисници би правеле фотографии како хоби, фотографирајќи го небото под различни агли.

 

Тим 1: Димитри Ќососки

 

Која фаза од проектот ви претставуваше најголем предизвик?

Имавме неколку предизвици уште на почетокот. Еден од нив беше создавањето на датасетот. Со оглед на тоа што датасетот за ваков проект го сочинуваат фотографии, а ни беше потребна солидна количина, малку се двоумевме како да постапиме. За среќа со малку Google-Fu наидовме на MIT’s Computer Science and Artificial Intelligence Laboratory, чиј The Places365 dataset содржи над 10 милиони фотографии за слични проекти кои одговараа на нашите потреби. Решивме да искористиме само еден дел т.е. само 15% од валидацискиот датасет на High-resolution images subset, на кој му додадовме над 3000 наши фотографии. Понатаму, аугументацијата и тренирањето секако си беа предизвици со свои проблеми.

 

Во кој домен на работа со податоци би сакале да се насочите понатаму?

Сметаме дека уште има за истражување додека да се одлучиме на што би се посветиле. Иако, засега повеќе работиме со табуларни податоци, класификација  и кластерирање. Долг е патот што треба да се помине и да се искористат стекнaтите вештини, како и што треба повеќе да се истражува за да се има конкретна насока. Целосно сите модули од Академијата за Data Science претставуваат задоволство за изучување, но бидејќи секојдневно се среќаваме непосредно со податоци, можеби во домен на манипулација, анализа и автоматизација.

 

Тим 1: Тина Стефановска

 

За време на Академијата се стекнавте со низа на вештини и алатки, вештини кој најдобро се стекнуваат при работа на реални проекти. Како овој проект ви помогна да бидете посигурни и поспремни во работата со овие алатки?

Модулите кои се проаѓаат за време на Академијата за Data Science се интензивни, часовите и вежбите исполнети со куп нови информации, предавачите насочени кон тоа што повеќе да пренесат во ограничениот број на минути кои ги имаме, времето лета од седмица во седмица. И, нема многу време за да се застане, да се провери од каде сме тргнале пред неколку месеци и до каде сме стигнале, со цел да се рефлектира.

После сето тоа апсорбирање на знаење, дојде проектот и малку нѐ протресе. Но, после тоа, емоциите си легнаа на место и на површина излезе дека всушност сме научиле повеќе од што бевме свесни. Тој факт секако помогна да бидеме посигурни во себе, да бидеме посвесни што правиме, да ги поставуваме вистинските прашања на нашиот ментор Кирил, со цел да ја завршиме зададената задача во предвидениот рок и со што е можно подобар prediction score.

Еден од инструкторите ни спомна, во текот на Академијата, дека нема да бидеме свесни колку работи ќе научиме додека не се соочиме со покомплициран проект. Вистина, количината на нови информации и алатки е голема и во еден период човек може да се посомнева дали успеал да совлада сѐ. Но, во истиот момент како почнавме да работиме на проектот, кристално јасно ни беше сето тоа што требаше да го направиме, предизвиците со кои би се соочиле, начините со кои би добиле најдобро решение.

 

Тим 1: Полад Емин

 

Како студенти кои сте дел од оваа најинтензивна програма за Data Science, зошто баш Data Science?

Ако размислувате да се запишете – значи треба да го направите тоа. Data Science е многу интересна област и дава модерен дух на добро познатата статистика, па е добар начин за проширување на опциите за луѓе кои претходно се посветиле на теоретско совладување на математика и статистика. Затоа што Data Science е големо поле кое покрај анализа на податоци и машинско учење вклучува и работа со менаџирање и создавање на решенија за бази, web-scraping, визуализации на податоци, оптимизирање на процеси, истражување, и до некој степен и автоматизација на процеси. На кратко, решава проблеми, сегашни или идни.

 

Кој е вашиот совет за сите идни студенти кои сакаат да направат кариерна трансформација во областа на Data Science?

На новите студенти би им препорачале да го расчистат распоредот за следните 12 месеци и да се подготват да бидат воодушевени колку далеку можат да стигнат. Би им препорачале на сите нови студенти никогаш да не престанат да истражуваат и да размислуваат за реални и корисни примени на сите вештини кои ќе се научат. Навистина има многу нови светови кои треба да се откријат, иако секојдневно се среќаваме со површината, но потоа, реализацијата ќе зависи од колку длабоко ќе се „ископа“. 

 

Уписите за следната група на Академијата за Data Science се во тек! Интересот е преголем и бројот на места – ограничен, затоа резервирај го твоето на време!

Закажи средба со нашиот student success manager за повеќе насоки и детали за програмата!

Биди дел од иднината и соработувај со Brainster преку платформата за иновација.

Имаш потреба од талентиран кадар за твојата компанија? Вработи студент преку нашата платформа 

 

Related Stories For You

Коинвестираме во твојата иднина

Аплицирај за твојот ваучер

11 Компании. 110 Студенти. 1000€ Ваучер.