Академија за Data Science – Завршен проект: Beautif.AI класификација | Тим 1

Сѐ повеќе и повеќе компании почнуваат да ја сфаќаат важноста на податоците и резултатите кои тие можат да ги постигнат. Без оглед на индустријата или големината на бизнисите, организациите кои сакаат да останат на конкурентска позиција во ерата на вештачката интелигенција, треба ефикасно да ги развиваат и имплементираат Data Science способностите или ризикуваат да бидат заборавени.

Data Science е област на студии која се занимава со проучување на огромен број на податоци, ги комбинира програмските вештини, знаењето на математика и статистика, со цел да се извлечат значајни инфoрмации и предвидувања од податоците. 

Со цел да ја комплетираат програмата, студентите од Академијата за Data Science имаа задача да го изработат нивниот завршен проект. Проектот на кој тие работеа е Beautif.AI – ios апликација за уредување и подобрување на слики на мобилен уред.

Целта на проектот беше да се изработи робусен класификатор кој ќе предвидува дали одредена слика е: selfie, outdoor selfie, indoor photo pose, outdoor photo pose и picture without people.

За успешно завршување на овој проект, задолжен беше тим 1 со членовите: Јасмина Радончиќ, Стефан Серафимовски и Ана Николиќ.

 

Ако сакаш да работиш на вакви проекти кои ќе влезат во твоето Data Science портфолио и ќе ти обезбедат голема предност на пазарот на труд, аплицирај за октомврискиот термин на Академијата за Data Science!

 

Во продолжение си поразговаравме со Стефан, Ана и Јасмина за искуството на Академијата и нивниот завршен проект

 

 

Тим честитки! Успешно ја финализиравте оваа супер интензивна 12 месечна програма со изработка на овој завршен проект. Да започнеме како што е редот, кажете ни нешто повеќе за себе и вашиот кариерен пат до почетокот на Академијата.

Стефан, со 4 годишно работно искуство во областа на економијата, веќе некое време заинтересиран за анализа на податоци, на Академијата гледа како извор на релевантни информации и учење на best-practices во областа.

За Ана, електроинженер – автоматичар, главната мотивација беше истражување на можностите кои ги нуди Data Science и нивна примена во инженерството.

Јасмина е бизнис информатичар, на Академијата се запиша со цел да биде во тек и да ги прошири своите познавања на дигитални алатки кои се неопходен дел од оваа интердисциплинарна област.

 

Дали имавте некакво предзнаење и искуство со Data Science пред да се запишете на оваа Академија?

Сите имавме одредени основни познавања од некои од алатките и модулите што ги изучивме во текот на Академијата. Tоа што беше ново за сите нас беше како тие можат да се искомбинираат меѓусебе и целиот тој workflow од почеток до крај.

 

Работевте на проект чија цел беше да се сработи робусен класификатор кој ќе предвидува дали одредена слика е selfie, outdoor selfie, indoor photo pose, outdoor photo posе и picture without people. Накратко, како функционира овој робусен класификатор?

Во принцип, креиравме модел кој ќе може да предвиди во која од погоре наведените класи припаѓа определена слика.  За таа цел искористивме deep learning и transfer learning –  употреба на модел трениран на многу големо податочно множество на нов проблем. MobileNet – невронската мрежа наменета за мобилни апликации, на крај беше нашиот избор и истата ја дотрениравме на нашето податочно множество. На крајот, добивме доста солидни резултати со околу 96% точност во класификацијата.

 

 

Колку време ви беше потребно за да го соберете целиот датасет и како дојдовте до сите слики ?

Прилично брзо успеавме да ги собереме првичните 5000 слики или 1000 слики по категорија, кое го направивме во првите 2-3 дена. Сепак, во текот на тестирањето на различни модели увидовме дека моделите грешат кај сликите во класата „picture without people”. Сликите во таа класа ни беа многу слични една на друга, па така дополнително моравме да додадеме различни видови на слики за оваа класа (food, animals, buildings, landscapes etc.).  Најголемиот дел од сликите ги земавме од интернет.

 

Како најважен дел од овој проект е предпроцесирањето на податоците. Како се снајдовте во овој дел и дали имавте некои потешкотии ? 

Како прибирањето податоци така и овој дел успеавме да го завршиме без многу потешкотии во првата недела. Бидејќи се работи за доста слики, потребно беше малку Python програмирање да се автоматизира целиот процес. Предпроцесирањето вклучуваше конверзија на сликите во RGB, промена на големината на сликите, скалирање на вредностите на пикселите, и аугментација. 

 

Кои модели ги пробавте и кој модел беше најдобар за во продукција ? 

Почнавме од креирање своја custom архитектура на конволуциска невронска мрежа од нула, а потоа преку transfer learning пробавме модели како Xception, Inception, ResNet, VGG и MobileNet. Употребивме некои техники, како задржување на базата и додавање нов класификатор, пресекување на конволуциската база, fine-tunning со одмрзнување на различен број на слоеви од базата.

За најдобар, би го издвоилe MobileNet моделот, пред сѐ затоа што даде одличнa точност, но и бидејќи беше најбрз од сите модели што ги пробавме и би бил најефикасен ако се имплементира во мобилна апликација за каква и го изработувавме овој проект.

 

 

За изработка на овој проект имавте рок од 3 недели. Дали дадениот рок ви беше доволен за да го сработите овој проект ?

Дадениот рок беше сосема доволен за изработка на овој проект со тоа што сите тројца бевме целосно посветени тие 3 недели да го сработиме овој проект со што е можно поголем квалитет.

 

Која фаза од проектот ви беше најголем предизвик?

Како најголем предизвик можеме да го издвоиме процесот на подобрување на моделите што и ни одзема најмногу време и подобрување на самото податочно множество. Сепак, на крај добивме солидни резултати, со кои мислам дека сите тројца можеме да бидеме доста задоволни.

 

За успешно завршен проект потребна е тимски пристап, многу работа, еднаква посветеност на сите членови, работа под притисок и почитување на рок. Како се соочивте со овие предизвици?

Како тим одлично функциониравме. Одлично се согласувавме и функциониравме на тој начин што сите бевме вклучени во сите фази, секој пробуваше различна техника за истата цел или модел и на крај ги споредувавме. Никој од нас не чувствуваше притисок ниту сомнеж дека успешно ќе го завршиме проектот бидејќи еднакво ги распределивме одговорностите. 

 

 

Знаеме дека програмата е супер-интензивна, но кој модул ви претставуваше најголем предизвик?

Со оглед на тоа што немавме некое поголемо искуство во програмирање и машинско учење, Python и Machine Learning модулите ни беа најголем предизвик.

 

Знаејќи го целиот процес, од оваа перспектива, што би смениле во приодот на изучување Data Science? Што би ги советувале сегашните и идните студенти на Академијата за Data Science?

Идните студенти доколку се во можност да се подготват во делот на Python програмирање пред започнување на самата Академија, бидејќи познавањето (макар и делумно) на самиот програмски јазик сигурно ќе им помогне полесно и побрзо да го совладаат материјалот во модулите кои доаѓаат потоа.

 

Уписите за следната група на Академијата за Data Science се во тек! Интересот е преголем и бројот на места – ограничен, затоа резервирај го твоето на време!

Закажи средба со нашиот student success manager за повеќе насоки и детали за програмата!

Биди дел од иднината и соработувај со Brainster преку платформата за иновација.

Имаш потреба од талентиран кадар за твојата компанија? Вработи студент преку нашата платформа 

 

Future-proof кариера во 2025

Aплицирај за early bird

*САМО 14 ДЕНА