Со цел да ја комплетираат програмата на најинтензивната Академија – Академијата за Data Science, студентите имаа предизвик поделени во тимови да ги изработат своите завршни проекти.
Проектот на кој работеше првиот тим е во доменот на NLP (Natural Language Processing), каде што студентите преку научените методологии од Machine Learning ги анализираа податоците за да откријат скриени релации и информации.
Поточно, нивната задача беше да се направи анализа на твитови од 16 различни извори во временски период од 5 години со цел да се утврди сличноста на темите на твитовите поврзани со темата „здравје” по извор и период, и да се утврди кој извор какви информации публикувал и која тема била застапена низ времето.
Тимот кој успешно ја заврши оваа задача и ја комплетираше Академијата за Data Science се состои од членовите: Татјана Вељковиќ, Илија Тодоров и Ивана Томовска.
Дознајте повеќе што ни раскажаа тие за искуството на овој реален проект
Здраво тим! Вие сте едни од најактивните студенти на Академијата за Data Science, кои покажаа голема заинтересираност кон оваа област и не ја пропуштија можноста да учествуваат на проектите. Раскажете ни нешто за себе.
Ивана: Здраво, јас сум Ивана и доаѓам од секторот за меѓународен развој како програмски менаџер. Како што пишува и на мојот LinkedIn профил, јас сум голем поддржувач на идеата на доживотно учење, сакам да откривам и истражувам нови работи. Data Science и нејзината употреба во модерното општество е во мојот фокус.
Татјана: Дипломиран економист од областа на деловна економија со магистратура од областа на финансиски менаџмент, која повеќе од 15 години работи како специјалист за инвестиции во инвестициски фондови кои се занимаваат со сопственичко вложување во компании од различни индустрии. Анализата на податоци ми е пасија.
Илија: Здраво, јас сум Илија. Доаѓам од ИТ област, односно дипломиран компјутерски инженер. Моментално работам како софтвер инженер, скоро 3 години. Секогаш сакам да истражувам нови нешта, нови знаења, да се надградувам професионално и во секој друг аспект. Отсекогаш сум сакал да анализирам, па Data Science областа е перфектна гранка за тоа.
Зад вас е една година напорна работа која резултираше со овој доста напреден проект во доменот на Natural Language Processing. Можеби најдобар индикатор за остварениот прогрес ќе биде да ни кажете дали и какви предзнаења имавте пред да се запишете на Академијата за Data Science?
Ивана: На Академијата за Data Science се приклучив како релативен почетник. Во претходните работни искуства, работев со голем број на податоци – квалитативни и квантитативни, но секогаш ми остануваше прашањето како најдобро да се искористат овие податоци за да се донесат програмски решенија. Така и ми произлезе идејата да се задлабочам во полето на data science.
Илија: Јас имав доста предзнаења за Академијата, сепак доаѓам од ИТ сектор, дел од работите ми беа познати, но имаше поголем дел што како поими сум ги сретнал, но не бев толку запознаен како работат и како функционираат. Сега можам да кажам дека имам доста подобра слика за поголемиот дел од работате коишто ги учев низ текот на моето образование. Ќе ја издвојам математиката бидејќи отсекогаш се прашував зошто ги учиме сите тие работи и каде ќе ни се „најдат“.🙂
Татјана: На Академијата се приклучив со познавање на Microsoft Office пакетите Excel, Word, Power Point, стекнато преку користење во текот на работа, значително работно искуство во анализа на податоци и претходното академско обрзование од областа на економските науки.
NLP е доста модерна технологија во моментов која доста се применува во бизнисите. Што точно беше вашата задача и кој е мотивот зад овој проект. Каде сé ја гледате неговата примена?
Задачата беше да се направи анализа на твитови од 16 различни извори во временски период од 5 години со цел да се утврди сличноста на темите на твитовите поврзани со темата „здравје” по извор и период, и да се утврди кој извор какви информации публикувал и која тема била застапена низ времето.
Во текот на работата, анализиравме и обработивме податоци во вид на бројки, така што обработка и анализа на текст беше нешто ново за нас. Предивикот беше поголем бидејќи во текот на предавањата на Академијата во модулот Машинско учење, NLP како тема беше застапено со помал фонд на часови, па работата на овој проект беше шанса за стекнување на дополнително знаење и искуство во оваа област.
Natural Language Processing (NLP) ја опишува интеракцијата помеѓу човечкиот јазик и компјутерите. Тоа е технологија што многу луѓе ја користат секојдневно и постои со години. Неколку примери на NLP што луѓето ги користат секој ден се: проверка на правопис, филтри за спам, поврзани клучни зборови на пребарувачите, Siri, Alexa или Google Assistant.
Има безброј можности за NLP да се вклучи и да го подобри начинот на кој работи една компанија. Ова е особено важно и применливо за големите бизниси кои сакаат да следат и анализираат илјадници интеракции со клиентите, на пример повратна информација за квалитет на услуга или производ со цел истите да ги подобрат. Речиси е невозможно човекот да ги анализира и интерпретира сите тие податоци, NLP тука може многу да помогне да се постигне посакуваната цел.
Како успеавте да се справите со сите предизвици кои ви застанаа на патот додека да стигнете до финалното решение?
Татјана: Предизвиците ги надминавме низ интензивна тимска работа и со помош на нашиот ментор Горјан Поповски кој извонредно добро нѐ водеше низ процесот до финалното решение. Неговите смерници, предлози и сугестии ни помогнаа да го изработиме проектот во рамките на предвиденото време и да ја постигнеме целта која беше поставена.
Ивана: Се согласувам, тимската работа беше клучна и поттикот и мотивацијата што ја дававме меѓусебно, затоа што процесот не беше лесен и бараше доста фокус и часови минати во истражување, кодирање и тестирање.
Илија: Најважна беше тимската работа и комуникацијата во тимот. Поделбата на работата, ја делевме во сегменти, па на крај го склопувавме сработеното. Со огледа на тоа што темата ни беше нова и малку позната имавме доста предизвици во самиот процес, но со добро водење од нашиот ментор Горјан Поповски и со многу истражување – успеававме да ги надминеме предизвиците.
Дали овој подем на автоматизација уште повеќе ќе ја зголеми побарувачката на Data Scientists и Machine Learning инженери?
Илија: Дефинитивно! Секој сака да дознае што би му користело, а што не. Исто така, секој сака да е чекор пред конкуренцијата, а со овој процес може да се извлечат доста такви информации.
И за крај, како си поминавте на Академијата за Data Science? Што би ни споделиле за вашите студентски денови? Дали Академијата ги исполни вашите очекувања?
Татјана: Завршувањето на Академијата за Data Science на Brainster го сметам за многу вредно вложување во себе-надградување во насока која во вистинско време отвора многу нови можности за нови работни ангажмани.
Изборот на модулите на Академијата, нивниот редослед, нивната содржина и опфатот на материјата, количината и тајмингот на работа на проекти се навистина многу добро осмислени и дизајнирани да го водат студентот постепено да ги совладува. Предавачите се искусни професионалци кои со многу трпение ја предаваат материјата на студенти кои за првпат се среќаваат со соодветната тематика. Она што треба студентот да направи е да вложи многу труд и време, и како и во било кој друг процес на учење или работа преку редовност, посветенот и упорност да ја совлада материјата.
Ивана: Да, дефинитивно – кога ќе се навратам наназад и кога ќе видам колку нови вештини и алатки научивме за минатата година, многу сум задоволна со тоа што постигнавме како Група 7.
Илија: Многу убаво! Да бидеме искрени целокупната програма е доста напорна и бара да се вложи доста труд и време. Покрај работата која секако исцрпува и одзема доста време, па со самото тоа го отежнува останатиот дел. Но и покрај тоа кога ќе се земе предвид колку се учи, останатото се заборава. Се стекнавме со знаења што секако многу ќе ни користат во иднина, не само за оваа област, туку во многу други области.
Доколку сакаш да си дел од Data Science заедницата и заедно со нас да градиш нови успешни приказни во 2023 година, дознај повеќе за Академијата тука.
На Академијата за Data Science учиме преку работа на реални проекти за реални клиенти, под менторство на докажани и искусни инструктори.
Интересот е преголем и бројот на места – ограничен, затоа резервирај го твоето навреме!