Академија за Data Science – Завршен проект: Time Series Prediction

Со цел да ја комплетираат програмата на најинтензивната Академија – Академијата за Data Science, студентите имаа предизвик поделени во тимови да ги изработат своите завршни проекти.
Проектот на кој работеше вториот тим е предвидување на временски податоци (Timeseries Data), што во конкретниот пример се податоци за бруто домашно производство и стапка на долгови на држави.
Поточно, нивната задача беше да се направи предвидување на движењето на стапката на државен долг во однос на БДП во наредниот неколкугодишен период со примена на алгоритмите на машинско учење за предикција.
Тимот кој успешно ја заврши оваа задача и ја комплетираше Академијата за Data Science се состои од членовите: Софија Гошева, Драгана Паховец, Методи Ковачевски и Моника Андоновска.
Дознајте повеќе што ни раскажаа тие за искуството на овој реален проект
Здраво тим! Вие сте едни од најактивните студенти на Академијата за Data Science, кои покажаа голема заинтересираност кон оваа област и не ја пропуштија можноста да учествуваат на проектите. Раскажете ни нешто за себе.
Драгана: Здраво, јас сум Драгана, во последните години работам remote во банкарски сектор. Баш кога ја почнав Академијата бев во фаза на селење во друга земја и поголемиот дел ја проследив надвор од Македонија. Некако, после Ковид изолацијата која траеше баш долго, сфатив дека повеќе не сакам да бидам дел од она секојдневие, каде што секој ден се оди во канцеларија со фиксно време и строго држење до авторитети. Наместо тоа, решив да излезам од таа комфорна зона и да се пробам во нешто ново, каде што истовремено би работела и би била приватно исполнета (па макар била и цел ден во пижами со своите миленици како најверни колеги 🙂).
Софија: Да, комплексноста на Академијата бара посветеност, заинтересираност и голема активност. Учеството во проектите е потребно за да совладува секоја област и секоја алатка. Јас претходно немав никакви ИТ познавања, економист сум, со долгогодишно работно искуство, па упорноста и долгите часови поминати во учење надвор од предавањата ми помогнаа успешно да ја завршам Академијата.
Колеги, зад вас се 12 месеци напорна работа, неколку помали проекти и завршниот проект со кој го заокруживте процесот на едукација на Академијата за Data Science. Честитки за сé што постигнавте во овој период. Како се чувствувате со новостекнатите вештини и постигнувањата од оваа година?
Драгана: Горда сама на себе, но без заборавање дека учењето допрва почнува во оваа област, која е потполно обемна и нова за мене. Секогаш мислев дека ваквите академии се само за „генијалци” за кои јас не се сметам. Се изненадив од самата себе колку многу се може кога љубопитноста и вербата во себе ќе проработат.
Софија: Беше доста напорно, но кога ќе го видиш резултатот на нешто што претходно со саати си го градел, среќно и исполнето. Земјаќи ги предвид сите актуелни придвижувања на полето на вештачката интелигенција, горда сум што со полна концентрација и фокус ги завршив сите модули.
За што бевте задолжени вие како тим? Раскажете ни малку повеќе за целиот проект и процесот на неговата изработка.
Драгана: Јас и Моника како банкарски аналитичари, бевме задолжени за воведниот дел на data preprocessing, каде што расчистувавме, креиравме, објаснувавме, за да после го проследиме истото до останатите колеги кои работеа на креирање на дата моделот и предикциите.,
Софија: Нашиот проект беше прогнозирање на временски серии (Time Series Forecasting). Имавме датасет со податоци за бруто домашен производ, државен долг и стапка на државен долг во однос на БДП, на 193 држави, за 221 година, почнувајќи од 1800 година, па до 2020 година. Задачата беше да го предвидиме движењето на стапката на државен долг во однос на БДП во следниот неколкугодишен период со примена на алгоритмите на машинско учење за предикција. Првиот дел од проектот беше да се исчисти датасетот и да се направи анализа на податоците. Вториот дел беше да се одберат најсоодветни алгоритми за предикција, ние се обидовме со LSTM (Long Short-Term Memory networks) и Prophet на Facebook. Драгана и Моника започнаа со чистење на податоците, анализа и презентирање на постоечките податоци, додека јас и Методи истражувавме кои алгоритми да ги употребиме за прогноза.
Која фаза од проектот ви претставуваше најголем предизвик?
Драгана: Со оглед дека баш во тој период патував и бев многу во движење, и некаде на средина на проектот му дојде крајот на лаптотот кој повеќе не функционираше, лично почувствував колку многу значи тимската работа и разбирањето од колегите и ја користам оваа прилика многу многу да им се заблагодарам и да се надевам дека во иднина можеби и би работела со нив.
Софија: Мене лично, фазата истражување, односно кој модел е најсоодветен за прогноза на временски серии. Изборот нa моделот/метод зависи од многу фактори – контекстот на прогнозата, релевантноста на историските податоци, степенот на прецизност на бараната прогноза, временскиот период што треба да се прогнозира итн. Има бескрајно многу комбинации, но со оглед на времето кое ни беше оставено за изработка на проектот моравме да се одлучиме со што ќе одиме понатаму. Се одлучивме за LSTM и Prophet на Facebook.
Какво беше вашето искуство со овој проект? Дали искористивте сѐ што научивте на Академијата за Data Science или пак беше потребно да излезете од вашата комфорна зона и да навлезете подлабоко во истражувањето?
Драгана: Според мене, најклучната идеја на проектот беше критичното размислување, тој аналитичен дел каде што нема патокази, туку треба да се препуштиш на наученото, споено со искуството и можноста за јасно изразување. Научивме доста, дел од истото го изразивме на самиот проект, но има уште многу многу можности за друг тип на проекти, каде што можеме да го изразиме наученото. Секако, заедно со константно надградување и учење на нови работи.
Софија: Материјалите од предавањата секако дека се првиот избор, но потребни беа уште многу дополнителни истражувања за проблемот и алгоритмите.
И за крај, како си поминавте на Академијата за Data Science? Што би ни споделиле за вашите студентски денови? Дали Академијата ги исполни вашите очекувања?
Драгана: Оваа Академија потполно ме изненади во позитивна смисла. Не верував дека покрај теоретскиот дел ќе има и доста практични вежби и целосна посветеност од страна на инструкторите, кои не ги штедев.. Кај мене, истата отвори нови хоризонти и начини на размислување, а во исто време и поголема верба во своите способности.
Софија: Да, целосно ги исполни очекувањата, особено програмата, начинот на предавањата, онлајн платформата, инструкторите. Топло би ги препорачала!
Доколку сакаш да си дел од Data Science заедницата и заедно со нас да градиш нови успешни приказни во 2023 година, дознај повеќе за Академијата тука.
На Академијата за Data Science учиме преку работа на реални проекти за реални клиенти, под менторство на докажани и искусни инструктори.
Интересот е преголем и бројот на места – ограничен, затоа резервирај го твоето навреме!