Информациите се насекаде околу нас. Но, дали може да им се верува на сите новости што ги читаме на социјалните медиуми? 

Лажните(невистинити) информации се шират преку социјалните мрежи и медиуми со цел да се изградат или наметнат одредени идеи.

Како со помош на машинско учење може да детектираме невистинити информации на социјалните медиуми пред да се распространат?

Дознај од Ивона Кочева – дипломиран инженер по електротехника и информациски технологии, којa работи како дата научник (data scientist), а воедно е инструктор на нашата Академија за Data Science.

 

Во продолжение, најважните работи кои ги научивме на предавањето:

 

  1. Што се невистинити информации?

Невистинити информации претставуваат делови од вести кои може да се измами/невистини и генерално се шират преку социјалните медиуми и другите онлајн медиуми. Ова често се прави за да се унапредат или наметнат одредени идеи.

 

  1. Што е Artificial Intelligence?

Вештачката интелигенција е дефинирана како поле кое се занимава со генерирање на интелигентни машини за извршување на активностите онака како што би ги извршувал човекот.

 

  1. Што е Data Explosion?

Брзото или експоненцијално генерирање на нови податоци, како и чување на истите не доведува до проблематика која се нарекува “Data Explosion”.

 

  1. Што е машинско учење и како функционира?

Машинското учење е дефинирано како гранка на вештачката интелигенција и компјутерската наука која се фокусира на учење и подобрување на перформансите на компјутерите/машините преку минатото искуство со користење на алгоритми.

 

  1. Што е длабинско учење и како функционира?

Длабокото учење е дефинирано како подмножество на машинско учење и вештачка интелигенција што се базира на вештачки невронски мрежи. Во длабокото учење, збор deep се однесува на бројот на слоеви во невронската мрежа.

 

  1. Појава на проблемот невистинити информации?

На социјалните мрежи, ефектите од ширењето на информациите се случуваат со толку брзо темпо неточните или лажните информации добиваат огромен потенцијал да предизвикаат влијанија во реалниот свет, во рок од неколку минути, за милиони корисници.

 

  1. Која е напредизвикувачката област на машинското учење?

Една од најпредизвикувачките области на машинското учење е онаа што се однесува на јазикот и е позната како обработка на природен јазик (NLP). Обработката на природниот јазик (NLP) се однесува на гранка на вештачката интелигенција или вештачката интелигенција – која се занимава со давање способност на компјутерите да разберат текст и изговорени зборови на речиси ист начин како што тоа го прави човекот.

 

  1. Зошто е важна распределбата на карактери во текстовите?

Распределбата и бројот на карактери во двата типа на текстови различна. 2500 знаци во текстот се најчести во категоријата оригинален/вистински текст, додека околу 5000 знаци во текстот во категоријата лажен текст.

 

  1. Како ќе ги поврземе обработката на текст и машинското учење?

Алгоритмите за машинско учење работат само со нумерички податоци, затоа мораме да ги конвертираме текстуалните податоци во нумерички колони. Значи мораме да го преобработиме текстот и тоа е всушност обработка на природен јазик. Претпроцесирањето на текстот, претставува чистиње на нашиот текст со лематизација, отстранување на запирки, отстранување специјални симболи и бројки, итн.

 

  1. Како може да се откријат лажните вести?

Денес научивме да откриваме лажни вести со AI. Имавме база на податоци за лажни и вистинити вести, имплементиравме функцијата за прочистување на текст, го анализиравме текстот, го иницијализиравме алгоритамот за класификација  и добивме резултати. На крајот добивме точност  >95%. 

 

Уписите за следната група на Академијата за Data Science се во тек! Интересот е преголем и бројот на места – ограничен, затоа резервирај го твоето навреме!

На Академијата за Data Science работиме на реални проекти за реални клиенти, под менторство на докажани и искусни инструктори.

Закажи средба со нашиот student admission team за повеќе насоки и детали за програмата!