URN_NBN_SI_DOC-RKSH48DC

SIR * IUS, september 2020 70 Izraza umetna inteligenca in strojno učenje sta se v zadnjih letih izmenjaje uporabljala za opis praktičnih rešitev, zasnovanih na uporabi umetne inteligence, v mnogih podjetjih, predvsem zaradi velikega uspeha metod strojnega učenja. V strogem pomenu pa se moramo zavedati, da strojno učenje pomeni sposobnost samodejnega učenja iz podatkov, medtem ko umetna inteligenca vključuje učenje skupaj še z nekaterimi drugimi funkcijami. 2.1. Proces strojnega učenja Strojno učenje je namenjeno odkrivanju uporabnega znanja v surovih podatkih. Celoten proces strojnega učenja je netrivialen proces identifikacije veljavnih, novih, potencialno uporabnih in popolnoma razumljivih vzorcev v podatkih (slika 1). V tem kontekstu je vzorec ekvivalenten modelu, ki podaja relacije (strukturo) v podatkih. Vzorci so veljavni, če z določeno stopnjo gotovosti držijo za dane podatke. Razumljivost sme biti zagotovljena tudi z naknadnim procesiranjem, sami koraki procesa pa se običajno ponavljajo v več iteracijah, skozi katere na osnovi rezultatov predhodnih iteracij postopoma izboljšujemo oz. optimiziramo proces. Slika 1: Proces strojnega učenja oz. odkrivanja znanja v podatkih [4] Koraki procesa strojnega učenja so naslednji: • Proces strojnega učenja zmeraj začnemo s fazo analize oz. spoznavanjem problemske/aplikacijske domene, ki obvezno vključuje določanje ciljev, ki bi jih radi z izvedbo procesa dosegli. • Sledi oblikovanje ciljnega nabora podatkov. Obseg in kakovost podatkov sta ključna za vsak proces strojnega učenja, zato jima je treba nameniti dovolj pozornosti. Kakovostni podatki sami po sebi seveda še ne zagotavljajo uspešne inteligentne rešitve, dejstvo pa je, da smo brez kakovostnih podatkov gotovo obsojeni na neuspeh. Rezultat tega koraka je tako izbira podmnožice zapisov in spremenljivk, iz katerih bo izpeljano znanje. • Naslednji korak je čiščenje in predprocesiranje podatkov, k čemur med drugim sodijo odstranjevanje šuma, obravnava manjkajočih polj, nepoznanih vrednosti in sekvenčnih informacij. Med predprocesiranje štejemo še redukcijo in projekcijo podatkov, ki zajema iskanje alternativnih predstavitev

RkJQdWJsaXNoZXIy