Automatizacija: budućnost znanosti o podacima i strojnog učenja?

Strojno učenje jedno je od najvećih dostignuća u povijesti računalstva, a sada se smatra da može odigrati važnu ulogu na području velikih podataka i analitike. Analitika velikih podataka veliki je izazov iz perspektive poduzeća. Na primjer, aktivnosti kao što su razumijevanje velikog broja različitih formata podataka, analiza pripreme podataka i filtriranje suvišnih podataka mogu biti intenzivni. Zapošljavanje stručnjaka za podatkovne znanosti skup je prijedlog, a ne sredstvo za postizanje cilja svake tvrtke. Stručnjaci vjeruju da strojno učenje može automatizirati mnoge zadatke povezane s analitikom - rutinske i složene. Automatsko strojno učenje može osloboditi značajna sredstva koja bi se mogla koristiti za složeniji i inovativniji rad. Čini se da se strojno učenje stalno kreće u tom smjeru.

Automatizacija u kontekstu informacijske tehnologije

U informatičkoj tehnologiji automatizacija je povezivanje različitih sustava i softvera koji im omogućuje izvršavanje posebnih zadataka bez ikakve ljudske intervencije. U IT -u automatizirani sustavi mogu obavljati jednostavne i složene poslove. Primjer jednostavnog posla može biti integriranje obrazaca s PDF-ovima i slanje dokumenata točnom primatelju, dok pružanje sigurnosnih kopija izvan web-mjesta može biti primjer složenog posla.

Da biste pravilno obavljali svoj posao, morate programirati ili dati jasne upute automatiziranom sustavu. Svaki put kad je za promjenu opsega posla potreban automatizirani sustav, netko mora ažurirati program ili skup uputa. Iako je automatizirani sustav učinkovit u svom poslu, greške se mogu pojaviti iz različitih razloga. Kad se pojave greške, potrebno je identificirati i ispraviti osnovni uzrok. Jasno je da za obavljanje svog posla automatizirani sustav u potpunosti ovisi o ljudima. Što je priroda posla složenija, veća je vjerojatnost pogrešaka i problema.

Uobičajeni primjer automatizacije u IT industriji je automatizacija testiranja web sučelja korisničkog sučelja. Testni slučajevi unose se u skriptu za automatizaciju i sukladno tome testira se korisničko sučelje. (Za više informacija o praktičnoj primjeni strojnog učenja pogledajte Strojno učenje i Hadoop u Detekciji prijevara sljedeće generacije.)

Argument u korist automatizacije je da obavlja rutinske i ponovljive zadatke te oslobađa zaposlenike za obavljanje složenijih i kreativnijih zadataka. Međutim, također se tvrdi da je automatizacija isključila veliki broj zadataka ili uloga koje su prethodno obavljali ljudi. Sada, s ulaskom strojnog učenja u različite industrije, automatizacija može dodati novu dimenziju.

Budućnost automatiziranog strojnog učenja?

Bit strojnog učenja je sposobnost sustava da kontinuirano uči iz podataka i razvija se bez ljudske intervencije. Strojno učenje može djelovati poput ljudskog mozga. Na primjer, mehanizmi preporuka na web stranicama za e-trgovinu mogu procijeniti jedinstvene preferencije i ukuse korisnika te dati preporuke o najprikladnijim proizvodima i uslugama za odabir. S obzirom na ovu mogućnost, strojno učenje smatra se idealnim za automatiziranje složenih zadataka povezanih s velikim podacima i analitikom. Prevazišao je velika ograničenja tradicionalnih automatiziranih sustava koji ne dopuštaju redovitu ljudsku intervenciju. Postoji više studija slučaja koje pokazuju sposobnost strojnog učenja za izvršavanje složenih zadataka analize podataka, o čemu će biti riječi kasnije u ovom radu.

Kao što je već napomenuto, analiza velikih podataka izazov je za poduzeća, koji se može djelomično prenijeti na sustave strojnog učenja. Iz poslovne perspektive, to može donijeti mnoge prednosti, poput oslobađanja resursa znanosti o podacima za kreativnije i važnije zadatke, veće radno opterećenje, manje vremena za izvršavanje zadataka i isplativost.

Studija slučaja

U 2015. istraživači s MIT -a počeli su raditi na alatu za znanost o podacima koji može stvoriti prediktivne modele podataka od velikih količina sirovih podataka pomoću tehnike koja se naziva algoritmima za dubinsku sintezu značajki. Znanstvenici tvrde da algoritam može kombinirati najbolje značajke strojnog učenja. Prema znanstvenicima, testirali su ga na tri različita skupa podataka i proširuju testiranje na još više. U radu koji će biti predstavljen na Međunarodnoj konferenciji o znanosti o podacima i analitici, istraživači James Max Kanter i Kalyan Veeramachaneni rekli su: "Koristeći automatizirani proces ugađanja, optimiziramo cijeli put bez ljudskog sudjelovanja, dopuštajući mu generalizaciju na različite skupove podataka".

Pogledajmo složenost zadatka: algoritam ima ono što je poznato kao sposobnost automatskog prilagođavanja, pomoću kojega se mogu dobiti ili izvući uvidi ili vrijednosti iz sirovih podataka (kao što su dob ili spol), nakon čega se predviđaju podaci modeli se mogu stvarati. Algoritam koristi složene matematičke funkcije i teoriju vjerojatnosti koja se naziva Gaussova kopula. Stoga je lako razumjeti razinu složenosti koju algoritam može podnijeti. Ova je tehnika također osvajala nagrade na natjecanjima.

Strojno učenje moglo bi zamijeniti domaću zadaću

Diljem svijeta raspravlja se o tome da bi strojno učenje moglo zamijeniti mnoge poslove jer obavlja zadatke s učinkovitošću ljudskog mozga. Zapravo, postoji zabrinutost da će strojno učenje zamijeniti znanstvenike o podacima, a čini se da postoji osnova za takvu zabrinutost.

Za prosječnog korisnika koji nema vještine analize podataka, ali ima različite stupnjeve analitičkih potreba u svom svakodnevnom životu, nije izvedivo koristiti računala koja mogu analizirati ogromne količine podataka i pružiti podatke za analizu. Međutim, tehnike obrade prirodnog jezika (NLP) mogu prevladati ovo ograničenje poučavanjem računala prihvaćanju i obradi prirodnog ljudskog jezika. Na taj način prosječnom korisniku nisu potrebne sofisticirane analitičke funkcije ili vještine.

IBM vjeruje da se potreba za znanstvenicima podataka može minimizirati ili ukloniti putem njegovog proizvoda, platforme Watson Natural Language Analytics. Prema Marcu Atschulleru, potpredsjedniku za analitiku i poslovnu inteligenciju u Watsonu, „S kognitivnim sustavom poput Watsona samo postavljate svoje pitanje - ili ako nemate pitanje, samo prenesite svoje podatke i Watson ga može pogledati i zaključite što biste htjeli znati. ”

Zaključak

Automatizacija je sljedeći logičan korak u strojnom učenju i već doživljavamo učinke u svakodnevnom životu-web stranice za e-trgovinu, prijedlozi prijatelja na Facebooku, prijedlozi LinkedIn mreže i ljestvice Airbnb pretraživanja. Uzimajući u obzir navedene primjere, nema sumnje da se to može pripisati kvaliteti rezultata koji proizvode automatizirani sustavi strojnog učenja. Usprkos svim svojim kvalitetama i prednostima, ideja strojnog učenja koja uzrokuje ogromnu nezaposlenost čini se pomalo pretjeranom. Strojevi su desetljećima zamjenjivali ljude u mnogim dijelovima našeg života, ali ljudi su se razvili i prilagodili kako bi ostali relevantni u industriji. Prema gledištu, strojno učenje za sve svoje poremećaje samo je još jedan val na koji će se ljudi prilagoditi.


Vrijeme objave: kolovoz-03-2021