Termini: Utorkom od 8:00 AM https://docs.google.com/spreadsheets/d/1rmExeq6BUzwVVnUTktUMVt37d2veARPzjq3C6Hn1Guc/edit?usp=sharing 9. Cas - 9.5.2017 Prezentacije Evidence and probabilities Representing and mining text 8. Cas - 25.4.2017 LSTM prezentacija 7. Cas - 11.4.2017 6. Cas - 4.4.2017 Ponavljanje i priprema prezentacija 5. Cas - 28.3.2017 Interesantan clanak na temu data mining, posebno latent semantic analysis. 4. Cas - 21.3.2017 3. Cas - 14.3.2017 Data mining proces iz poslovne perspektive K-Anonymity, Sweeney Interesantan clanak na temu big data, psihometrije i politike 2. Čas - 7.3.2017 DDD sa primerima Šta znače različiti termini i u kom kontekstu se pominju Analitičko razmišljanje Primer: Online prodaja automobila Vizualizacija Odabir atributa sa elastic net Big Data 1 -> Big Data 2 Data science kao strateško sredstvo Podaci za analizu: Prosti podaci o kolima (csv) Ovi podaci sadrže samo godinu proizvodnje, kilometražu, snagu motora, proizvođača i cenu po kojoj su ponuđeni na sajtu Ovo je relativno ne struktuiran tekst, u svakoj liniji se nalazi opis jednog vozila. Pogodne tehnike za izdvajanje atributa su bag of words model, kao i ostale. Labele se mogu uzeti iz prostih podataka pošto je redosled primera isti. Tekst je samo delimično prečišćen i spreman za obradu. Napomena: Moj program je izdvojio 13994 primera sa 4335 atributa koji u glavnom imaju smisla iz teksta. Treniranje neuralne mreže sa svim podacima je trajalo 4:30 na GTX770 grafičkoj kartici sa 33.9% iskorišćene memorije i 6:50 na i5-4670 @ 3.4 GHz, sa trainscg trening funkcijom. Napredne tehnike za izdvajanje kljucnih reci su Latent Dirichlet Allocation Radovi: Dobar rad na temu topic modeling. Svaka linija u fajlu sa kolima bi bila dokument u ovoj interpretaciji. Ova tehnika je usko povezana sa Latent Semantic Analysis. Probabilistic topic modeling Martin Kulldorff "A Spatial Scan Statistic" Ovaj rad je originalni "scan statistic" rad, obratite pažnju da je samo jedan autor. Neill Daniel "A Bayesian Spatial Scan Statistic" Ovo je jedan od prvih u seriji od ovog autora. Videti sajt autora profesora Neill na CMU za koje je onda masovno koristio sličnu metodologiju. 1. Čas - 28.2.2017 Uvodno predavanje Priča o predmetu Šta je data mining, machine learning i data science Kako se primenjuje sa primerima za Amazon i Walmart ![]() ![]() |