Poslovna inteligencija

Termini: Utorkom od 8:00 AM
9. Cas    -    9.5.2017

Prezentacije

    Evidence and probabilities
    Representing and mining text
    


8. Cas    -    25.4.2017
    
    LSTM prezentacija


7. Cas    -    11.4.2017


6. Cas     -    4.4.2017
    
    Ponavljanje i priprema prezentacija5. Cas    -    28.3.2017
    Slajdovi
  
Interesantan clanak na temu data mining, posebno latent semantic analysis.    4. Cas    -    21.3.2017
    Slajdovi

3. Cas     -    14.3.2017    
    Data mining proces iz poslovne perspektive
    Slajdovi
    
    Rad

    K-Anonymity, Sweeney

Interesantan clanak na temu big data, psihometrije i politike2.    Čas    -    7.3.2017
        DDD sa primerima
        Šta znače različiti termini i u kom kontekstu se pominju
        Analitičko razmišljanje
        Primer: Online prodaja automobila
        Vizualizacija
        Odabir atributa sa elastic net
        Big Data 1 -> Big Data 2
        Data science kao strateško sredstvo
        Slajdovi


        Podaci za analizu:

        Prosti podaci o kolima (csv) 

        Ovi podaci sadrže samo godinu proizvodnje, kilometražu, snagu motora, proizvođača i cenu po kojoj su ponuđeni na sajtu

        Ne struktuirani podaci o kolima (text)

        Ovo je relativno ne struktuiran tekst, u svakoj liniji se nalazi opis jednog vozila.
        Pogodne tehnike za izdvajanje atributa su bag of words model, kao i ostale. Labele se mogu uzeti iz prostih podataka pošto je redosled primera isti.
        Tekst je samo delimično prečišćen i spreman za obradu.

        Napomena: Moj program je izdvojio 13994 primera sa 4335 atributa koji u glavnom imaju smisla iz teksta. Treniranje neuralne mreže sa svim podacima je trajalo 4:30 na GTX770 grafičkoj kartici sa 33.9% iskorišćene memorije i 6:50 na i5-4670 @ 3.4            GHz, sa trainscg trening funkcijom.

        Napredne tehnike za izdvajanje kljucnih reci su Latent Dirichlet Allocation

        Radovi: 

        Dobar rad na temu topic modeling. Svaka linija u fajlu sa kolima bi bila dokument u ovoj interpretaciji. Ova tehnika je usko povezana sa Latent Semantic Analysis.

        Probabilistic topic modeling
        pdf
 
        Martin Kulldorff "A Spatial Scan Statistic"
        pdf

        Ovaj rad je originalni "scan statistic" rad, obratite pažnju da je samo jedan autor. 

        Neill Daniel "A Bayesian Spatial Scan Statistic"
        pdf

        Ovo je jedan od prvih u seriji od ovog autora. Videti sajt autora profesora Neill na CMU za koje je onda masovno koristio sličnu metodologiju.
        sajt

1.     Čas    -    28.2.2017
    Uvodno predavanje
        Priča o predmetu
        Šta je data mining, machine learning i data science
        Kako se primenjuje sa primerima za Amazon i Walmart