Razvoj statističkog softvera je uslovljen statističkom praksom, ali isto tako postoji i povratni uticaj razvoja informacione tehnologije na statistiku.

Prva generacija statističkih paketa javlja se 1960-tih godina. Ovi paketi su bili usmereni ka agregaciji, tj. redukciji podataka. Korisnik je imao malo izbora, a obrada je bila paketna. Naglasak je u tom periodu bio na numeričkoj preciznosti. Kasne šezdesete su počele da menjaju ove pretpostavke.

Do kraja 1970-tih se razvila dijagnostika podataka i generalizacija klasičnih modela, a počeli su da se razvijaju i grafički metodi. Interaktivni programi su u to vreme postojali, ali su ih statističari sporo prihvatali.

Veliki napredak se desio na metodima koji zahtevaju intenzivno računanje tokom 1980-tih godina. Tehnike re-uzorkovanja i polu-parametrijski modeli su uklonili okove linearnih modela i normalne teorije. Razvijene su dinamičke grafičke tehnike koje su rukovale sve složenijim podacima.

Mogućnosti statističkog softvera su polako napredovale od redukcije ka produkciji podataka. Širila se i oblast primene statističkog softvera. Statističari su se složili da su alternativna formulacija modela, dijagnostika, grafika i dr. neophodni za valjanu analizu podataka.

Neiskusni korisnici statističkog softvera su u tom periodu bili zanemareni. Inicijalni napori da se statističke ekspertize uključe u softver su imale za cilj da pomognu neiskusnim korisnicima da se snađu u džungli koja je nastala. Međutim, u to vreme još uvek nisu bili razvijeni metodi koji bi ove napore učinili praktičnim. Tipičan dizajn softvera je omogućavao pozadinsku dijagnostiku i izveštavanje samo o neuspešnim proverama, a samo ponekad i sa naznakom mera koje je potrebno preduzeti da bi se problem rešio.

U načelu, ideje usmerene ka uključivanju ekspertize u statističke programe nisu naišle na mnogo entuzijazma u statističkoj zajednici. Najveći kritičari uključivanju ekspertize su upozoravali na nemogućnost automatizacije “umetnosti” analize podatka. Jedan od problema izrade pametnog statističkog softvera je i odsustvo želje statističara da ga naprave, jer im je lakše da pišu knjige.

Kasniji napredak u razvoju statističkih paketa bi se mogao sažeti kao:

  • integracija statističke ekspertize u statističke programe,
  • upravljanje velikim skupovima podataka,
  • implementacija novih algoritama koju je omogućila velika ekspanzija računarske snage.

Statistička ekspertiza treba da bude uključena u softver iz najmanje tri razloga:

  • omogu<ćavanjebolje analize ne-statističarima, kako bi im se pružila pomoć u korišćenju onih tehnika koje statističari smatraju korisnim,
  • stimulacija razvoja boljeg softverskog okruženja za statističare,
  • stuidranje samog procesa analize podataka.

Softver sa statističkom ekspertizom je namenjen pre svega povremenim korisnicima koji žele aktivne sisteme, sisteme koji preuzimaju kontrolu. Oni žele black-box model. S druge strane, profesionalni statističari žele pasivne sisteme, sisteme koji rade po komandi.

Potreba za obradom velikog skupa podataka pojavila se pre svega kao posledica razvoja računarske snage i interneta. Postalo je moguće prikupljanje i skladištenje ogromne količine podataka, a tržišni trendovi su išli u pravcu personalizacije podataka o korisnicima usluga koja je zahtevala mnoštvo podataka o svakom pojedincu ili prikupljanje i obradu velikog broja relevantnih finansijskih i drugih informacija iz preduzeća i njegovog okruženja. Velika količina podataka postavlja izazove pred statističare, kako tehničke tako i metodološke prirode. Zato je bio potreban novi, multidisciplinarni pristup koji je povezao oblasti statistike sa oblastima baza podataka i raznih matematičkih teorija, a sve bazirano na inovativnim konceptima organizacije informaciono-komunikacione tehnike i jačanju snage hardvera.

Jedna od najpoznatijih tehnika koja je nastala kao posledica ovog trenda je rudarenje podataka (engl. data mining). To je proces u kojem se podaci analiziraju iz različitih perspektiva i agregiraju u korisne informacije. Softver za rudarenje podataka omogućava analizu više različitih dimenzija podataka, njihovu kategorizaciju i agregaciju identifikovanih relacija. Sa statističkog aspekta, radi se o pronalaženju korelacija ili obrazaca između velikog broja varijabli (kolona) u velikim relacionim bazama podataka.

Pojava i širenje statističkog softvera je nesumnjivo veoma mnogo doprinela razvoju istraživačkih studija u 21 veku. Statistički softver je glavni alat za istraživačku analizu, validaciju podataka i prezentaciju rezultata istraživanja.

Statistički softver omogućava istraživačima da se oslobode rutinskih matematičkih grešaka i da proizvedu tačne rezultate u svojim istraživanjima, pod uslovom da su uneli tačne podatke. Razvoj statističkog softvera omogućio je više kvantitativnih studija, a istraživači, profesionalci, naučnici i menadžeri mogu mnogo jasnije da predstave tačna predviđanja budućnosti koristeći mogućnosti savremenog statističkog softvera.

Napredak statističkog sotvera je omogućio i poboljšanje kvaliteta istraživačkih studija. Bilo koje kvantitativno istraživanje je nemoguće sprovesti bez statističkog softvera. Šta više, on omogućava profesionalcima interakciju sa podacima, štedeći vreme i oslobađajući prostor za kreativnosti i inovativnost. Statistički softver pojednostavljuje prezentaciju dobijenih rezultata i čini je mnogo efektnijom.