U svih kvantitativnim istraživanjima, nakon definisanja problema istraživanja, određivanja uzorka i ostalih neophodnih elemenata nacrta istraživanja, sledi faza prikupljanja podataka. Da bi prikupljni podaci u istraživanju bili dostupni statističkoj obradi oni se prvo moraju uneti u matricu podataka.

Matrica podataka je dvodimenzionalna tabela u čijim redovima su entiteti, a u kolonama atributi. U društvenim naukama entiteti su uglavnom ispitanici, a atributi varijable istraživanja. Entiteti ne moraju biti samo ispitanici, to mogu biti i proizvodi ljudske delatnosti. Na primer ukoliko se proverava kvalitet nekog proizvoda u redovima matrice podataka bi bili proizvodi, a u kolonama svojstva proizvoda po kojima se vrši provera kvaliteta.

Matrica podataka se sastoji iz kolona, redova i ćelija matrice koje se nalaze u preseku reda i kolone. U kolonama su varijable koje su korišćene u istraživanju, a u redovima su ispitanici. U ćelijama matrice su kodovi, numerisani odgovori ispitanika na određeno pitanje iz upitnika, rezultati merenja, posmatranja. U tabeli dat je primer matrice podataka korišćene u jednom istraživanju.

Red. br Pol Starost Obrazovanje Pitanje1 Pitanje2 ... Pitanjen
1. 1 1 6 3 104    
2. 1 2 7 3 108    
3. 1 1 8 4 108    
...              
4. 2 2 5 4 107    
5. 2 1 6 1 93    
6. 1 1 10 2 103    
...              
n. 1 3 6 2 109    

Uobičajno je da početne kolone u matrici budu nezavisne ili/i deskriptivne varijable istraživanja, a zatim zavisne varijable. Iz kolona ove matrice može se pretpostaviti da je u istraživanju korišćen upitnik i da se radi o anketnom istraživanju.

Varijable se u matrici podataka obično označavaju nekim imenom ili skraćenicom, koje asocira na samu varijablu. Ukoliko je varijabla predugačka (Na pr. „Da li voliš da ideš u školu?“) obično se imenuje rednim brojem iz upitnika. Neki softveri za statističku analizu podataka dozvoljavaju maksimalnu dužinu imena varijable do osam karaktera.

Indentifikacija ispitanika se vrši preko rednog broja u matrici. Preporučljivo je da se i upitnik određenog ispitanika ili instrumenti koje je popunio jedan ispitanik, označi istim brojem, da bi u slučaju greške u unosa podataka lako se došlo do izvora greške.

Matrice se prave kao dvodimenzionalne. Ukoliko u istraživanju postoji više dimenzija, to se rešava tako što se dodaju novi redovi ili kolone. Na primer u longitudinalnim istraživanjima pored ispitanika i varijabli postoji i vreme. Varijable drugog ili n merenja se upisuju u nove kolone.