Procedure per calcolare la distribuzione di frequenze univariata o bivariata
La distribuzione della frequenza o tabella delle frequenze è un'organizzazione tabellare di dati statistici, che assegna a ciascuna porzione di dati la frequenza corrispondente.
La distribuzione di frequenza univariata fa riferimento ad una sola variabile, per la quale si considerano n unità statistiche e si costruiscono N classi, per cui è necessario calcolare la distribuzione di frequenze delle classi, ovvero contare il numero di unità all’interno di ogni classe. Di seguito si ha una tabella riassuntiva di quanto detto:
Le classi si definiscono, innanzitutto, il minimo che deve essere minore o uguale dei valori disponibili e/o il massimo che deve essere maggiore o uguale dei valori disponibili, poi si definiscono l’ampiezza delle classi che può essere scelta attraverso il rapporto:
Ampiezza= (max -min) / n° cassi
In un’applicazione pratica si possono riordinare le osservazioni in modo crescente e via via che si costruiscono le classi intervallari si contano quante sono le osservazioni che cadono all’interno di ciascuna classe.
Per quanto riguarda la distribuzione bivariata, si effettuano dei ragionamenti analoghi ai precedenti. In questo caso, si considera, però, una tabella a doppia entrata con due variabili X e Y:
la distribuzione di frequenza congiunta indica quante unità statistiche posseggono contemporaneamente un certo valore della variabile X e della variabile Y.
Per costruire questa frequenza congiunta sarebbe opportuno costruire un Array bidimensionale, ma dal punto di vista pratico è meglio utilizzare le liste, ovvero è più semplice considerare la matrice di frequenze come una collezione di righe (liste).
Commenti
Posta un commento