Vai al contenuto
  • Servizi per lo studio
  • Test di ammissione
  • Esame di maturità
  • Esami Universitari
  • Corsi di lingue
  • Orientamento
  • Formazione professionale
  • Blog

  • Su UniD Formazione
  • Chi siamo
  • Lavora con noi
  • Assistenza clienti

  • Contattaci
logo2018
logo2018

Test di ammissione all’Università: Corsi, Libri e Orientamento

logo2018
Sotto l'header
  • Test di ammissione
  • Esame di maturità
  • Esami universitari
  • Corsi di lingue
  • Orientamento
  • Formazione professionale
  • Blog

L’indice V di Cramer e il grado di connessione

L’indice V di Cramer e il grado di connessione

indice V di Cramer
  • Nausicaa Tecchio
  • 27 Maggio 2024
  • Consigli per lo studio
  • 5 minuti

Indice V di Cramer e l'associazione fra due variabili qualitative

Per studiare il grado di associazione fra due variabili qualitative si utilizza spesso l’indice V di Cramer. Il suo calcolo si basa sul test del Chi-quadrato e prende il nome dal matematico svizzero Carl Harald Cramér che lo inventò nel 1946. I valori che può assumere rientrano nell’intervallo fra 0 e 1, dove lo zero corrisponde a un grado nullo di associazione.

Quando invece il valore di V è uguale a uno significa che le due variabili o i due caratteri che si stanno considerando tra di loro sono in correlazione perfetta. Per indicare le due variabili si utilizzano X e Y. 

Indice
Supera il Test di ingresso
Preparati alle prove di ammissione con i libri e corsi UnidTest
Scopri di più

Cos’è l’indice V di Cramer

Come abbiamo detto si tratta di una misura statistica che si può ricavare dal test del chi-quadrato (χ²). Si tratta di un sistema di verifica di ipotesi per valutare se le frequenze osservate in uno o più gruppo corrispondano alle frequenze attese. L’esempio classico per spiegare questo test è la frequenza dei caratteri per verificare la terza legge di Mendel (quella dell’assortimento indipendente).

Uno dei pregi di questa misura di associazione è che risulta chiara e facile da interpretare rispetto ad altri indicatori come il coefficiente di correlazione di Pearson. L’indice V di Cramer varia fra 0 e 1, mentre quello di Pearson fra i valori -1 e + 1, dove lo zero è la misura intermedia che corrisponde a una correlazione positiva e non a un’assenza di dipendenza fra i caratteri.

Per riuscire a trovare il valore dell’indice è necessario considerare le dimensioni della tabella di contingenza, ovvero il numero di righe e di colonne che presenta. La formula per calcolarlo è V =√ (χ2/n)/min[(n -1),(c – 1)] dove r e c indicano proprio le righe e le colonne di questa tabella. Il simbolo χ2 rappresenta valore del chi-quadro mentre n è la numerosità del campione.

Volendo si può dire in breve che il valore di V rappresenta la radice quadrata del Chi-quadrato normalizzato. Per interpretare il suo valore occorre fare riferimento sempre alla tabella di contingenza e in particolare ai gradi di libertà, ossia al denominatore della formula.

Un esempio pratico di applicazione di V

Proviamo ora a vedere un caso in cui sia necessario stabilire l’associazione fra due variabili tramite l’indice V di Cramer. Stabiliamo due variabili, come ad esempio i due sessi (maschio e femmina) e la presenza o meno di dipendenza dall’alcol (si o no). A questo punto si può costruire una tabella di contingenza a doppia entrata in cui riportare le frequenze osservate per le quattro categorie individuate dall’associazione fra le variabili. 

A questo punto si devono considerare le frequenze attese, ossia i numeri che ci si aspetterebbe in caso le due variabili fossero in rapporto di indipendenza. Ricavarle è semplice, basta fare ad esempio il prodotto fra i maschi fumatori per il totale degli uomini e delle donne fumatrici per il totale delle donne, dividendo poi i risultati ottenuti per la numerosità campionaria. 

Più i valori delle due tabelle (frequenze osservate e attese) risulteranno simili minore sarà il grado di associazione che ricaverà dall’indice V di Cramer. Qualora invece questi risultino molto diversi potrò presumere una certa dipendenza fra le variabili scelte, in questo caso sesso e dipendenza dall’alcol.

Una volta ricavato il chi-quadrato utilizzando un software di statistica come R si può passare a sostituire nella formula vista prima i valori della tabella. Quindi righe (r) e colonne (c) diminuite di una unità, insieme al numero di osservazioni totali che andrà al posto di n. A questo punto in base al valore di V che otteniamo possiamo stabilire il grado di associazione. Più è grande maggiore sarà la dipendenza fra le due. 

Interpretare l’indice V di Cramer

Come accennato questa misura può variare fra un valore minimo pari a 0 e uno massimo che è uguale a 1. Tuttavia per capire quanto forza risulti l’associazione fra le variabili occorre considerare anche il numero di gradi di libertà, che si ricavano da min[(n -1),(c – 1)]. Nel caso in cui ci sia un solo grado di libertà ad esempio si può parlare di associazione alta se V è maggiore di 0,5. e bassa se inferiore a 0,1. 

Man mano che il numero di gradi aumenta però sarà cessaria una soglia dell’indice V di Cramer sempre più bassa per parlare di dipendenza fra le variabili considerate. Già se salgono a due il valore di V è sufficiente che superi 0,35 per dedurre che c’è un alto indice di associazione, e medio se il valore è attorno a 0,21. Un salto notevole rispetto a un grado solo.

Nel momento in cui i gradi superano il tre allora si parla di V alto anche al di sotto di 0,3. Per esempio quando una delle variabili è il colore degli occhi e quindi i colori possibili sono diversi, o quando si considerano i voti ottenuti a un esame. Se si hanno 4 gradi di libertà l’associazione fra le variabili è stretta intorno allo 0,25, media quando è circa 0,15 e minima solo quando è prossimo allo zero (0,05).

I limiti di questa misura di associazione

In Statistica ogni test ha dei limiti dato che non possono restituire un risultato certo ma solo con una probabilità elevata. Questo riguarda anche l’indice V di Cramer, in particolare in un caso che riguarda tutti i test di verifica di ipotesi. Ovvero quando ci troviamo di fronte a dei dataset che hanno un’estensione molto limitata. Avere pochi dati vuol dire non avere informazioni sufficienti per comprendere la situazione reale.
 

Per definire piccolo un dataset basta che le osservazioni anche solo di uno dei gradi della variabile risultino pari o inferiori a 5. La cosa migliore se le altre frequenze sono tarate su campioni più numerosi conviene escludere la colonna o la riga basate su dati troppo esigui. In questo modo non si rischierà di inficiare l’intera analisi, anche se escluderà alcuni casi. 

Entra all'università con UnidTest
Corsi in presenza
Scopri i corsi in 45 città e in diretta eLearning
Iscriviti ora!
Preparati online
Scopri i corsi on demand disponibili 24 ore su 24
Iscriviti ora!
Piattaforma Genius
Migliora le tue performance con la nostra piattaforma online
Iscriviti ora!
Condividi su
Facebook
LinkedIn
Email
WhatsApp
Scritto da
Picture of Nausicaa Tecchio
Nausicaa Tecchio
Ghostwriter e copywriter freelance
Categorie
Categorie
  • Concorsi (44)
  • Consigli per lo studio (505)
  • Digital marketing (396)
  • Guide (180)
  • Lingue (103)
  • News (293)
  • Orientamento (196)
  • Test universitari (164)
  • Tutti (3)
  • Università (240)
  • Vendita e comunicazione (163)
Iscriviti alla newsletter

Ricevi i nostri migliori articoli, contenuti gratuiti, offerte riservate e tanto altro!

google news

Ricevi le nostre notizie da Google News

Seguici
Test di ammissione all'università: Corsi, Libri e Orientamento
UNID FORMAZIONE
  • Test di ammissione
  • Esame di maturità
  • Esami universitari
  • Corsi di lingue
  • Orientamento
  • Formazione Professionale
  • Termini e Condizioni
CONTATTI

Via degli Aceri, 14
47890 Gualdicciolo (RSM)
0549.980007
info@unidformazione.com
Chi siamo | Sedi | Contatti
Lavora con noi | Redazione

CONSIGLIA AD UN AMICO

Iscriviti alla Newsletter

Sicurezza negli acquisti online
Paga fino a 36 rate con: PayPal, Alma, HeyLight. Paga in unica soluzione con: Carta di Credito, Apple Pay, Google Pay, Bonifico Bancario.

pagamenti accettati
© Copyright 2025 - UNID S.r.l. - Codice Operatore Economico: SM22747 - Via degli Aceri, 14 - 47890 Gualdicciolo (RSM)
Iscrizione registro eCommerce n. 150 | Privacy
logo2018
Gestisci la tua privacy
Utilizziamo tecnologie come i cookie per memorizzare e/o accedere alle informazioni del dispositivo. Lo facciamo per migliorare l'esperienza di navigazione e per mostrare annunci (non) personalizzati. Il consenso a queste tecnologie ci consentirà di elaborare dati quali il comportamento di navigazione o gli ID univoci su questo sito. Il mancato consenso o la revoca del consenso possono influire negativamente su alcune caratteristiche e funzioni.
Funzionale Sempre attivo
L'archiviazione tecnica o l'accesso sono strettamente necessari al fine legittimo di consentire l'uso di un servizio specifico esplicitamente richiesto dall'abbonato o dall'utente, o al solo scopo di effettuare la trasmissione di una comunicazione su una rete di comunicazione elettronica.
Preferenze
La memorizzazione tecnica o l'accesso è necessario per lo scopo legittimo di memorizzare le preferenze non richieste dall'abbonato o dall'utente.
Statistiche
L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici. L'archiviazione tecnica o l'accesso utilizzato esclusivamente per scopi statistici anonimi. Senza un mandato di comparizione, un'adesione volontaria da parte del tuo fornitore di servizi Internet o registrazioni aggiuntive da parte di terzi, le informazioni archiviate o recuperate solo per questo scopo di solito non possono essere utilizzate per identificarti.
Marketing
L'archiviazione tecnica o l'accesso sono necessari per creare profili di utenti per inviare pubblicità, o per tracciare l'utente su un sito web o su diversi siti web per scopi di marketing simili.
Gestisci opzioni Gestisci servizi Gestisci {vendor_count} fornitori Per saperne di più su questi scopi
Gestisci opzioni
{title} {title} {title}
×

Inserisci i tuoi dati per scaricare il contenuto:

Torna in alto