Varianza e deviazione standard in MS EXCEL

Gli antipiretici per i bambini sono prescritti da un pediatra. Ma ci sono situazioni di emergenza per la febbre quando il bambino ha bisogno di ricevere immediatamente la medicina. Quindi i genitori si assumono la responsabilità e usano farmaci antipiretici. Cosa è permesso dare ai neonati? Come abbassare la temperatura nei bambini più grandi? Quali farmaci sono i più sicuri?

Insieme allo studio della variazione di un tratto nell'intera popolazione nel suo insieme, è spesso necessario tracciare i cambiamenti quantitativi del tratto nei gruppi in cui è suddivisa la popolazione, nonché tra i gruppi. Questo studio della variazione si ottiene calcolando e analizzando vari tipi di varianza.
Distinguere tra dispersione totale, intergruppo e infragruppo.
Varianza totale σ 2 misura la variazione di un tratto sull'intera popolazione sotto l'influenza di tutti i fattori che hanno causato tale variazione, .

La varianza intergruppo (δ) caratterizza la variazione sistematica, cioè differenze nella grandezza del tratto in studio, che sorgono sotto l'influenza del fattore di tratto alla base del raggruppamento. Si calcola con la formula:
.

Varianza all'interno del gruppo (σ) riflette la variazione casuale, ad es. parte della variazione che si verifica sotto l'influenza di fattori non spiegati e non dipende dal fattore tratto alla base del raggruppamento. Si calcola con la formula:
.

Media delle varianze all'interno del gruppo: .

Esiste una legge che collega 3 tipi di dispersione. La varianza totale è pari alla somma della media delle varianze infragruppo e intergruppo: .
Questo rapporto è chiamato regola dell'addizione della varianza.

Nell'analisi, viene ampiamente utilizzata una misura, che è la proporzione della varianza tra i gruppi nella varianza totale. Porta il nome coefficiente di determinazione empirico (η 2): .
Viene chiamata la radice quadrata del coefficiente di determinazione empirico rapporto di correlazione empirica (η):
.
Caratterizza l'influenza dell'attributo sottostante il raggruppamento sulla variazione dell'attributo risultante. Il rapporto di correlazione empirica varia da 0 a 1.
Mostreremo il suo uso pratico nel seguente esempio (Tabella 1).

Esempio 1. Tabella 1 - Produttività del lavoro di due gruppi di lavoratori di uno dei laboratori di NPO "Cyclone"

Calcolare le medie e le varianze totali e di gruppo:




I dati iniziali per il calcolo della media della dispersione infragruppo e intergruppo sono presentati in Tabella. 2.
Tavolo 2
Calcolo e δ 2 per due gruppi di lavoratori.


Gruppi di lavoratori
Numero di lavoratori, pers. Media, det./turno. Dispersione

Formazione tecnica superata

5 95 42,0

Non tecnicamente preparato

5 81 231,2

Tutti i lavoratori

10 88 185,6
Calcoliamo i punteggi. Media delle varianze all'interno del gruppo:
.
Varianza intergruppo

Varianza totale:
Pertanto, il rapporto di correlazione empirica: .

Insieme alla variazione dei tratti quantitativi, si può osservare anche una variazione dei tratti qualitativi. Questo studio della variazione si ottiene calcolando i seguenti tipi di varianze:

La varianza infragruppo della quota è determinata dalla formula

Dove io– il numero di unità in gruppi separati.
La proporzione del tratto studiato nell'intera popolazione, che è determinata dalla formula:
I tre tipi di dispersione sono correlati tra loro come segue:
.

Questo rapporto di varianze è chiamato teorema di addizione della varianza della condivisione delle caratteristiche.

Dispersionevariabile casuale- una misura della dispersione di un dato variabile casuale, cioè lei deviazioni dall'aspettativa matematica. In statistica, la notazione (sigma al quadrato) è spesso usata per indicare la varianza. Viene chiamata la radice quadrata della varianza deviazione standard o diffusione standard. La deviazione standard viene misurata nelle stesse unità della variabile casuale stessa e la varianza viene misurata nei quadrati di tale unità.

Sebbene sia molto conveniente utilizzare un solo valore (come media o moda e mediana) per stimare l'intero campione, questo approccio può facilmente portare a conclusioni errate. La ragione di questa situazione non risiede nel valore in sé, ma nel fatto che un valore non riflette in alcun modo la diffusione dei valori dei dati.

Ad esempio, nel campione:

la media è 5.

Tuttavia, non esiste alcun elemento nel campione stesso con un valore pari a 5. Potrebbe essere necessario sapere quanto è vicino ogni elemento del campione al suo valore medio. O, in altre parole, devi conoscere la varianza dei valori. Conoscendo la misura in cui i dati sono cambiati, puoi interpretarli meglio valore medio, mediano E moda. Il grado di variazione dei valori del campione è determinato calcolando la loro varianza e deviazione standard.



La varianza e la radice quadrata della varianza, chiamata deviazione standard, caratterizzano la deviazione media dalla media campionaria. Tra queste due quantità, la più importante è deviazione standard. Questo valore può essere rappresentato come la distanza media alla quale si trovano gli elementi dall'elemento centrale del campione.

La dispersione è difficile da interpretare in modo significativo. Tuttavia, la radice quadrata di questo valore è la deviazione standard e si presta bene all'interpretazione.

La deviazione standard viene calcolata determinando prima la varianza e quindi calcolando la radice quadrata della varianza.

Ad esempio, per l'array di dati mostrato in figura, si otterranno i seguenti valori:

Immagine 1

Qui, la media delle differenze quadrate è 717,43. Per ottenere la deviazione standard, resta solo da prendere la radice quadrata di questo numero.

Il risultato sarà di circa 26,78.

Va ricordato che la deviazione standard è interpretata come la distanza media alla quale si trovano gli elementi dalla media campionaria.

La deviazione standard mostra quanto bene la media descrive l'intero campione.

Diciamo che sei il capo del reparto di produzione per l'assemblaggio di un PC. Il rapporto trimestrale afferma che l'output dell'ultimo trimestre è stato di 2500 PC. È cattivo o buono? Hai chiesto (o esiste già questa colonna nel report) di visualizzare la deviazione standard per questi dati nel report. Il numero di deviazione standard, ad esempio, è 2000. Ti diventa chiaro, come capo del reparto, che la linea di produzione necessita di un controllo migliore (deviazioni troppo grandi nel numero di PC da assemblare).

Ricorda che quando la deviazione standard è grande, i dati sono ampiamente sparsi intorno alla media, e quando la deviazione standard è piccola, si raggruppa vicino alla media.

Quattro funzioni statistiche VARP(), VARP(), DEV.ST() e DEV.ST() sono progettate per calcolare la varianza e la deviazione standard dei numeri in un intervallo di celle. Prima di poter calcolare la varianza e la deviazione standard di un set di dati, è necessario determinare se i dati rappresentano la popolazione o un campione della popolazione. Nel caso di un campione della popolazione generale, dovrebbero essere utilizzate le funzioni VARP() e DEV.ST() e, nel caso della popolazione generale, dovrebbero essere utilizzate le funzioni VARP() e DEV.ST():

Popolazione Funzione

VARP()

STDLONG()
Campione

VARI()

DEV.ST()

La varianza (così come la deviazione standard), come abbiamo notato, indica la misura in cui i valori inclusi nel set di dati sono sparsi attorno alla media aritmetica.

Un piccolo valore della varianza o della deviazione standard indica che tutti i dati sono centrati attorno alla media aritmetica e un valore elevato di questi valori indica che i dati sono sparsi su un'ampia gamma di valori.

La varianza è piuttosto difficile da interpretare in modo significativo (cosa significa un valore piccolo, un valore grande?). Prestazione Compiti 3 ti permetterà di mostrare visivamente, su un grafico, il significato della varianza per un set di dati.

Compiti

· Esercizio 1.

· 2.1. Fornisci i concetti: varianza e deviazione standard; la loro designazione simbolica nell'elaborazione dei dati statistici.

· 2.2. Redigere un foglio di lavoro secondo la Figura 1 ed eseguire i calcoli necessari.

· 2.3. Fornisci le formule di base utilizzate nei calcoli

· 2.4. Spiega tutta la notazione ( , , )

· 2.5. Spiegare il significato pratico del concetto di varianza e deviazione standard.

Compito 2.

1.1. Fornisci i concetti: popolazione generale e campione; aspettativa matematica e media aritmetica della loro designazione simbolica nell'elaborazione statistica dei dati.

1.2. In conformità con la Figura 2, redigere un foglio di lavoro ed eseguire calcoli.

1.3. Fornisci le formule di base utilizzate nei calcoli (per la popolazione generale e il campione).

figura 2

1.4. Spiega perché è possibile ottenere tali valori di medie aritmetiche in campioni come 46.43 e 48.78 (vedi file Appendice). Trarre conclusioni.

Compito 3.

Esistono due campioni con un set di dati diverso, ma la media per essi sarà la stessa:

Figura 3

3.1. Redigere un foglio di lavoro secondo la Figura 3 ed eseguire i calcoli necessari.

3.2. Fornisci le formule di calcolo di base.

3.3. Costruisci grafici secondo le figure 4, 5.

3.4. Spiegare le dipendenze risultanti.

3.5. Eseguire calcoli simili per questi due campioni.

Campione iniziale 11119999

Seleziona i valori del secondo campione in modo che la media aritmetica per il secondo campione sia la stessa, ad esempio:

Scegli tu stesso i valori per il secondo campione. Disporre i calcoli e tracciare come le figure 3, 4, 5. Mostrare le formule principali che sono state utilizzate nei calcoli.

Trai le opportune conclusioni.

Tutti i compiti dovrebbero essere presentati sotto forma di un rapporto con tutte le figure, i grafici, le formule e le brevi spiegazioni necessarie.

Nota: la costruzione dei grafici deve essere spiegata con figure e brevi spiegazioni.

Tipi di dispersioni:

Varianza totale caratterizza la variazione del tratto dell'intera popolazione sotto l'influenza di tutti quei fattori che hanno causato questa variazione. Questo valore è determinato dalla formula

dove è la media aritmetica generale dell'intera popolazione studiata.

Varianza media all'interno del gruppo indica una variazione casuale che può verificarsi sotto l'influenza di eventuali fattori non contabilizzati e che non dipende dal fattore caratteristico sottostante il raggruppamento. Questa varianza viene calcolata come segue: prima vengono calcolate le varianze per i singoli gruppi (), quindi viene calcolata la varianza media all'interno del gruppo:

dove n i è il numero di unità nel gruppo

Varianza intergruppo(dispersione delle medie di gruppo) caratterizza la variazione sistematica, cioè differenze nel valore del tratto in esame, che sorgono sotto l'influenza del fattore tratto, che è la base del raggruppamento.

dove è il valore medio per un gruppo separato.

Tutti e tre i tipi di varianza sono interconnessi: la varianza totale è uguale alla somma della varianza infragruppo media e della varianza intergruppo:

Proprietà:

25 Tassi di variazione relativi

Fattore di oscillazione

Deviazione lineare relativa

Il coefficiente di variazione

Coef. Osc. O riflette la fluttuazione relativa dei valori estremi dell'attributo intorno alla media. Rel. lin. spento. caratterizza la quota del valore medio del segno degli scostamenti assoluti dal valore medio. Coef. La variazione è la misura di variazione più comune utilizzata per valutare la tipicità delle medie.

Nelle statistiche, le popolazioni con un coefficiente di variazione superiore al 30-35% sono considerate eterogenee.

    Regolarità delle serie di distribuzione. momenti di distribuzione Indicatori della forma di distribuzione

Nelle serie variazionali esiste una relazione tra frequenze e valori di un attributo variabile: con un aumento dell'attributo, il valore della frequenza prima aumenta fino a un certo limite e poi diminuisce. Tali cambiamenti sono chiamati modelli di distribuzione.

La forma di distribuzione viene studiata utilizzando indicatori di asimmetria e curtosi. Quando si calcolano questi indicatori, vengono utilizzati i momenti di distribuzione.

Il momento del k-esimo ordine è la media dei k-esimi gradi di deviazione delle varianti dei valori degli attributi da un valore costante. L'ordine del momento è determinato dal valore k. Quando analizzano le serie variazionali, si limitano a calcolare i momenti dei primi quattro ordini. Quando si calcolano i momenti, le frequenze o le frequenze possono essere utilizzate come pesi. A seconda della scelta di un valore costante, ci sono momenti iniziali, condizionali e centrali.

Indicatori del modulo di distribuzione:

Asimmetria(As) indicatore che caratterizza il grado di asimmetria distributiva .

Pertanto, con asimmetria negativa (mancino). . Con asimmetria positiva (lato destro). .

I momenti centrali possono essere utilizzati per calcolare l'asimmetria. Poi:

,

dove μ 3 è il momento centrale del terzo ordine.

- curtosi (E A ) caratterizza la pendenza del grafico della funzione rispetto alla distribuzione normale con la stessa forza di variazione:

,

dove μ 4 è il momento centrale del 4° ordine.

    Legge della distribuzione normale

Per una distribuzione normale (distribuzione gaussiana), la funzione di distribuzione ha la seguente forma:

Aspettativa - deviazione standard

La distribuzione normale è simmetrica ed è caratterizzata dalla seguente relazione: Xav=Me=Mo

La curtosi della distribuzione normale è 3 e l'asimmetria è 0.

La curva di distribuzione normale è un poligono (retta simmetrica a forma di campana)

    Tipi di dispersioni. Regola per l'aggiunta di varianze. L'essenza del coefficiente empirico di determinazione.

Se la popolazione iniziale è suddivisa in gruppi secondo alcune caratteristiche essenziali, vengono calcolati i seguenti tipi di dispersioni:

    Varianza totale della popolazione originaria:

dove è il valore medio totale della popolazione originaria; f è la frequenza della popolazione originaria. La varianza totale caratterizza la deviazione dei singoli valori dell'attributo dal valore medio totale della popolazione originaria.

    Scostamenti infragruppo:

dove j è il numero del gruppo; è il valore medio in ciascun j-esimo gruppo; è la frequenza del j-esimo gruppo. Le varianze intragruppo caratterizzano la deviazione del valore individuale di un tratto in ciascun gruppo dalla media del gruppo. Da tutte le dispersioni intragruppo, la media è calcolata con la formula:, dove è il numero di unità in ciascun gruppo j-esimo.

    varianza intergruppo:

La dispersione intergruppo caratterizza la deviazione delle medie di gruppo dalla media totale della popolazione originaria.

Regola dell'addizione della varianzaè che la varianza totale della popolazione originaria dovrebbe essere uguale alla somma dell'intergruppo e alla media delle varianze infragruppo:

Coefficiente empirico di determinazione mostra la proporzione della variazione del tratto studiato, dovuta alla variazione del tratto di raggruppamento, ed è calcolata dalla formula:

    Metodo di riferimento dallo zero condizionale (metodo dei momenti) per il calcolo della media e della varianza

Il calcolo della dispersione con il metodo dei momenti si basa sull'uso della formula e delle proprietà 3 e 4 della dispersione.

(3. Se tutti i valori dell'attributo (opzioni) vengono aumentati (diminuiti) di un numero costante A, la varianza della nuova popolazione non cambierà.

4. Se tutti i valori dell'attributo (opzioni) vengono aumentati (moltiplicati) di K volte, dove K è un numero costante, la varianza della nuova popolazione aumenterà (diminuirà) di K 2 volte.)

Otteniamo la formula per calcolare la varianza in serie variazionali con intervalli uguali con il metodo dei momenti:

A - zero condizionale, uguale all'opzione con la frequenza massima (metà dell'intervallo con la frequenza massima)

Anche il calcolo della media con il metodo dei momenti si basa sull'uso delle proprietà della media.

    Il concetto di osservazione selettiva. Fasi dello studio dei fenomeni economici con metodo selettivo

Un campione è un'osservazione in cui non tutte le unità della popolazione iniziale sono sottoposte ad esame e studio, ma solo una parte delle unità, mentre il risultato dell'esame di una parte della popolazione si estende all'intera popolazione originaria. L'insieme da cui viene chiamata la selezione delle unità per ulteriori esami e studi generale e vengono chiamati tutti gli indicatori che caratterizzano questo insieme generale.

Vengono chiamati i possibili limiti di deviazione della media campionaria dalla media generale errore di campionamento.

Viene chiamato l'insieme delle unità selezionate selettivo e vengono chiamati tutti gli indicatori che caratterizzano questo insieme selettivo.

La ricerca selettiva comprende le seguenti fasi:

Caratteristiche dell'oggetto di studio (fenomeni economici di massa). Se la popolazione generale è piccola, il campionamento non è raccomandato, è necessario uno studio continuo;

Calcolo della dimensione del campione. È importante determinare il volume ottimale che consentirà, al minor costo, di ottenere un errore di campionamento entro il range accettabile;

Effettuare la selezione delle unità di osservazione, tenendo conto dei requisiti di casualità, proporzionalità.

Prove di rappresentatività basate su una stima dell'errore di campionamento. Per un campione casuale, l'errore viene calcolato utilizzando formule. Per il campione target, la rappresentatività è valutata utilizzando metodi qualitativi (confronto, esperimento);

Analisi del campione. Se il campione formato soddisfa i requisiti di rappresentatività, viene analizzato utilizzando indicatori analitici (media, relativa, ecc.)

Dispersione nelle statistiche si trova come valori individuali della funzione nel quadrato di . A seconda dei dati iniziali, è determinato dalle formule di varianza semplice e ponderata:

1. (per i dati non raggruppati) è calcolato con la formula:

2. Varianza ponderata (per una serie di variazioni):

dove n è la frequenza (fattore di ripetibilità X)

Un esempio di trovare la varianza

Questa pagina descrive un esempio standard di ricerca della varianza, puoi anche esaminare altre attività per trovarla

Esempio 1. Abbiamo i seguenti dati per un gruppo di 20 studenti per corrispondenza. È necessario costruire una serie di intervalli della distribuzione delle caratteristiche, calcolare il valore medio della caratteristica e studiarne la varianza

Costruiamo un raggruppamento di intervalli. Determiniamo l'intervallo dell'intervallo con la formula:

dove X max è il valore massimo della caratteristica di raggruppamento;
X min è il valore minimo della caratteristica di raggruppamento;
n è il numero di intervalli:

Accettiamo n=5. Il passo è: h \u003d (192 - 159) / 5 \u003d 6.6

Facciamo un raggruppamento di intervalli

Per ulteriori calcoli, costruiremo una tabella ausiliaria:

X'i è la metà dell'intervallo. (ad esempio, la metà dell'intervallo 159 - 165,6 = 162,3)

La crescita media degli studenti è determinata dalla formula della media ponderata aritmetica:

Determiniamo la dispersione con la formula:

La formula della varianza può essere convertita come segue:

Da questa formula segue che la varianza è la differenza tra la media dei quadrati delle opzioni e il quadrato e la media.

Varianza in serie di variazioni con intervalli uguali secondo il metodo dei momenti può essere calcolato nel modo seguente utilizzando la seconda proprietà di dispersione (dividendo tutte le opzioni per il valore dell'intervallo). Definizione di varianza, calcolato con il metodo dei momenti, secondo la seguente formula richiede meno tempo:

dove i è il valore dell'intervallo;
A - zero condizionale, che è conveniente usare la metà dell'intervallo con la frequenza più alta;
m1 è il quadrato del momento del primo ordine;
m2 - momento del secondo ordine

(se nella popolazione statistica l'attributo cambia in modo tale che ci siano solo due opzioni che si escludono a vicenda, allora tale variabilità è chiamata alternativa) può essere calcolata con la formula:

Sostituendo in questa formula di dispersione q = 1- p, otteniamo:

Tipi di dispersione

Varianza totale misura la variazione di un tratto sull'intera popolazione nel suo insieme sotto l'influenza di tutti i fattori che causano questa variazione. È uguale al quadrato medio degli scostamenti dei singoli valori dell'attributo x dal valore medio totale x e può essere definito come varianza semplice o varianza ponderata.

caratterizza la variazione casuale, cioè parte della variazione, che è dovuta all'influenza di fattori non spiegati e non dipende dal fattore di segno sottostante il raggruppamento. Tale varianza è pari al quadrato medio degli scostamenti dei singoli valori dell'attributo all'interno del gruppo X dalla media aritmetica del gruppo e può essere calcolata come varianza semplice o come varianza ponderata.

Così, misure di varianza all'interno del gruppo variazione di un tratto all'interno di un gruppo ed è determinata dalla formula:

dove xi è la media del gruppo;
ni è il numero di unità nel gruppo.

Ad esempio, le varianze intragruppo che devono essere determinate nel compito di studiare l'effetto delle qualifiche dei lavoratori sul livello di produttività del lavoro in un negozio mostrano variazioni nella produzione in ciascun gruppo causate da tutti i possibili fattori (condizioni tecniche delle attrezzature, disponibilità di strumenti e materiali, età dei lavoratori, intensità di manodopera, ecc. .), salvo differenze di categoria di qualifica (all'interno del gruppo tutti i lavoratori hanno la stessa qualifica).

La media delle varianze all'interno del gruppo riflette il casuale, cioè quella parte della variazione che si è verificata sotto l'influenza di tutti gli altri fattori, ad eccezione del fattore di raggruppamento. Si calcola con la formula:

Caratterizza la variazione sistematica del tratto risultante, che è dovuta all'influenza del fattore tratto sottostante al raggruppamento. È uguale al quadrato medio delle deviazioni delle medie di gruppo dalla media complessiva. La varianza intergruppo è calcolata dalla formula:

Regola dell'addizione della varianza in statistica

Secondo regola dell'addizione della varianza la varianza totale è pari alla somma della media delle varianze infragruppo e intergruppo:

Il significato di questa regolaè che la varianza totale che si verifica sotto l'influenza di tutti i fattori è uguale alla somma delle varianze che si verificano sotto l'influenza di tutti gli altri fattori e la varianza che si verifica a causa del fattore di raggruppamento.

Usando la formula per sommare le varianze, è possibile determinare la terza incognita da due varianze note, e anche giudicare la forza dell'influenza dell'attributo di raggruppamento.

Proprietà di dispersione

1. Se tutti i valori dell'attributo vengono ridotti (aumentati) dello stesso valore costante, la varianza non cambierà da questo.
2. Se tutti i valori dell'attributo vengono ridotti (aumentati) dello stesso numero di volte n, allora la varianza diminuirà (aumenterà) di conseguenza di n^2 volte.

L'aspettativa matematica e la varianza sono le caratteristiche numeriche più comunemente usate di una variabile casuale. Caratterizzano le caratteristiche più importanti della distribuzione: la sua posizione e il grado di dispersione. In molti problemi pratici, una descrizione completa ed esauriente di una variabile casuale - la legge di distribuzione - non può essere ottenuta affatto o non è affatto necessaria. In questi casi, si limitano a una descrizione approssimativa di una variabile casuale utilizzando caratteristiche numeriche.

L'aspettativa matematica è spesso indicata semplicemente come il valore medio di una variabile casuale. La dispersione di una variabile casuale è una caratteristica della dispersione, dispersione di una variabile casuale attorno alla sua aspettativa matematica.

Aspettativa matematica di una variabile aleatoria discreta

Affrontiamo il concetto di aspettativa matematica, procedendo prima dall'interpretazione meccanica della distribuzione di una variabile aleatoria discreta. Lascia che la massa unitaria sia distribuita tra i punti dell'asse x X1 , X 2 , ..., X N, e ogni punto materiale ha una massa corrispondente ad esso da P1 , P 2 , ..., P N. È necessario scegliere un punto sull'asse x, che caratterizza la posizione dell'intero sistema di punti materiali, tenendo conto delle loro masse. È naturale prendere come tale il centro di massa del sistema dei punti materiali. Questa è la media ponderata della variabile casuale X, in cui l'ascissa di ogni punto Xio entra con un "peso" pari alla probabilità corrispondente. Il valore medio della variabile casuale così ottenuta Xè chiamata la sua aspettativa matematica.

L'aspettativa matematica di una variabile casuale discreta è la somma dei prodotti di tutti i suoi possibili valori e le probabilità di questi valori:

Esempio 1È stata organizzata una lotteria vincente. Ci sono 1000 vincite, 400 delle quali sono 10 rubli ciascuna. 300 - 20 rubli ciascuno 200 - 100 rubli ciascuno. e 100-200 rubli ciascuno. Qual è la vincita media per una persona che acquista un biglietto?

Soluzione. Troveremo la vincita media se l'importo totale delle vincite, pari a 10*400 + 20*300 + 100*200 + 200*100 = 50.000 rubli, viene diviso per 1000 (l'importo totale delle vincite). Quindi otteniamo 50000/1000 = 50 rubli. Ma l'espressione per il calcolo del guadagno medio può essere rappresentata anche nella seguente forma:

In queste condizioni, invece, l'ammontare della vincita è una variabile casuale che può assumere i valori di 10, 20, 100 e 200 rubli. con probabilità pari a 0,4, rispettivamente; 0,3; 0,2; 0.1. Pertanto, il payoff medio atteso è pari alla somma dei prodotti dell'entità dei payoff e della probabilità di riceverli.

Esempio 2 L'editore ha deciso di pubblicare un nuovo libro. Venderà il libro per 280 rubli, di cui 200 gli saranno dati, 50 alla libreria e 30 all'autore. La tabella fornisce informazioni sul costo di pubblicazione di un libro e sulla probabilità di vendere un certo numero di copie del libro.

Trova il profitto atteso dell'editore.

Soluzione. La variabile aleatoria "profitto" è pari alla differenza tra il ricavo della vendita e il costo delle spese. Ad esempio, se vengono vendute 500 copie di un libro, il reddito derivante dalla vendita è 200 * 500 = 100.000 e il costo della pubblicazione è di 225.000 rubli. Pertanto, l'editore deve affrontare una perdita di 125.000 rubli. La tabella seguente riassume i valori attesi della variabile casuale - profitto:

NumeroProfitto Xio Probabilità Pio Xio P io
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Totale: 1,00 25000

Pertanto, otteniamo l'aspettativa matematica del profitto dell'editore:

.

Esempio 3 Possibilità di colpire con un solo colpo P= 0,2. Determina il consumo di proiettili che forniscono l'aspettativa matematica del numero di colpi pari a 5.

Soluzione. Dalla stessa formula di aspettativa che abbiamo usato finora, esprimiamo X- consumo di conchiglie:

.

Esempio 4 Determinare l'aspettativa matematica di una variabile casuale X numero di colpi con tre colpi, se la probabilità di colpire con ogni colpo P = 0,4 .

Suggerimento: trova la probabilità dei valori di una variabile casuale per Formula di Bernoulli .

Proprietà di aspettativa

Considera le proprietà dell'aspettativa matematica.

Proprietà 1. L'aspettativa matematica di un valore costante è uguale a questa costante:

Proprietà 2. Il fattore costante può essere tolto dal segno di aspettativa:

Proprietà 3. L'aspettativa matematica della somma (differenza) di variabili casuali è uguale alla somma (differenza) delle loro aspettative matematiche:

Proprietà 4. L'aspettativa matematica del prodotto di variabili casuali è uguale al prodotto delle loro aspettative matematiche:

Proprietà 5. Se tutti i valori della variabile casuale X diminuire (aumentare) dello stesso numero CON, quindi la sua aspettativa matematica diminuirà (aumenterà) dello stesso numero:

Quando non puoi essere limitato solo all'aspettativa matematica

Nella maggior parte dei casi, solo l'aspettativa matematica non può caratterizzare adeguatamente una variabile casuale.

Lasciate variabili casuali X E Y sono date dalle seguenti leggi di distribuzione:

Senso X Probabilità
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Senso Y Probabilità
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Le aspettative matematiche di queste quantità sono le stesse - pari a zero:

Tuttavia, la loro distribuzione è diversa. Valore casuale X può assumere solo valori poco diversi dall'aspettativa matematica e dalla variabile casuale Y può assumere valori che si discostano significativamente dall'aspettativa matematica. Un esempio simile: il salario medio non consente di giudicare la proporzione di lavoratori ad alta e bassa retribuzione. In altre parole, dall'aspettativa matematica non si può giudicare quali deviazioni da essa, almeno in media, siano possibili. Per fare ciò, devi trovare la varianza di una variabile casuale.

Dispersione di una variabile aleatoria discreta

dispersione variabile casuale discreta Xè chiamato l'aspettativa matematica del quadrato della sua deviazione dall'aspettativa matematica:

La deviazione standard di una variabile casuale Xè il valore aritmetico della radice quadrata della sua varianza:

.

Esempio 5 Calcola varianze e deviazioni standard di variabili casuali X E Y, le cui leggi di distribuzione sono riportate nelle tabelle precedenti.

Soluzione. Aspettative matematiche di variabili aleatorie X E Y, come trovato sopra, sono uguali a zero. Secondo la formula di dispersione per E(X)=E(si)=0 otteniamo:

Quindi le deviazioni standard delle variabili casuali X E Y costituire

.

Quindi, con le stesse aspettative matematiche, la varianza della variabile casuale X molto piccolo e casuale Y- significativo. Questa è una conseguenza della differenza nella loro distribuzione.

Esempio 6 L'investitore ha 4 progetti di investimento alternativi. La tabella riassume i dati sul profitto atteso in questi progetti con la relativa probabilità.

Progetto 1Progetto 2Progetto 3Progetto 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Trova per ogni alternativa l'aspettativa matematica, la varianza e la deviazione standard.

Soluzione. Mostriamo come queste quantità sono calcolate per la 3a alternativa:

La tabella riassume i valori trovati per tutte le alternative.

Tutte le alternative hanno la stessa aspettativa matematica. Ciò significa che alla lunga tutti hanno lo stesso reddito. La deviazione standard può essere interpretata come una misura del rischio: più è grande, maggiore è il rischio dell'investimento. Un investitore che non vuole molto rischio sceglierà il progetto 1 perché ha la deviazione standard più piccola (0). Se l'investitore preferisce il rischio e rendimenti elevati in un breve periodo, sceglierà il progetto con la deviazione standard maggiore - progetto 4.

Proprietà di dispersione

Presentiamo le proprietà della dispersione.

Proprietà 1. La dispersione di un valore costante è zero:

Proprietà 2. Il fattore costante può essere tolto dal segno di dispersione elevandolo al quadrato:

.

Proprietà 3. La varianza di una variabile aleatoria è pari all'aspettativa matematica del quadrato di tale valore, da cui viene sottratto il quadrato dell'aspettativa matematica del valore stesso:

,

Dove .

Proprietà 4. La varianza della somma (differenza) delle variabili casuali è uguale alla somma (differenza) delle loro varianze:

Esempio 7È noto che una variabile casuale discreta X assume solo due valori: −3 e 7. Inoltre, l'aspettativa matematica è nota: E(X) = 4 . Trova la varianza di una variabile casuale discreta.

Soluzione. Denotare con P la probabilità con cui una variabile casuale assume un valore X1 = −3 . Quindi la probabilità del valore X2 = 7 sarà 1 − P. Deriviamo l'equazione per l'aspettativa matematica:

E(X) = X 1 P + X 2 (1 − P) = −3P + 7(1 − P) = 4 ,

dove otteniamo le probabilità: P= 0,3 e 1 − P = 0,7 .

La legge di distribuzione di una variabile casuale:

X −3 7
P 0,3 0,7

Calcoliamo la varianza di questa variabile casuale usando la formula dalla proprietà 3 della varianza:

D(X) = 2,7 + 34,3 − 16 = 21 .

Trova tu stesso l'aspettativa matematica di una variabile casuale e poi vedi la soluzione

Esempio 8 Variabile casuale discreta X assume solo due valori. Prende il valore maggiore di 3 con una probabilità di 0,4. Inoltre, la varianza della variabile casuale è nota D(X) = 6 . Trova l'aspettativa matematica di una variabile casuale.

Esempio 9 Un'urna contiene 6 palline bianche e 4 nere. 3 palline vengono prese dall'urna. Il numero di palline bianche tra le palline estratte è una variabile casuale discreta X. Trova l'aspettativa matematica e la varianza di questa variabile casuale.

Soluzione. Valore casuale X può assumere i valori 0, 1, 2, 3. Le probabilità corrispondenti possono essere calcolate da regola della moltiplicazione delle probabilità. La legge di distribuzione di una variabile casuale:

X 0 1 2 3
P 1/30 3/10 1/2 1/6

Da qui l'aspettativa matematica di questa variabile casuale:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

La varianza di una data variabile casuale è:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Aspettativa matematica e dispersione di una variabile aleatoria continua

Per una variabile casuale continua, l'interpretazione meccanica dell'aspettativa matematica manterrà lo stesso significato: il centro di massa per una massa unitaria distribuita continuamente sull'asse x con densità F(X). A differenza di una variabile casuale discreta, per la quale l'argomento della funzione Xio cambia bruscamente, per una variabile casuale continua, l'argomento cambia continuamente. Ma l'aspettativa matematica di una variabile casuale continua è anche correlata al suo valore medio.

Per trovare l'aspettativa matematica e la varianza di una variabile casuale continua, è necessario trovare integrali definiti . Se viene data una funzione di densità di una variabile casuale continua, allora entra direttamente nell'integranda. Se viene data una funzione di distribuzione di probabilità, differenziandola, devi trovare la funzione di densità.

La media aritmetica di tutti i possibili valori di una variabile casuale continua è chiamata sua aspettativa matematica, denotato da o .

Sostieni il progetto - condividi il link, grazie!
Leggi anche
Pillole per l'interruzione precoce della gravidanza senza prescrizioni: un elenco con i prezzi Quali pillole si liberano della gravidanza Pillole per l'interruzione precoce della gravidanza senza prescrizioni: un elenco con i prezzi Quali pillole si liberano della gravidanza Geniali invenzioni dei fratelli Wright Geniali invenzioni dei fratelli Wright Passaggio di STALKER Folk hodgepodge: una guida a missioni e cache Passaggio di STALKER Folk hodgepodge: una guida a missioni e cache