Estadística descriptiva unidimensional (2)

Paràmetres estadístics de centralització i posició
Si la variable que estudiem és qualitativa, la distribució de freqüències ja ens dóna un resum precís i complet de la mostra, però si la variable és quantitativa podem complementar aquest resum amb unes mesures descriptives numèriques extretes de les dades.[br][br][list][*][b]Mitjana aritmètica[/b]: És el promig aritmètic de les observacions. És la mesura de centralització més important.[/*][/list][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Cbar%7Bx%7D%3D%5Cfrac1n%20%5Csum%20_%7Bi%3D1%7D%5E%7Bk%7Dn_i%5Ccdot%20x_i%20%3D%5Csum_%7Bi%3D1%7D%5E%7Bk%7D%20f_i%5Ccdot%20x_i[/img][/center]En el cas de dades agrupades en intervals de classe emprarem les marques de classe. [br][color=#ff0000]Això es mereix una petita reflexió![/color][br][br]És evident que si ja tenim totes les dades entrades a l'ordinador o a la calculadora, el millor és calcular la mitjana i la resta de paràmetres a partir dels valors originals; ara bé, si només tenim els intervals de classe i les freqüències aleshores prendrem la marca de classe com a valor representatiu de la variable en aquell interval per tal de fer els càlculs de paràmetres.[br][br]En l’exemple 1 de [url=https://www.geogebra.org/m/FhbanbJk]https://www.geogebra.org/m/FhbanbJk[/url] : [br][br][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Cbar%7Bx%7D%3D0%5Ccdot0.1+1%5Ccdot0.33+2%5Ccdot0.29+3%5Ccdot0.13+4%5Ccdot0.09+5%5Ccdot0.04+6%5Ccdot0.03%3D2.01%5Ctext%7B%20fills%7D[/img]
En l’exemple 2 de [url=https://www.geogebra.org/m/FhbanbJk]https://www.geogebra.org/m/FhbanbJk[/url] :[br][br][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Cbar%7Bx%7D%3D54.5%5Ccdot%200.05+59.5%5Ccdot0.15+64.5%5Ccdot0.3+69.5%5Ccdot0.25+74.5%5Ccdot0.15+79.5%5Ccdot0.1%20%5C%5C%20%5Chspace*%7B0.8cm%7D%20%3D67.5%20%5C%20%5Ceuro[/img][br][br][color=#0000ff]Nota: Si haguéssim calculat la mitjana a partir del 40 valors de preus d'hotel haguéssim obtingut una mitjana de 67.025 €[/color]
Exercici 09
a) Què li succeeix a la mitjana aritmètica si a tots els valors d'una variable li sumem una mateixa constant?[br][br]
b) Què li succeeix a la mitjana aritmètica si multipliquem tots els valors d'una variable per una mateixa constant?
c) Si definim la variable y[sub]i [/sub]= a + b · x[sub]i[/sub] , quina serà la mitjana aritmètica de Y?
d) Si a cadascun del valors li restem la mitjana, quant valdrà la suma de tots ells? És a dir, [br] [img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Csum_%7Bi%3D1%7D%5E%7Bk%7D%5Cleft%28%20x_i%20-%20%5Cbar%7Bx%7D%20%5Cright%20%29%20%5C%20%3F[/img]
[list][*][b]Mediana[/b]: S'obté ordenant tots els valors de menor a major. La mediana és el valor que ocupa el lloc central; és a dir, aquell que deixa la meitat de les observacions a banda i banda. [/*][/list][br]En l'exemple 1, mirant la taula de freqüències veiem que les observacions 35 i 36, un cop ordenades, tenen 2 fills. Només cal fixar-se en la columna de freqüències absolutes acumulades ( N[sub]2[/sub] = 30 i N[sub]3[/sub] = 50 ). Això vol dir que les 30 famílies que menys fills tenen, com a molt tenen 1 fill; i que per tant, les família 35 i 36, que serien les que ocuparien valors centrals, tenen 2 fills. Així doncs, la mediana és Me = 2 fills.[br][br]En l'exemple 2, mirant la taula de freqüències tenim que l'hotel que ocupa la posició 20 té una marca de classe de 64.5 € i el que ocupa la posició 21 té una marca de classe de 69.5 €. Així doncs, la mediana es troba fent el promig dels dos valors: Me = 67 €[br][br][list][*][b]Moda[/b]: És el valor que té una freqüència més gran. En cas de dades agrupades en intervals, es busca l'interval modal i la seva marca de classe seria la moda.[/*][/list][br]En l'exemple 1: Mo = 1 fill[br][br]En l'exemple 2: L'interval modal és [62, 67) € i la moda Mo = 69,5 €.[br][br][list][*][b]Percentils[/b]: El percentil p-èssim és el valor que indica que el p % de les dades són menors o iguals a ell. [/*][/list][br]Els percentils 25, 50 i 75 reben el nom de[b] primer quartil (Q[sub]1[/sub])[/b], [b]segon quartil o mediana (Q[sub]2 [/sub]o Me) i tercer quartil (Q[sub]3[/sub])[/b]. [br][br]En l'exemple 1:  Q[sub]1[/sub] = 1 fill   Q[sub]2[/sub] = 2 fills   Q[sub]3[/sub] = 3 fills    p[sub]95[/sub] = 4 fills[br][br]En l'exemple 2:  Q[sub]1[/sub] =  64.5 €  Q[sub]2[/sub] = 67 €   Q[sub]3 [/sub]= 72 € 
Activitat 10: Treballem els paràmetres de centralització
Arrossega les observacions a la zona blava fent que prenguin valors.[br]Situa les 10 creuetes i activa els botons de mitjana, mediana i moda[br][br]a) Fes vàries distribucions de les dades de manera que els tres paràmetres valguin el mateix. Observes alguna propietat/patró en totes aquestes distribucions?[br][br]b) Amb una de les distribucions anteriors agafa una observació i mou-la passant per tot el rang de valors. Fixa't com canvien els valors del tres paràmetres (mitjana, mediana i moda). Quin d'ells creus que és el més sensible a valors extrems?[br][br]c) Creus que la mitjana aritmètica pot representar bé els valors que pren una variable? Raona la teva resposta.[br][br]d) Si en una mostra la mitjana està molt separada de la mediana, què pots dir sobre la distribució de les observacions?
Estimació de la mitjana i la mediana
Cada vegada que premeu el botó corresponent, teniu el gràfic d'una nova distribució de dades. Trieu quin paràmetre voleu estimar i desplaceu el punt que apareix a la part inferior.
Un document sobre mitjana i mediana per a reflexionar
Paràmetres estadístics de dispersió
Les [b]mesures de dispersió[/b] ens permeten conèixer com d'agrupades es troben les dades al voltant de les mesures de centralització.[br][br]La [b]desviació d'una dada[/b], [img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20x_i[/img] , és la seva distància respecte de la la mitjana: [img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Cleft%7C%20x_i-%5Cbar%7Bx%7D%20%5Cright%7C[/img][br][br][list][*][b]Rang o recorregut[/b]: és la diferència entre el valor màxim i el mínim dels observats.[br][br][/*][*][b]Desviació mitjana[/b]: és el promig de totes les desviacions observades:[br][/*][/list][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20DM%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bk%7Dn_i%5Ccdot%5Cleft%7Cx_i-%5Cbar%7Bx%7D%5Cright%7C[/img] [br][/center][list][*][b]Variància[/b]: és la mitjana dels quadrats de les desviacions.[br][/*][/list][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Csigma%5E2%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bk%7Dn_i%5Ccdot%5Cleft%28x_i-%5Cbar%7Bx%7D%20%5Cright%20%29%5E2%3D%5Csum_%7Bi%3D1%7D%5E%7Bk%7Df_i%5Ccdot%5Cleft%28x_i-%5Cbar%7Bx%7D%20%5Cright%20%29%5E2%3D%5Cleft%28%5Csum_%7Bi%3D1%7D%5E%7Bk%7Df_i%5Ccdot%20x_i%20%5E2%5Cright%29-%5Cbar%7Bx%7D[/img][br][/center][list][*][b]Desviació típica o standard[/b]: és l'arrel quadrada de la variància.[/*][/list][br][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Csigma%3D%5Csqrt%7B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bk%7Dn_i%5Ccdot%5Cleft%28x_i-%5Cbar%7Bx%7D%5Cright%29%5E2%7D[/img] [/center][list][*][b]Coeficient de variació[/b]: és el quocient entre la desviació típica i la mitjana. En general s'expressa en forma de tant per ú o percentatge. És la dispersió relativa.[br][br][/*][/list][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20CV%3D%5Cfrac%7B%5Csigma%7D%7B%5Cbar%7Bx%7D%7D[/img][/center]Calculem les diferents mesures de dispersió amb el full de càlcul de GeoGebra.[br]En l’exemple 1 de [url=https://www.geogebra.org/m/FhbanbJk]https://www.geogebra.org/m/FhbanbJk[/url] :
Exemple 3
Un equip de waterpolo necessita fitxar un lateral golejador. S'han seleccionat dos jugadors que, en els últims 10 partits, han marcat la següent quantitat de gols. A qui escolliries?[br][br][table][tr][td]Jugador A[br][/td][td] 8[/td][td] 6[/td][td] 6[/td][td] 4 [/td][td] 6 [/td][td] 7 [/td][td] 7 [/td][td] 5 [/td][td] 5 [/td][td] 6 [/td][/tr][tr][td]Jugador B[/td][td]10 [/td][td] 2 [/td][td] 9 [/td][td] 5[/td][td] 6[/td][td] 3[/td][td] 6[/td][td] 4[/td][td] 7[/td][td] 8[br][/td] [/tr][/table][br]Si fem un diagrama de freqüències (barres) de les dades i calculem els paràmetres de centralització observem que tots dos jugadors tenen la mateixa mitjana, mediana i moda, 6 gols, però per contra, els seus[br]diagrames de freqüència són diferents. El jugador A té menys dispersió en les seves dades que el jugador B. 
[b]Les mesures de dispersió ens diuen com s'agrupen les dades al voltant de la mitjana.[/b]
Activitat 11
[list=1][*]Calcula la desviació típica per al dos jugadors i explica, raonadament, amb quin dels dos jugadors et quedaries.[br][/*][*]Si els dos jugadors haguessin tingut una mitjana de gols diferent hagués estat convenient emprar el coeficient de variació; sabries raonar per què? [/*][/list]
Close

Information: Estadística descriptiva unidimensional (2)