Una [b]variable estadística bidimensional[/b] resulta quan estudiem dues característiques diferents dels individus d'una població.[br][br]Per exemple: Estudiem el pes (X) i l'alçada (Y) dels alumnes d'una classe.[br][br]La variable bidimensional és (X,Y).[br]X i Y són variables estadístiques unidimensionals.
A 20 alumnes de batxillerat se'ls va demanar la qualificació final de matemàtiques (X) i física (Y). Els resultats van ser els següents: [br](X,Y)={(4,3), (5,6), (6,7), (7,7), (7,8), (8,8), (7,6), (8,7), (7,5), (2,3), (4,5), (6,4), (6,5), (5,3), (3,4), (4,5), (5,4), (6,5), (9,7), (3,3)}[br][br]Per organitzar les dades emprarem una [b]taula de doble entrada[/b], on introduirem els diferents valors observats per cadascuna de les dues variables unidimensionals, i les freqüències absolutes en cada cas.
Respon les següents preguntes, tot explicant com obtens els resultats:[br][list=1][*]Quants alumnes va obtenir com a mínim un 7 de matemàtiques?[br][/*][*]Quants alumnes van treure una nota superior a 5 en física?[br][/*][*]Quin tant per cent dels alumnes van treure una nota superior a física que en matemàtiques?[br][/*][*]Quin tant per cent del alumnes tenen la mateixa nota de física que de matemàtiques?[/*][/list]
Les [b]taules de freqüències marginals[/b] són les que s'obtenen d'estudiar cadascuna de les variables unidimensionals per separat.[br][br]La [b]covariància[/b] d'una variable bidimensional, [math]\sigma_{XY}[/math], és una mesura de dispersió conjunta.[br][br][center][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Csigma_%7BXY%7D%3D%5Cfrac%7B1%7D%7Bn%7D%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20%5Cleft%28x_i%20-%20%5Cbar%7Bx%7D%20%5Cright%29%20%5Ccdot%20%5Cleft%28y_i%20-%20%5Cbar%7By%7D%20%5Cright%29%3D%20%5Cfrac%201%20n%5Csum_%7Bi%3D1%7D%5E%7Bp%7D%5Csum_%7Bj%3D1%7D%5E%7Bq%7D%20n_%7Bij%7D%5C%20x_i%5Ccdot%20y_j-%5Cbar%7Bx%7D%5Cbar%7By%7D[/img][/center]En el cas de l'exemple anterior,[br][br][img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Cbar%7Bx%7D%3D5.6%5Ctext%7B%20i%20%7D%5Cbar%7By%7D%3D5.3[/img][br][br] [img]https://latex.codecogs.com/png.latex?%5Cdpi%7B120%7D%20%5Csigma_%7BXY%7D%3D%5Cfrac%7B1%7D%7B20%7D%5Cleft%281%5Ccdot2%5Ccdot3+1%5Ccdot3%5E2+1%5Ccdot3%5Ccdot4+1%5Ccdot4%5Ccdot3+2%5Ccdot4%5Ccdot5+%5Cldots+1%5Ccdot9%5Ccdot7%20%5Cright%20%29-%5Cnewline%20%5Chspace*%7B1.5cm%7D%20%5C%20%5C%20-5.6%5Ccdot5.25%3D%5Cfrac%7B1%7D%7B20%7D%5Cleft%28635%5Cright%20%29-5.6%5Ccdot5.25%3D2.35[/img]
En una classe amb 30 alumnes s'ha estudiat el nombre d'hores diàries d'estudi, X, i el nombre de matèries no superades, obtenint els següents resultats:[br](2, 1) (0, 7) (1, 2) (3, 0) (3, 1) (1, 1) (1, 2) (2, 0) (3, 1) (3, 0) (2, 7) (1, 0) (2, 1) (1, 1) (3, 1) [br](1, 4) (1, 2) (2, 1) (3, 1) (1, 4) (1, 2) (2, 1) (2, 0) (3, 1) (2, 2) (1, 0) (1, 2) (2, 1) (0, 6) (2, 0)[br][br][list=1][*]Construeix una taula de doble entrada i les taules de freqüències marginals corresponents[br][br][/*][*][color=#0000ff]Anomenem Y / X=1 a la variable Y condicionada a que X=1[br][/color][color=#0000ff]Anomenem X / Y=3 a la variable X condicionada a que Y=3[/color][br]Construeix les taules condicionades de Y / X=1 i X / Y=3[/*][/list]
Aquest és el nom que rep el gràfic que resulta de representar les dades de la variable bidimensional sobre uns eixos de coordenades.
A partir del següent diagrama de dispersió, construeix la taula de doble entrada i calcula la covariància.[br]Tingues en compte que entre parèntesis s'indica la freqüència de les dades.[br][br][img]https://puntsingular.files.wordpress.com/2016/09/lssg_diagrama_de_punts-e1473524069834.png[/img]
Es parla de [b]dependència funcional o relació estadística en variables quantitatives[/b] quan el núvol de punts de la distribució bivariant tendeix a aproximar-se a la representació gràfica d'una funció. [br][br]Si el núvol de punts té una forma dispersa i més aviat circular, o sense forma determinada, ens indica que no hi ha dependència, que els valors d'una variable no estàn relacionats, o no influeixen, en els de l'altra variable. En aquest cas es diu que les variables són independents.[br][br][img]https://puntsingular.files.wordpress.com/2016/09/nuvol_01-e1473526943124.png[/img][br][br]La dependència pot ser:[br][br]a) Exacta, forta o feble.[br]b) Lineal o curvilínea (complexa)[br]c) La dependència lineal pot ser directa (positiva) o indirecta (negativa).[br][br][size=85][right][Extret de l'INS Eugeni d'Ors][/right][/size]En el següent gràfic tenim dues dependències lineals positives. La primera, forta i l'altra feble. [br][br][img]https://puntsingular.files.wordpress.com/2016/09/nuvol_02-e1473527071238.png[/img][img]https://puntsingular.files.wordpress.com/2016/09/nuvol_03-e1473527243463.png[/img][br][br]Tanmateix, aquestes serien dues dependències lineals negatives.[br][br][img]https://puntsingular.files.wordpress.com/2016/09/nuvol_04-e1473527404267.png[/img][img]https://puntsingular.files.wordpress.com/2016/09/nuvol_05-e1473527428677.png[/img]
En el següent applet de GeoGebra hem introduït els valors recollits de la variable X i Y.[br]Hem representat el núvol de punts i observem que hi ha una dependència lineal negativa dèbil.
Modifica els valors de la variable Y de la taula anterior posant els següents:[br]4 2 3 0 2 4 1 [br]i analitza'n la dependència entre X i Y.
[b]Com es pot estudiar la dependència en variables categòriques o qualitatives?[/b][br][br]Dues variables qualitatives són independents si cada taula de freqüències condicionada és proporcional a la seva taula de freqüències marginal.[br][br]Veiem un [b]exemple[/b]:[br][br]Volem estudiar si el gènere (X) influeix a l'hora d'estudiar batxillerat científic-tecnològic o social-humanístic (Y).[br][br]Tenim la següent taula de doble entrada:[br][br][table][tr][td]Y \ X[/td][td]Home[/td][td]Dona[/td][td]Total[/td][/tr][tr][td]Científico - Tecnològic[/td][td] 42[/td][td] 63[/td][td] 105[/td][/tr][tr][td]Social - Humanístic[/td][td] 78[/td][td] 117[/td][td] 195[/td][/tr][tr][td]Total[/td][td] 120[/td][td] 180[/td][td] 300[/td][/tr][/table][br][color=#0000ff]Les taules de freqüències marginals són:[br][/color][br][table][tr][td] [b] X[/b][/td][td] [b]n[sub]i[/sub][/b][/td][td] [/td][td] [b] Y[/b][/td][td] [b]n[sub]i[/sub][/b] [/td][/tr][br][tr][td]Home[/td][td]120[/td][td][/td][td]Científico - Tecnològic[/td][td] 105[/td][/tr][br][tr][td]Dona[/td][td]180[/td][td][/td][td]Social - Humanístic[/td][td] 195[/td][/tr][br][tr][td][/td][td]300[/td][td][/td][td][/td][td] 300[/td][/tr][/table][br][color=#0000ff]Les taules de freqüències condicionades són:[/color][br][br][table][tr][td][b]X / Y=Científico - Tecnològic[/b][/td][td] [b]n[sub]i [/sub][/b][br][/td][td] [/td][td][b]X / Y=Social - Humanístic[/b][/td][td][b] n[sub]i [/sub][/b][/td][/tr][br][tr][td]Home[/td][td] 42[br][/td][td][/td][td][b][/b]Home[/td][td] 78[b][/b][/td][/tr][br][tr][td]Dona[/td][td] 63[br][/td][td][/td][td][b][/b]Dona[/td][td] 117[b][/b][/td][/tr][br][tr][td][br][/td][td] 105[br][/td][td][/td][td][b][/b][/td][td] 195[b][/b][/td][/tr][/table][br][br][br][table][tr][td][b]Y / X=Home[/b][/td][td] [b]n[sub]i [/sub][/b][br][/td][td] [/td][td][b]Y / X=Dona[/b][/td][td][b] n[sub]i [/sub][/b][/td][/tr][br][tr][td]Científico - Tecnològic[/td][td] 42[br][/td][td][/td][td][b][/b]Científico - Tecnològic[/td][td] 63[b][/b][/td][/tr][br][tr][td]Social - Humanístic[/td][td] 78[br][/td][td][/td][td][b][/b]Social - Humanístic[/td][td] 117[b][/b][/td][/tr][br][tr][td][br][/td][td] 120[/td][td][/td][td][b][/b][/td][td] 180[b][/b][/td][/tr][/table][br][br]Si ens fixem: 42/105 = 78/195 = 120/300[br] 63/105 = 117 /195 = 180/300[br] 42/120 = 63/180 = 105/300[br] 78/120 = 117/180 = 195/300[br][br]És a dir, les files i les columnes de la taula de doble entrada, són proporcionals entre elles.[br][br][color=#0000ff]Així doncs, les variables gènere i modalitat de batxillerat són independents.[/color]
Tenir gos o gat, X, influeix per aprovar Matemàtiques, Y?[br][br][table][tr][td]Y \ X[/td][td] Sí [/td][td] No [/td][/tr][tr][td]Aprovat[/td][td] 15[/td][td] 20[/td][/tr][tr][td]Suspès[/td][td] 35[/td][td] 50[/td][/tr][/table]