Μέτρα κεντρικής τάσης για ομαδοποιημένα δεδομένα
Το μέτρα κεντρικής τάσης των ομαδοποιημένων δεδομένων χρησιμοποιούνται σε στατιστικές για να περιγράψουν ορισμένες συμπεριφορές μιας ομάδας δεδομένων που παρέχονται, όπως είναι το τι πλησιάζουν, ποιο είναι το μέσο όρο των συλλεγόμενων δεδομένων, μεταξύ άλλων.
Όταν λαμβάνονται πολλά δεδομένα, είναι χρήσιμο να τα ομαδοποιήσουμε για να έχουμε μια καλύτερη σειρά από αυτά και έτσι να μπορέσουμε να υπολογίσουμε ορισμένα μέτρα κεντρικής τάσης.
Μεταξύ των μέτρων κεντρικής τάσης που χρησιμοποιούνται περισσότερο είναι ο αριθμητικός μέσος όρος, ο διάμεσος και ο τρόπος λειτουργίας. Αυτοί οι αριθμοί αναφέρουν ορισμένες ιδιότητες σχετικά με τα δεδομένα που συλλέχθηκαν σε ένα συγκεκριμένο πείραμα.
Για να χρησιμοποιήσετε αυτά τα μέτρα είναι απαραίτητο πρώτα να μάθετε πώς να ομαδοποιείτε ένα σύνολο δεδομένων.
Ομαδοποιημένα δεδομένα
Για να ομαδοποιήσετε πρώτα τα δεδομένα, πρέπει να υπολογίσετε το εύρος των δεδομένων, το οποίο λαμβάνεται αφαιρώντας την υψηλότερη τιμή μείον τη χαμηλότερη τιμή των δεδομένων.
Στη συνέχεια, επιλέξτε έναν αριθμό "k", ο οποίος είναι ο αριθμός των κατηγοριών στις οποίες θέλετε να ομαδοποιήσετε τα δεδομένα.
Συνεχίζουμε να διαιρούμε το εύρος μεταξύ του "k" για να αποκτήσουμε το πλάτος των κατηγοριών που θα ομαδοποιηθούν. Αυτός ο αριθμός είναι C = R / k.
Τέλος ξεκινάει η ομαδοποίηση, για την οποία επιλέγεται ένας μικρότερος αριθμός από την μικρότερη τιμή των δεδομένων που ελήφθησαν..
Αυτός ο αριθμός θα είναι το κατώτερο όριο της πρώτης τάξης. Σε αυτό προστίθεται το C. Η τιμή που θα ληφθεί θα είναι το ανώτατο όριο της πρώτης κατηγορίας.
Στη συνέχεια, το C προστίθεται σε αυτή την τιμή και το ανώτερο όριο της δεύτερης κατηγορίας αποκτάται. Με αυτόν τον τρόπο συνεχίζετε μέχρι να φτάσετε το ανώτατο όριο της τελευταίας τάξης.
Αφού τα δεδομένα ομαδοποιηθούν, μπορείτε να προχωρήσετε στον υπολογισμό του μέσου όρου, του μέσου και της μόδας.
Για να δείξουμε πώς υπολογίζεται η μέση αριθμητική, ο διάμεσος και ο τρόπος λειτουργίας, θα προχωρήσουμε με ένα παράδειγμα.
Παράδειγμα
Επομένως, κατά την ομαδοποίηση των δεδομένων θα πάρετε έναν πίνακα όπως τα εξής:
Τα 3 κύρια κεντρικά μέτρα τάσης
Τώρα θα προχωρήσουμε στον υπολογισμό του αριθμητικού μέσου, του μέσου και του τρόπου. Το παραπάνω παράδειγμα θα χρησιμοποιηθεί για την απεικόνιση αυτής της διαδικασίας.
1- Αριθμητικός μέσος όρος
Ο αριθμητικός μέσος όρος συνίσταται στον πολλαπλασιασμό κάθε συχνότητας με τον μέσο όρο του διαστήματος. Στη συνέχεια, όλα αυτά τα αποτελέσματα προστίθενται και τελικά διαιρούνται με τα συνολικά δεδομένα.
Χρησιμοποιώντας το προηγούμενο παράδειγμα θα έχουμε ότι ο αριθμητικός μέσος είναι ίσος με:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Αυτό δείχνει ότι η μέση τιμή των δεδομένων στον πίνακα είναι 5.11111.
2- Μεσαίο
Για να υπολογίσετε τη διάμεση τιμή ενός συνόλου δεδομένων, πρώτα όλα τα δεδομένα ταξινομούνται από το λιγότερο στο μεγαλύτερο. Μπορούν να παρουσιαστούν δύο περιπτώσεις:
- Εάν ο αριθμός δεδομένων είναι παράξενος, τότε ο διάμεσος είναι τα δεδομένα που βρίσκονται ακριβώς στο κέντρο.
- Εάν ο αριθμός δεδομένων είναι ομοιόμορφος, τότε ο διάμεσος είναι ο μέσος όρος των δύο δεδομένων που παραμένουν στο κέντρο.
Όταν πρόκειται για ομαδοποιημένα δεδομένα, ο υπολογισμός της διάμεσης τιμής γίνεται με τον ακόλουθο τρόπο:
- N / 2 υπολογίζεται, όπου N είναι τα συνολικά δεδομένα.
- Το πρώτο διάστημα αναζητείται όπου η συσσωρευμένη συχνότητα (το άθροισμα των συχνοτήτων) είναι μεγαλύτερη από N / 2 και επιλέγεται το κατώτερο όριο αυτού του διαστήματος, που ονομάζεται Li..
Ο διάμεσος δίνεται από τον ακόλουθο τύπο:
Me = Li + (Ls-Li) * (N / 2 - Συσσωρευμένη συχνότητα πριν από το Li) / Συχνότητα [Li, Ls)
Το Ls είναι το ανώτερο όριο της κλίμακας που αναφέρθηκε παραπάνω.
Εάν χρησιμοποιείται η παραπάνω πίνακα δεδομένων πρέπει να N / 2 = 18/2 = 9. Αθροιστική συχνότητες είναι 4, 8, 14 και 18 (ένα για κάθε γραμμή του πίνακα).
Συνεπώς, πρέπει να επιλεγεί το τρίτο διάστημα, καθώς η συσσωρευμένη συχνότητα είναι μεγαλύτερη από N / 2 = 9.
Έτσι Li = 5 και Ls = 7. Εφαρμόζοντας τον τύπο που περιγράψαμε παραπάνω, πρέπει:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Μόδα
Η μόδα είναι η τιμή που έχει τη μεγαλύτερη συχνότητα μεταξύ όλων των ομαδοποιημένων δεδομένων. δηλαδή, είναι η τιμή που επαναλαμβάνεται τις περισσότερες φορές στο αρχικό σύνολο δεδομένων.
Όταν έχετε πολύ μεγάλο όγκο δεδομένων, ο παρακάτω τύπος χρησιμοποιείται για τον υπολογισμό της λειτουργίας των ομαδοποιημένων δεδομένων:
Μο = Li + (Ls-Li) * (συχνότητα Li - Συχνότητα L (i-1)) / ((συχνότητα Li - Συχνότητα L (i-1)) + (συχνότητα Li - Συχνότητα L ( i + 1)))
Το διάστημα [Li, Ls) είναι το διάστημα στο οποίο βρίσκεται η υψηλότερη συχνότητα. Για το παράδειγμα που γίνεται σε αυτό το άρθρο έχουμε ότι η μόδα δίνεται από:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Ένας άλλος τύπος που χρησιμοποιείται για τη λήψη μιας κατά προσέγγιση αξίας στη μόδα είναι τα εξής:
(Συχνότητα L (i + 1)) / (συχνότητα L (i-1) + συχνότητα L (i + 1)).
Με αυτόν τον τύπο, οι λογαριασμοί έχουν ως εξής:
Μο = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Αναφορές
- Bellhouse, D. R. (2011). Αβραάμ Ντε Μόιβρε: Ορίστε το στάδιο για την κλασική πιθανότητα και τις εφαρμογές του. CRC Press.
- Cifuentes, J. F. (2002). Εισαγωγή στη Θεωρία Πιθανοτήτων. Πανεπιστήμιο της Κολομβίας.
- Daston, L. (1995). Κλασσική Πιθανότητα στον Διαφωτισμό. Princeton University Press.
- Larson, Η. J. (1978). Εισαγωγή στη θεωρία των πιθανοτήτων και στα στατιστικά συμπεράσματα. Συντάκτης Limusa.
- Martel, Ρ. J., & Vegas, F. J. (1996). Πιθανότητες και μαθηματικές στατιστικές: εφαρμογές στην κλινική πρακτική και διαχείριση της υγείας. Ediciones Díaz de Santos.
- Vázquez, Α. L. & Ortiz, F. J. (2005). Στατιστικές μέθοδοι μέτρησης, περιγραφής και ελέγχου της μεταβλητότητας. Ed. Πανεπιστήμιο της Κανταβρίας.
- Vázquez, S.G. (2009). Μαθηματικά για πρόσβαση στο Πανεπιστήμιο. Εκδοτικό Κέντρο Μελετών Ramon Areces SA.