Κανόνας των Sturges Επεξήγηση, Εφαρμογές και Παραδείγματα
Το Sturges κανόνας είναι ένα κριτήριο που χρησιμοποιείται για τον προσδιορισμό του αριθμού των κλάσεων ή διαστημάτων που είναι απαραίτητα για τη γραφική παράσταση ενός συνόλου στατιστικών δεδομένων. Ο κανόνας αυτός διατυπώθηκε το 1926 από τον Γερμανό μαθηματικό Herbert Sturges.
Ο Sturges πρότεινε μια απλή μέθοδο, με βάση τον αριθμό των δειγμάτων x που επέτρεψαν να βρεθεί ο αριθμός των κλάσεων και το εύρος εύρους τους. Ο κανόνας Sturges χρησιμοποιείται ευρέως ειδικά στον τομέα των στατιστικών, ειδικά για την κατασκευή ιστογραμμάτων συχνοτήτων.
Ευρετήριο
- 1 Επεξήγηση
- 2 Εφαρμογές
- 3 Παράδειγμα
- 4 Αναφορές
Επεξήγηση
Ο κανόνας Sturges είναι μια εμπειρική μέθοδος που χρησιμοποιείται ευρέως σε περιγραφικά στατιστικά στοιχεία για τον προσδιορισμό του αριθμού των τάξεων που πρέπει να υπάρχουν σε ένα ιστολόγιο συχνοτήτων, προκειμένου να ταξινομηθεί ένα σύνολο δεδομένων που αντιπροσωπεύουν δείγμα ή πληθυσμό.
Βασικά, ο κανόνας αυτός καθορίζει το πλάτος των γραφικών περιεκτών, τα ιστογράμματα συχνοτήτων.
Για να εδραιώσει τον κανόνα του, ο Herbert Sturges θεωρούσε ένα ιδανικό διάγραμμα συχνοτήτων, το οποίο αποτελείται από διαστήματα K, όπου το i-διάστημα περιέχει ένα ορισμένο αριθμό δειγμάτων (i = 0, ... k - 1)
Αυτός ο αριθμός δειγμάτων δίνεται από τον αριθμό των τρόπων με τους οποίους μπορεί να εξαχθεί ένα υποσύνολο ενός συνόλου. δηλαδή με τον διωνυμικό συντελεστή, που εκφράζεται ως εξής:
Για να απλοποιήσει την έκφραση, εφάρμοσε τις ιδιότητες των λογαρίθμων και στα δύο μέρη της εξίσωσης:
Έτσι, Sturges διαπίστωσε ότι ο βέλτιστος αριθμός των διαστημάτων k δίνεται από την έκφραση:
Μπορεί επίσης να εκφραστεί ως εξής:
Στην έκφραση αυτή:
- k είναι ο αριθμός των κλάσεων.
- N είναι ο συνολικός αριθμός παρατηρήσεων του δείγματος.
- Το log είναι ο κοινός λογάριθμος της βάσης 10.
Για παράδειγμα, για να φτιαχτεί ένα ιστόγραμμα συχνότητας που εκφράζει ένα τυχαίο δείγμα ύψους 142 παιδιών, ο αριθμός διαστημάτων ή τάξεων που θα έχει η διανομή είναι:
k = 1 + 3,322 * log10 (Ν)
k = 1 + 3,322* log (142)
k = 1 + 3,322* 2,1523
k = 8,14 ≈ 8
Έτσι, η κατανομή θα είναι σε 8 διαστήματα.
Ο αριθμός των διαστημάτων πρέπει πάντα να αντιπροσωπεύεται από ακέραιους αριθμούς. Σε περιπτώσεις όπου η τιμή είναι δεκαδική, πρέπει να γίνει προσέγγιση με τον πλησιέστερο ακέραιο αριθμό.
Εφαρμογές
Ο κανόνας των Sturges εφαρμόζεται κυρίως στις στατιστικές δεδομένου ότι επιτρέπει την κατανομή των συχνοτήτων μέσω του υπολογισμού του αριθμού των κλάσεων (k), καθώς και του μήκους καθενός από αυτούς, γνωστού και ως πλάτος.
Το εύρος είναι η διαφορά μεταξύ του ανώτερου και κατώτερου ορίου της κατηγορίας, διαιρούμενο με τον αριθμό των κλάσεων, και εκφράζεται:
Υπάρχουν πολλοί εμπειρικοί κανόνες που επιτρέπουν τη διανομή συχνοτήτων. Ωστόσο, ο κανόνας Sturges χρησιμοποιείται συνήθως επειδή προσεγγίζει τον αριθμό των τάξεων, οι οποίες κυμαίνονται γενικά από 5 έως 15.
Με αυτό τον τρόπο, εξετάστε μια τιμή που αντιπροσωπεύει επαρκώς ένα δείγμα ή έναν πληθυσμό. δηλαδή, η προσέγγιση δεν αντιπροσωπεύει ακραίες ομαδοποιήσεις, ούτε λειτουργεί με υπερβολικό αριθμό κατηγοριών που δεν επιτρέπουν την περίληψη του δείγματος.
Παράδειγμα
Είναι απαραίτητο να εκτελεστεί ένα ιστογράμμα συχνότητας σύμφωνα με τα δεδομένα, που αντιστοιχεί σε ηλικίες που αποκτήθηκαν σε μια έρευνα ανδρών που κάνουν ασκήσεις σε ένα τοπικό γυμναστήριο.
Για να καθορίσετε τα διαστήματα πρέπει να γνωρίζετε ποιο είναι το μέγεθος του δείγματος ή ο αριθμός των παρατηρήσεων. σε αυτή την περίπτωση, έχετε 30.
Στη συνέχεια ισχύει ο κανόνας Sturges:
k = 1 + 3,322 * log10 (Ν)
k = 1 + 3,322* log (30)
k = 1 + 3,322* 1,4771
k = 5,90 ≈ 6 διαστήματα.
Από τον αριθμό των διαστημάτων, το εύρος που θα έχουν αυτά μπορεί να υπολογιστεί. δηλαδή το πλάτος κάθε ράβδου που αναπαρίσταται στο ιστόγραμμα συχνότητας:
Το κατώτερο όριο θεωρείται η χαμηλότερη τιμή των δεδομένων και το ανώτερο όριο είναι η υψηλότερη τιμή. Η διαφορά μεταξύ του άνω και του κάτω ορίου ονομάζεται περιοχή ή διαδρομή της μεταβλητής (R).
Από το τραπέζι έχουμε ότι το ανώτατο όριο είναι 46 και το κάτω όριο 13. Με αυτόν τον τρόπο, το πλάτος κάθε κατηγορίας θα είναι:
Τα διαστήματα θα αποτελούνται από ένα ανώτερο και κατώτερο όριο. Για να προσδιορίσετε αυτά τα διαστήματα, αρχίστε να μετράτε από το κατώτερο όριο, προσθέτοντας σε αυτό το εύρος που καθορίζεται από τον κανόνα (6), ως εξής:
Στη συνέχεια, η απόλυτη συχνότητα υπολογίζεται για τον προσδιορισμό του αριθμού των ανδρών που αντιστοιχεί σε κάθε διάστημα. στην περίπτωση αυτή είναι:
- Περίοδος 1: 13 - 18 = 9
- Περίοδος 2: 19-24 = 9
- Περίοδος 3: 25-30 = 5
- Περίοδος 4: 31 - 36 = 2
- Περίοδος 5: 37 - 42 = 2
- Διάστημα 6: 43 - 48 = 3
Κατά την προσθήκη της απόλυτης συχνότητας κάθε κλάσης, αυτό πρέπει να είναι ίσο με το συνολικό αριθμό του δείγματος. στην περίπτωση αυτή, 30.
Στη συνέχεια, υπολογίζεται η σχετική συχνότητα κάθε διαστήματος, διαιρώντας την απόλυτη συχνότητα αυτού του διαστήματος με τον συνολικό αριθμό παρατηρήσεων:
- Διάστημα 1: fi = 9 ÷ 30 = 0,30
- Διάστημα 2: fi = 9 ÷ 30 = 0,30
- Διάστημα 3: fi = 5 ÷ 30 = 0,1666
- Διάστημα 4: fi = 2 ÷ 30 = 0,0666
- Διάστημα 5: fi = 2 ÷ 30 = 0,0666
- Διάστημα 4: fi = 3 ÷ 30 = 0,10
Στη συνέχεια, μπορείτε να δημιουργήσετε πίνακα που να αντανακλά τα δεδομένα και επίσης το διάγραμμα από τη σχετική συχνότητα σε σχέση με τα ληφθέντα διαστήματα, όπως φαίνεται στις παρακάτω εικόνες:
Με αυτόν τον τρόπο, ο κανόνας Sturges επιτρέπει τον προσδιορισμό του αριθμού των κατηγοριών ή των διαστημάτων στα οποία μπορεί να διαιρεθεί ένα δείγμα, προκειμένου να συνοψιστεί ένα δείγμα δεδομένων μέσω της προετοιμασίας των πινάκων και των γραφημάτων.
Αναφορές
- Alfonso Urquía, Μ. Β. (2013). Μοντελοποίηση και προσομοίωση διακριτών εκδηλώσεων. UNED,.
- Altman Naomi, Μ. Κ. (2015). "Απλή γραμμική παλινδρόμηση." Μέθοδοι φύσης .
- Antúnez, R.J. (2014). Στατιστικές στην εκπαίδευση. Ψηφιακό UNID.
- Fox, J. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης, γραμμικά μοντέλα και συναφείς μέθοδοι. Δημοσιεύσεις SAGE.
- Humberto Llinás Solano, C. R. (2005). Περιγραφικά στατιστικά στοιχεία και κατανομές πιθανοτήτων. Πανεπιστήμιο του Βορρά.
- Παντελέεβα, Ο.Β. (2005). Βασικές αρχές πιθανοτήτων και στατιστικών.
- O. Kuehl, Μ. Ο. (2001). Σχεδιασμός πειραμάτων: Στατιστικές αρχές σχεδιασμού και ανάλυσης της έρευνας. Thomson Editors.