Πόσες ώρες πρέπει να κάθονται οι μαθητές του Λυκείου; Υπολογισμός εξαρτήσεων συσχέτισης στο Microsoft Excel


Κατά την ανάλυση της σχέσης μεταξύ μεταβλητών που μετρώνται σε επίπεδο διαστήματος, χρησιμοποιείται συχνά μια γραφική αναπαράσταση αυτής της σχέσης, που ονομάζεται διάγραμμα διασποράς.Σε ένα διάγραμμα διασποράς, κάθε παρατήρηση, δηλαδή κάθε «περίπτωση», αντιπροσωπεύεται από ένα σημείο σε ένα δισδιάστατο σύστημα συντεταγμένων. Η τιμή της ανεξάρτητης μεταβλητής για μια δεδομένη παρατήρηση καθορίζει τη θέση του αντίστοιχου σημείου σε σχέση με τον άξονα X,και η τιμή της εξαρτημένης μεταβλητής καθορίζει τη δεύτερη συντεταγμένη του σημείου - κατά μήκος του άξονα Υ.Με άλλα λόγια, η κάθετη έπεσε από το σημείο «περίπτωση» στον άξονα X,αντιστοιχεί στο μετρούμενο επίπεδο της ανεξάρτητης μεταβλητής, ενώ η κάθετη έπεσε στον άξονα Υ, θα αντιστοιχεί ακριβώς στο παρατηρούμενο επίπεδο της εξαρτημένης μεταβλητής.

Ας έχουμε, για παράδειγμα, στοιχεία για τους προϋπολογισμούς 10 κομμάτων και για τον αριθμό των εδρών που έλαβαν αυτά τα κόμματα στο κοινοβούλιο. Με βάση την υπόθεση για την επιρροή του μεγέθους του προϋπολογισμού του κόμματος (X)από τον αριθμό των βουλευτικών εντολών που ελήφθησαν ως αποτέλεσμα των εκλογών ( Υ), μπορούμε να κατασκευάσουμε ένα διάγραμμα διασποράς παρόμοιο με αυτό που φαίνεται στο Εικόνα 21.

Ρύζι. 21.Διάγραμμα διασποράς που δείχνει τη σχέση μεταξύ του μεγέθους του προϋπολογισμού του κόμματος σε εκατομμύρια ρούβλια. (X)με την ποσότητα

έδρες στο κοινοβούλιο ( Υ) για 10 πολιτικά κόμματα

Κάθε σημείο στο σχήμα αντιστοιχεί σε ένα από τα δέκα παιχνίδια. Παρά ορισμένες «ανώμαλες» περιπτώσεις, όπως αυτές που κυκλώθηκαν, το διάγραμμα δείχνει ξεκάθαρα ότι οποιαδήποτε αύξηση του μεγέθους του ταμείου του κόμματος (μετατόπιση προς τα δεξιά κατά μήκος άξονας Χ)συνεπάγεται αύξηση της κοινοβουλευτικής εκπροσώπησης (μετατόπιση προς τα πάνω κατά μήκος του άξονα y). Μεταξύ μεταβλητών ΧΚαι Υυπάρχει γραμμική σχέση:αν μια μεταβλητή αυξηθεί σε τιμή, τότε το ίδιο συμβαίνει και με την άλλη. Εκτός από την ένδειξη της φύσης της σχέσης μεταξύ δύο μεταβλητών, ένα διάγραμμα στο Σχήμα 21μας επιτρέπει να κάνουμε κάποιες υποθέσεις για ένταση,τη δύναμη αυτής της σχέσης. Προφανώς, όσο πιο συμπαγή, «συνωστισμένα» τα σημεία παρατήρησης βρίσκονται γύρω από τη διακεκομμένη ευθεία (περιγράφοντας ιδανική γραμμική σχέση Χ και Υ),τόσο ισχυρότερος είναι ο εθισμός. Στην Εικόνα 22Εμφανίζονται άλλα τρία scatterplots.

Ρύζι. 22.Scatterplots για υποθετικά δεδομένα

Είναι προφανές ότι επί Εικόνα 22αοποιαδήποτε σύνδεση μεταξύ ΧΚαι Υαπλά λείπει. Επί σχήμα 226μια νοητή ευθεία γραμμή (σημειωμένη με μια διακεκομμένη γραμμή) θα διέσχιζε το διάγραμμα από πάνω προς τα κάτω, από την επάνω αριστερή στην κάτω δεξιά γωνία. Με άλλα λόγια, η γραμμική σχέση σε αυτή την περίπτωση έχει την αντίθετη κατεύθυνση: όσο περισσότερο X,τόσο μικρότερη είναι η εξαρτημένη μεταβλητή Υ. Σημειώστε επίσης ότι η «ακρίβεια» της διάταξης των σημείων κατά μήκος μιας νοητής ευθείας γραμμής στο σχήμα 226δεν είναι πολύ μεγάλο, πράγμα που σημαίνει ότι η σύνδεση (συσχέτιση) μεταξύ των μεταβλητών δεν είναι μόνο αντίστροφη, αρνητική, αλλά και όχι πολύ ισχυρή, μέτρια. Τελικά, στο Σχήμα 22γη εξαρτημένη και η ανεξάρτητη μεταβλητή συνδέονται με μια σαφώς μη γραμμική σχέση: το φανταστικό γράφημα δεν μοιάζει καθόλου με ευθεία γραμμή και μάλλον μοιάζει με παραβολή. Σημειώστε ότι οι μέθοδοι ανάλυσης που θα συζητηθούν τώρα δεν είναι κατάλληλες για αυτή τη μη γραμμική περίπτωση, καθώς ο συνήθης τύπος για τον υπολογισμό του συντελεστή συσχέτισης θα δώσει μηδενική τιμή, αν και υπάρχει σχέση μεταξύ των μεταβλητών.


Υπάρχει μια γενικευμένη μέτρηση που μετρά πόσο στενά η σχέση μεταξύ των μεταβλητών προσεγγίζει μια γραμμική συναρτησιακή σχέση, η οποία εμφανίζεται ως ευθεία γραμμή σε ένα διάγραμμα διασποράς. Αυτό συντελεστής συσχέτισης,μέτρηση της εγγύτητας της σχέσης μεταξύ των μεταβλητών, δηλαδή της τάσης τους να αλλάζουν μαζί. Όπως και στα μέτρα σύνδεσης μεταξύ ποιοτικών χαρακτηριστικών που συζητήθηκαν παραπάνω, ο συντελεστής συσχέτισης μας επιτρέπει να εκτιμήσουμε τη δυνατότητα πρόβλεψης των τιμών της εξαρτημένης μεταβλητής από τις τιμές της ανεξάρτητης. Γενικός τύπος υπολογισμού Συντελεστής συσχέτισης Pearsonπεριλαμβάνει την αξία συνδιακυμάνσειςαξίες ΧΚαι Υ. Αυτή η τιμή ( μικρό xy) χαρακτηρίζει την κοινή αλλαγή στις τιμές δύο μεταβλητών. Καθορίζεται ως το άθροισμα των γινομένων των αποκλίσεων των παρατηρούμενων τιμών ΧΚαι Υαπό τον μέσο όρο, αντίστοιχα, δηλαδή διαιρούμενο με τον αριθμό των παρατηρήσεων. Για να κατανοήσουμε τη «φυσική έννοια» της συνδιακύμανσης, αρκεί να προσέξουμε την ακόλουθη ιδιότητα: εάν για κάποιο αντικείμενο εγώστο δείγμα και οι δύο τιμές είναι ¾ ντοεγώ και U i ¾ αποδεικνύεται υψηλό, τότε το προϊόν με θα είναι μεγάλο και θετικό. Εάν και οι δύο τιμές (από Χκαι από Υ) είναι χαμηλά, τότε το γινόμενο δύο αποκλίσεων, δηλ. δύο αρνητικοί αριθμοί θα είναι επίσης θετικοί. Έτσι, εάν μια γραμμική σχέση ΧΚαι Υθετικό και μεγάλο, το άθροισμα τέτοιων προϊόντων για όλες τις παρατηρήσεις θα είναι επίσης θετικό. Εάν η σύνδεση μεταξύ ΧΚαι Υτο αντίθετο, τότε πολλές θετικές αποκλίσεις σε Χθα αντιστοιχεί σε αρνητικές αποκλίσεις σύμφωνα με Υ, δηλ. το άθροισμα των αρνητικών γινομένων των αποκλίσεων θα είναι αρνητικό.

Τέλος, ελλείψει συστηματικής σχέσης, τα προϊόντα άλλοτε θα είναι θετικά, άλλοτε αρνητικά και το άθροισμά τους (και επομένως συνδιακύμανση ΧΚαι Υ) στο όριο θα είναι ίσο με μηδέν. Έτσι, η συνδιακύμανση δείχνει το μέγεθος και την κατεύθυνση της σχέσης, την κοινή αλλαγή ΧΚαι Υ.Αν διαιρέσουμε τη συνδιακύμανση μικρό xy σε τυπικές αποκλίσεις μικρό x και μικρό y (για να απαλλαγούμε από την επιρροή της κλίμακας της κλίμακας στην οποία ΧΚαι Υ), τότε παίρνουμε την επιθυμητή φόρμα Συντελεστής συσχέτισης Pearson (r xy):

Ένας τύπος υπολογισμού που είναι πιο βολικός για πρακτικούς υπολογισμούς μοιάζει με αυτό:

Παρά την κάπως τρομακτική εμφάνισή του, ο τύπος υπολογισμού είναι πολύ απλός. Για "χειροκίνητο" υπολογισμό r xy χρειάζεστε μόνο πέντε ποσότητες: τα αθροίσματα των τιμών πάνω ΧΚαι Υάθροισμα τετραγώνων τιμών πάνω ΧΚαι Υποσά προϊόντων ΧΚαι Υγια όλα τα αντικείμενα «περίπτωσης». ΣΕ πίνακας 8. 11παρέχει δεδομένα για τις μέγιστες θερμοκρασίες ημέρας και νύχτας που καταγράφηκαν σε 10 πόλεις.

Αθροίζοντας τις τιμές στις στήλες, παίρνουμε και Αυξάνοντας κάθε μία από τις τιμές ΧΚαι Υτετράγωνο και άθροισμα, βρίσκουμε ότι και Άθροισμα ζευγαρωμένων γινομένων X iΚαι Y i. θα είναι 4359. Μπορείτε να επαληθεύσετε μόνοι σας ότι η σύνδεση όλων των τιμών στον τύπο υπολογισμού θα δώσει (ελπίζουμε) την τιμή r xy = 0,91. Με άλλα λόγια, η συσχέτιση μεταξύ των θερμοκρασιών του αέρα ημέρας και νύχτας είναι πολύ υψηλή, αλλά εξακολουθεί να διαφέρει από 1,0 (ο συντελεστής συσχέτισης μπορεί να κυμαίνεται από -1,0 έως +1,0). Αυτή η διαφορά πιθανότατα οφείλεται στην επίδραση άλλων παραγόντων (διάρκεια ημέρας και νύχτας, συννεφιά, γεωγραφική θέση κ.λπ.). Κρίνοντας από την λαμβανόμενη τιμή συσχέτισης, η γνώση των θερμοκρασιών κατά τη διάρκεια της ημέρας επιτρέπει προλέγωνυχτερινές θερμοκρασίες με πολύ υψηλή ακρίβεια, αλλά όχι αλάνθαστα.

Μια τιμή που είναι ίση με το τετράγωνο του συντελεστή συσχέτισης Pearson, δηλ. r2,έχει μια σειρά από ενδιαφέρουσες στατιστικές ιδιότητες. Ας σημειώσουμε τώρα ότι r 2είναι ένα μέτρο σύνδεσης PLC παρόμοιο με αυτά που συζητήθηκαν παραπάνω. Μπορεί να αποδειχθεί ότι χαρακτηρίζει αυτό το τμήμα της διακύμανσης των τιμών Υ,που εξηγείται από την παρουσία συσχέτισης μεταξύ ΧΚαι Υ.(Φυσικά, η αξία rΤο 2 θα είναι πάντα θετικό και δεν μπορεί να υπερβαίνει τον συντελεστή συσχέτισης σε απόλυτη τιμή). Αυτό το μέρος της διαφοράς στις αξίες Υ,που δεν μπορεί να προβλεφθεί από τις τιμές X, -Αυτό τη διακύμανση του σφάλματος πρόβλεψής μας,δηλαδή 1 - r 2. Ανεξήγητη διασπορά στις τιμές Y υπάρχει όταν, σε ίσα επίπεδα X (βλ.για παράδειγμα, οι θερμοκρασίες κατά τη διάρκεια της ημέρας στη Βαρσοβία και τη Βόννη από Πίνακας 8.11) οι διαφορές στις τιμές Y παραμένουν.

Πίνακας 8.11

Μέγιστες θερμοκρασίες αέρα κατά τη διάρκεια της ημέρας και της νύχτας σε ορισμένες πόλεις

Η Unified State Exam στην επιστήμη των υπολογιστών είναι μια προαιρετική εξέταση που δίνουν οι υποψήφιοι για ειδικότητες πληροφορικής. Ένας εμπειρογνώμονας του Unified State Examination, ειδικός στο εκπαιδευτικό και μεθοδολογικό έργο και ένας υπεύθυνος ανάπτυξης προγραμμάτων προετοιμασίας για τις εξετάσεις επιστήμης υπολογιστών μίλησε για το πώς να προετοιμαστείτε καλύτερα για αυτήν την εξέταση. Λιουντμίλα Γκοντάρ.

Ποια είναι η σημερινή κατάσταση με την πληροφορική στα σχολεία της δευτεροβάθμιας εκπαίδευσης; Πόσο καλά γνωρίζουν οι μαθητές την επιστήμη των υπολογιστών;
Σε ένα κανονικό σχολείο, μια με δύο ώρες την εβδομάδα διατίθενται για την πληροφορική. Ταυτόχρονα, το πρόγραμμα σπουδών περιλαμβάνει αρκετή ύλη οι μαθητές μελετούν διάφορα θέματα. Καταρχήν, μπορούμε να πούμε ότι τα παιδιά γνωρίζουν καλά την επιστήμη των υπολογιστών. Στα μαθήματά μου έρχονται κυρίως μαθητές με καλούς και άριστους βαθμούς. Μπορώ όμως να αναλύσω το επίπεδο γνώσεων σε ορισμένα θέματα της επιστήμης των υπολογιστών που είναι απαραίτητα για να περάσω την Ενιαία Κρατική Εξέταση, και εδώ δεν είναι όλα τόσο καλά. Είναι αρκετά δύσκολο να προετοιμαστείτε για την Ενιαία Κρατική Εξέταση στα σχολικά μαθήματα. Η επιστήμη των υπολογιστών είναι ένα μάθημα επιλογής και για να λάβετε υψηλή βαθμολογία εδώ, χρειάζεστε πρόσθετες γνώσεις και, κατά συνέπεια, επιπλέον μαθήματα για να μελετήσετε ορισμένα θέματα σε μεγαλύτερο βάθος. Αυτό μπορεί να είναι ανεξάρτητη μελέτη, ένα μάθημα επιλογής στο σχολείο, μαθήματα με δάσκαλο ή μαθήματα - η επιλογή εξαρτάται από τους μαθητές και τους γονείς τους.

Πέρυσι, από το πρώτο μέρος της Ενιαίας Κρατικής Εξέτασης στην επιστήμη των υπολογιστών, αποκλείστηκαν όλες οι δοκιμαστικές εργασίες που απαιτούσαν επιλογή της σωστής απάντησης. Τώρα οι συμμετέχοντες στις εξετάσεις πρέπει να εισάγουν οι ίδιοι την απάντηση.
Πόσο δύσκολο έκανε αυτό την εξέταση;

Αυτή είναι μια πολύ καλή καινοτομία. Η εξέταση έγινε πιο δύσκολη για τους αδύναμους μαθητές, καθώς η επιλογή των απαντήσεων τους επέτρεψε να βρουν τη σωστή χρησιμοποιώντας μια μέθοδο επιλογής. Για τα υπόλοιπα παιδιά η εξέταση δεν ήταν δύσκολη.
Πολλές εργασίες USE μπορούν να ταξινομηθούν σε ένα μεγάλο θέμα. Επομένως, είναι καλύτερο να πούμε ότι υπάρχουν εργασίες στις οποίες οι μαθητές κάνουν τα περισσότερα λάθη. Θα ονομάσω τους αριθμούς τους: πρόκειται για εργασίες Νο. 5, Νο. 9, Νο. 10, Νο. 11, Νο. 12, Νο. 16, Νο. 18 και Νο. 23. Οι πρώτες πέντε είναι βασικές ερωτήσεις σε θέματα όπως «Ανομοιόμορφη και Ομοιόμορφη Κωδικοποίηση», «Κωδικοποίηση κειμένου, Ήχος, Εικόνες Bitmap», «Αναδρομικοί Αλγόριθμοι» και «Διεύθυνση στο Διαδίκτυο». Οι πιο συνηθισμένες αιτίες προβλημάτων με αυτές τις εργασίες είναι υπολογιστικά σφάλματα ή μηχανιστική γνώση του θέματος. Όταν αλλάζει η ερώτηση, ο μαθητής χάνεται, αν και η λύση του προβλήματος δεν αλλάζει.

Οι εργασίες Νο. 16, Νο. 18 και Νο. 23 δύσκολα ή καθόλου λαμβάνονται υπόψη στο σχολικό μάθημα. Το Νο. 16 και το Νο. 18 είναι εργασίες προχωρημένου επιπέδου για παιδιά που στοχεύουν σε υψηλή βαθμολογία. Η εργασία Νο. 16 σχετίζεται με το θέμα «Συστήματα λογισμών», και τα σφάλματα εδώ είναι κυρίως υπολογιστικά. Στην εργασία Νο. 18 σχετικά με τον μετασχηματισμό των λογικών εκφράσεων, οι απόφοιτοι κάνουν πιο συχνά λάθη στην τεχνική εκτέλεσης. Αλλά το έργο Νο. 23 είναι τεχνικά το πιο δύσκολο από ολόκληρο το πρώτο μέρος της Ενιαίας Κρατικής Εξέτασης μόνο οι πιο έτοιμοι μαθητές το ολοκληρώνουν.

Επιπλέον, η επιστήμη των υπολογιστών δεν πρέπει να λαμβάνεται από παιδιά που έχουν προβλήματα με τα μαθηματικά. Αν έχεις δυσκολίες με τα μαθηματικά, θα είναι δύσκολο στην επιστήμη των υπολογιστών. Αυτά τα δύο θέματα συνδέονται πολύ στενά.

Τα πιο απλά θέματα περιλαμβάνουν Δυαδικά Συστήματα Αριθμών, Πίνακες Λογικής Αλήθειας, Βάσεις Δεδομένων και Συστήματα Αρχείων, Υπολογιστικά Φύλλα, Μεταβλητές, Τελεστές Ανάθεσης και Υπολογιστικούς Αλγόριθμους. Όλα αυτά αντικατοπτρίζονται στις εργασίες Νο. 1 έως Νο. 6, τις οποίες ολοκληρώνουν σχεδόν όλοι οι μαθητές, συμπεριλαμβανομένων των αδύναμων.

Ποιες εργασίες στο Unified State Exam στην επιστήμη των υπολογιστών αξίζουν τους περισσότερους βαθμούς; Ποιος είναι ο καλύτερος τρόπος να προετοιμαστείτε για αυτά;
Όσο μεγαλύτερος είναι ο αριθμός εργασίας, τόσο υψηλότερος είναι ο βαθμός - έτσι λειτουργεί η Ενιαία Κρατική Εξέταση. Η πιο πρόσφατη εργασία - Νο. 27 - βαθμολογείται υψηλότερη από τις υπόλοιπες, δηλαδή 4 βαθμούς από τους αρχικούς 35. Για τις εργασίες Νο. 26 και Νο. 24 μπορείτε να πάρετε 3 βαθμούς, για την εργασία Νο. 25 - 2 βαθμούς, Όχι 23 - 1 βαθμός. Οι τέσσερις εργασίες του Μέρους 2 (Αρ. 24-27) ανέρχονται σε 34 βαθμούς από 100 πόντους δοκιμής, δηλαδή περισσότερο από το ένα τρίτο της μέγιστης βαθμολογίας για την εξέταση.

Για να προετοιμαστείτε καλά για αυτές τις εργασίες, πρέπει να κάνετε έναν μεγάλο αριθμό ασκήσεων και να εργάζεστε σε λάθη κάθε φορά. Είναι επίσης σημαντικό να ζητήσετε βοήθεια από έναν δάσκαλο εδώ, καθώς χρειάζεται πολύ περισσότερος χρόνος για να τα καταφέρετε όλα αυτά μόνοι σας.

Υπάρχει μια «φόρμουλα επιτυχίας» που θα σας βοηθήσει να προετοιμαστείτε για την Ενιαία Κρατική Εξέταση στην επιστήμη των υπολογιστών με τον καλύτερο δυνατό τρόπο;
Ο πρώτος κανόνας είναι η δουλειά: πρέπει να δουλέψεις, να δουλέψεις και να δουλέψεις ξανά. Το δεύτερο μυστικό είναι να εργάζεστε σε λάθη. Και τρίτον, όταν ολοκληρώνετε μια εργασία, διαβάστε προσεκτικά την ερώτηση από την αρχή μέχρι το τέλος για να αποφύγετε απρόσεκτα λάθη. Είναι κρίμα όταν οι μαθητές απαντούν στη λάθος ερώτηση που τίθεται στο πρόβλημα.
Ποιες πηγές προτείνετε να χρησιμοποιήσετε για να προετοιμαστείτε μόνοι σας για τις εξετάσεις;
1. «Ιστότοπος FIPI»·
2. “Site of K. Polyakov”;
3. Συλλογές εργασιών δοκιμής Unified State Exam και εκπαιδευτικές ασκήσεις FIPI.

Ποιες είναι οι παγίδες στις εργασίες του μέρους 2; Τι πρέπει να προσέχετε όταν προετοιμάζεστε για εργασίες αυξημένης πολυπλοκότητας;
Εργασία Νο. 24Εδώ πρέπει να είστε σε θέση να εκτελέσετε και να κατανοήσετε έναν αλγόριθμο γραμμένο σε μια γλώσσα προγραμματισμού. Εάν καταλαβαίνετε, σημαίνει ότι θα ολοκληρώσετε τις εργασίες που υποδεικνύονται στο τεύχος, εάν δεν το κάνετε, τότε δεν θα το κάνετε. Αυτή η εργασία θέτει δύο ή τρεις ερωτήσεις και η πρώτη από αυτές περιέχει το μυστικό για την κατανόηση του αλγορίθμου και την εύρεση εκείνων των σφαλμάτων που προτείνεται να βρεθούν, να καταγραφούν και να διορθωθούν. Απαντήστε πρώτα στην πρώτη ερώτηση, αυτό θα σας βοηθήσει να κατανοήσετε τον αλγόριθμο και να βρείτε σφάλματα.

Εργασία Νο. 25Για να ολοκληρωθεί αυτή η εργασία, είναι απαραίτητο πρώτα απ 'όλα να αναλυθούν οι αλγόριθμοι προβλημάτων που προτείνονται στο FIPI "Unified State Examination Codifier in Computer Science". Η εργασία απαιτεί να δημιουργήσετε έναν αλγόριθμο για την επίλυση ενός προβλήματος σε μια γλώσσα προγραμματισμού, συγκεκριμένα, να μπορείτε να εργαστείτε με αριθμούς, να μπορείτε να επιλέξετε αριθμούς με τις απαιτούμενες συνθήκες από ένα σύνολο αριθμών, να εργαστείτε σε οποιοδήποτε σύστημα αριθμών , και να γνωρίζουν τα σημάδια της διαιρετότητας. Εάν τα παιδιά σπούδασαν "Αλγόριθμους" στο σχολείο, τότε είναι πιο εύκολο για αυτούς να ολοκληρώσουν αυτό το έργο. Οι μαθητές που έρχονται στις τάξεις μου και δεν είναι εξοικειωμένοι με αυτό το θέμα, πρώτα απ 'όλα, αρχίζουν να μελετούν με συνέπεια τους αλγόριθμους από τον "Κωδικοποιητή".

Εργασία Νο. 26Σε αυτή την εργασία, είναι σημαντικό να βρείτε την απάντηση στην προτεινόμενη ερώτηση, να διατυπώσετε μια πλήρη απάντηση και να αποδείξετε την ορθότητα της επιλεγμένης απάντησης.

Εργασία Νο. 27Η εργασία είναι δημιουργική - και η μόνη όπου ο απόφοιτος πρέπει να γράψει ένα πρόγραμμα ανεξάρτητα. Συνήθως εκτελείται με επιτυχία από μαθητές που γράφουν προγράμματα για αρκετά χρόνια και γνωρίζουν καλά τα μαθηματικά. Η εργασία αξίζει είτε 2 βαθμούς είτε 4. Στην τάξη, δουλεύω με τα παιδιά λεπτομερώς σχετικά με τις αποχρώσεις αυτής της εργασίας, ώστε να πάρουν τους μέγιστους βαθμούς στην εξέταση.

Απομένει ένας μήνας για την Ενιαία Κρατική Εξέταση στην Πληροφορική. Πώς θα συμβουλεύατε τους αποφοίτους να διαθέσουν τον χρόνο τους;
Στον υπόλοιπο χρόνο, θα πρέπει να προπονηθείτε σκληρά για να εμπεδώσετε τις αποκτηθείσες δεξιότητες. Είναι απαραίτητο να επιλύσετε όσο το δυνατόν περισσότερα προβλήματα και να εργαστείτε ξεχωριστά σε εκείνες τις εργασίες που προκαλούν τις μεγαλύτερες δυσκολίες στην ολοκλήρωση. Εάν προετοιμαζόσασταν μόνοι σας για τις εξετάσεις του Unified State, είναι πολύ σημαντικό να συμβουλευτείτε τώρα έναν δάσκαλο, γιατί κάθε εργασία έχει τη δική της ανατροπή που πρέπει να γνωρίζετε.

>>Πληροφορική: Εργαστήριο Η/Υ: Εργασία 15. Υπολογισμός εξαρτήσεων συσχέτισης στο MS Excel

Εργαστήριο ηλεκτρονικών υπολογιστών

Εργασία 15. Υπολογισμός εξαρτήσεων συσχέτισης στο MS Excel

Στόχοι εργασίας:

Απόκτηση μιας ιδέας για την εξάρτηση συσχέτισης των ποσοτήτων.

Κατακτήστε τη μέθοδο υπολογισμού του συντελεστή συσχέτισης χρησιμοποιώντας τη συνάρτηση CORREL.

Μεταχειρισμένος λογισμικόμέσα:επεξεργαστής υπολογιστικών φύλλων MS Excel.

Εργασία 1

Στο παρακάτω τραπέζιπεριέχει δεδομένα για ζευγαρωμένες μετρήσεις δύο ποσοτήτων που έγιναν σε ένα συγκεκριμένο σχολείο. θερμοκρασία αέρα στην τάξη x και το ποσοστό των μαθητών με κρυολόγημα y:

Η εξάρτηση είναι στατιστικής φύσης, καθώς είναι αδύνατο να πούμε με αξιοπιστία, για παράδειγμα, ότι σε θερμοκρασία 15°C στο σχολείο το 5% των μαθητών είναι άρρωστοι και σε θερμοκρασία 20°C - 2%. Εκτός από τη θερμοκρασία, υπάρχουν και άλλοι παράγοντες που επηρεάζουν τα κρυολογήματα, διαφορετικοί για διαφορετικά σχολεία, και είναι αδύνατο να ελεγχθούν όλοι.

Κάντε τα εξής διαδοχικά:

=> εισάγετε δεδομένα Προέχωόπως φαίνεται στο Σχ. 2.12 (βλ. θέμα 9).

=> χρησιμοποιήστε τον Οδηγό γραφήματος για να δημιουργήσετε ένα διάγραμμα διασποράς που εμφανίζει οπτικά την εξάρτηση του πίνακα.

=> απαντήστε στην ερώτηση εάν, με βάση αυτό το σημείο, είναι δυνατόν να υποβληθεί μια υπόθεση σχετικά με την παρουσία μιας γραμμικής συσχέτισης μεταξύ των τιμών.

=> εάν η απάντηση είναι σαφώς αρνητική, τότε διορθώστε τον πίνακα έτσι ώστε η υπόθεση της γραμμικής συσχέτισης να γίνει πιο εύλογη.


Εργασία 2

Καταλήξτε σε έναν πίνακα ζευγαρωμένων μετρήσεων των τιμών ορισμένων μεγεθών μεταξύ των οποίων υπάρχει υποθετική συσχέτιση. Αναλύστε αυτή τη σχέση για την παρουσία μιας γραμμικής συσχέτισης.

Παραδείγματα σχετικών ποσοτήτων περιλαμβάνουν:

Επίπεδο εκπαίδευσης (μετρούμενο, για παράδειγμα, στα έτη σχολικής εκπαίδευσης συνολικά) και επίπεδο μηνιαίου εισοδήματος.

επίπεδο εκπαίδευσηςκαι το επίπεδο της θέσης που κατέχει (για το τελευταίο, καταλήξτε σε μια συμβατική κλίμακα).

Ο αριθμός των υπολογιστών στο σχολείο ανά μαθητή και η μέση βαθμολογία κατά τη δοκιμή για το επίπεδο επάρκειας σε τυπικές τεχνολογίες επεξεργασίας πληροφοριών.

Ο αριθμός των ωρών που αφιερώνει ένας μαθητής γυμνασίου για την εργασία στο σπίτι και ο μέσος όρος βαθμολογίας.

Η ποσότητα του λιπάσματος που εφαρμόζεται στο έδαφος και η απόδοση μιας συγκεκριμένης καλλιέργειας.

Semakin I.G., Henner E.K., Computer Science and ICT, 11

Υποβλήθηκε από αναγνώστες από ιστότοπους του Διαδικτύου

Περιεχόμενο μαθήματος σημειώσεις μαθήματοςυποστήριξη μεθόδων επιτάχυνσης παρουσίασης μαθήματος διαδραστικές τεχνολογίες Πρακτική εργασίες και ασκήσεις αυτοδιαγνωστικά εργαστήρια, προπονήσεις, περιπτώσεις, αποστολές ερωτήσεις συζήτησης εργασιών για το σπίτι ρητορικές ερωτήσεις από μαθητές εικονογραφήσεις ήχου, βίντεο κλιπ και πολυμέσαφωτογραφίες, εικόνες, γραφικά, πίνακες, διαγράμματα, χιούμορ, ανέκδοτα, ανέκδοτα, κόμικς, παραβολές, ρήσεις, σταυρόλεξα, αποσπάσματα Πρόσθετα περιλήψειςάρθρα κόλπα για την περίεργη κούνια σχολικά βιβλία βασικά και επιπλέον λεξικό όρων άλλα Βελτίωση σχολικών βιβλίων και μαθημάτωνδιόρθωση λαθών στο σχολικό βιβλίοενημέρωση ενός τμήματος σε ένα σχολικό βιβλίο, στοιχεία καινοτομίας στο μάθημα, αντικατάσταση ξεπερασμένων γνώσεων με νέες Μόνο για δασκάλους τέλεια μαθήματαημερολογιακό σχέδιο για το έτος· μεθοδολογικές συστάσεις Ολοκληρωμένα Μαθήματα

«Ο Γκάλτον εντυπωσιάστηκε πολύ από τη θεωρία της εξέλιξης του Δαρβίνου, και συγκεκριμένα από την ιδέα ότι τα άτομα που ανήκουν στο ίδιο βιολογικό είδος διαφέρουν μεταξύ τους. Τα ατομικά χαρακτηριστικά που προάγουν την επιβίωση υπόκεινται σε «φυσική επιλογή» και μεταβιβάζονται στους απογόνους. Ο Galton πίστευε ότι η ευφυΐα ήταν ένα χαρακτηριστικό που διέφερε μεταξύ των ατόμων, ήταν σημαντικό για την επιβίωση και κληρονομήθηκε με τον ίδιο τρόπο όπως τα φυσικά χαρακτηριστικά όπως το χρώμα των ματιών ή το ύψος. Συνέλεξε στοιχεία που επιβεβαιώνουν την κληρονομικότητα της νοημοσύνης και δημοσίευσε δύο βιβλία για αυτό το θέμα: Heritary Geniuses (1869) και English Scientists: Nature and Nurture (1874). Το τελευταίο έργο έκανε δημοφιλή τους όρους «φύση» και «ανατροφή» που είναι ευρέως γνωστοί σήμερα. Στο έργο του, ο Χάπτον σημείωσε μια στατιστική τάση ότι η ιδιοφυΐα και η ικανότητα σε ορισμένους τομείς (για παράδειγμα, η ικανότητα για χημεία ή νομικά) μπορούν να εντοπιστούν σε πολλές γενιές μέσα σε μια οικογένεια. Ωστόσο, υποτίμησε την επιρροή του περιβάλλοντος και κατέληξε στο συμπέρασμα ότι η ιδιοφυΐα προκύπτει ως αποτέλεσμα της μετάδοσης κληρονομικών πληροφοριών. Υποστήριξε την άποψή του, ειδικότερα, με το γεγονός ότι η νοημοσύνη στον πληθυσμό έχει κανονική κατανομή. Άλλα κληρονομήσιμα χαρακτηριστικά (όπως το ύψος) έχουν επίσης κανονική κατανομή, και έτσι ο Galton έλαβε αυτό το στατιστικό γεγονός ως δείκτη της επιρροής της κληρονομικότητας.

Μόνο το 1888 ο επιστήμονας κατάφερε να δείξει τη μεγάλη συχνότητα εμφάνισης τέτοιων χαρακτηριστικών όπως η ιδιοφυΐα στις οικογένειες: διατύπωσε τις ιδέες του σε ένα έργο με τίτλο «Συσχετισμός και η μέτρησή του». Πρώτον, ο Galton ανακάλυψε ότι τα δεδομένα μπορούσαν να οργανωθούν σε σειρές και στήλες με έναν ειδικό τρόπο και κατέληξε στο πρωτότυπο της σημερινής «γραφικής διασποράς». Δεύτερον, ο Galton παρατήρησε ότι όταν η «συσχέτιση» ήταν ατελής, ένα μοτίβο άρχισε να εμφανίζεται. Οι γονείς με ύψος άνω του μέσου όρου είχαν ψηλά παιδιά, αλλά πολύ συχνά δεν ήταν τόσο ψηλά όσο η μητέρα και ο πατέρας. Γονείς με ύψος κάτω του μέσου όρου είχαν παιδιά που ήταν κοντά, αλλά όχι τόσο κοντά. Αυτό σημαίνει ότι το ύψος των παιδιών τείνει να μειώνεται ή οπισθοχώρηση, προς τον αριθμητικό μέσο όρο στον πληθυσμό.

Το φαινόμενο της «οπισθοδρόμησης στη μέση τιμή», που αποτελεί απειλή για την εσωτερική εγκυρότητα της έρευνας, είναι μια από τις πιο αξιοσημείωτες ανακαλύψεις του Galton.

Η τρίτη παρατήρηση του Galton ήταν ότι ένα γράφημα του αριθμητικού μέσου όρου για κάθε στήλη του πίνακα διασποράς παρήγαγε μια περισσότερο ή λιγότερο ευθεία γραμμή. Ουσιαστικά, είναι ένας τύπος «γραμμής παλινδρόμησης».

Έτσι, ο Galton ανακάλυψε τα κύρια χαρακτηριστικά της ανάλυσης συσχέτισης.

Αφού διάβασε για το έργο του Galton, ο Karl Pearson συνέχισε την έρευνά του σε αυτόν τον τομέα και ανέπτυξε έναν τύπο για τον υπολογισμό του συντελεστή συσχέτισης. Ονόμασε τον συντελεστή "r", που σημαίνει "παλίνδρομο", προς τιμήν της ανακάλυψης του Galton για την παλινδρόμηση στο μέσο όρο. Ακολουθώντας τον Galton, ο Pearson πίστευε ότι η ανάλυση συσχέτισης επιβεβαιώνει την ιδέα της κληρονομικότητας πολλών ιδιοτήτων που βρίσκονται σε μεμονωμένες οικογένειες». (Αναφέρεται από τον Goodwin D., Research in Psychology. Peter, 2004, σελ. 312-313).

Οι μεταβλητές θεωρούνται συσχετισμένες εάν υπάρχει κάποια σχέση μεταξύ τους. Αυτό υπονοείται από τον ίδιο τον όρο «συσχέτιση» - αμοιβαία σύνδεση, σχέση. Στην περίπτωση άμεσης ή θετικής συσχέτισης, η σχέση είναι τέτοια που οι υψηλές τιμές μιας μεταβλητής συνδέονται με τις υψηλές τιμές μιας άλλης και οι χαμηλές τιμές της πρώτης με τις χαμηλές τιμές της δεύτερης. Μια αρνητική συσχέτιση σημαίνει μια αντίστροφη σχέση. Οι υψηλές τιμές μιας μεταβλητής συνδέονται με τις χαμηλές τιμές μιας άλλης και αντίστροφα. Η σχέση μεταξύ του χρόνου που αφιερώνεται στη μελέτη και των βαθμών είναι ένα παράδειγμα θετικής συσχέτισης. Ένα παράδειγμα αρνητικής συσχέτισης θα ήταν η σχέση μεταξύ χαμένου χρόνου και ΣΔΣ. Ο χαμένος χρόνος μπορεί να είναιεπιχειρησιακά

ορίζεται ως ο αριθμός των ωρών που αφιερώνονται την εβδομάδα σε συγκεκριμένες δραστηριότητες, όπως παίζοντας βιντεοπαιχνίδια ή παρακολούθηση τηλεοπτικών σειρών. Η ισχύς της συσχέτισης φαίνεται από μια ειδική τιμή περιγραφικών στατιστικών - τον «συντελεστή συσχέτισης». Ο συντελεστής συσχέτισης είναι -1,00 για μια άμεση αρνητική συσχέτιση, 0,00 για καμία συσχέτιση και +1,00 για μια τέλεια θετική συσχέτιση. Ο πιο συνηθισμένος συντελεστής συσχέτισης είναι ο r του Pearson. Το Pearson r υπολογίζεται για δεδομένα που λαμβάνονται χρησιμοποιώνταςκλίμακα διαστήματος ή αναλογίας

Ακριβώς όπως ο αριθμητικός μέσος όρος και η τυπική απόκλιση, ο συντελεστής συσχέτισης είναι μια περιγραφική στατιστική. Η τελική ανάλυση καθορίζει εάν μια συγκεκριμένη συσχέτιση είναι σημαντικά μεγαλύτερη (ή μικρότερη) από το μηδέν. Έτσι, για μελέτες συσχέτισης, η μηδενική υπόθεση (H 0) λέει ότι η πραγματική τιμή του r = 0 (δηλαδή, δεν υπάρχει σχέση), και η εναλλακτική υπόθεση (H 1) λέει ότι r ≠ 0. Για να απορρίψετε τη μηδενική υπόθεση είναι να αποφασίσουμε ότι υπάρχει σημαντική σχέση μεταξύ δύο μεταβλητών.

Οικόπεδο διασποράς

Η ισχύς της συσχέτισης μπορεί να ανακαλυφθεί κοιτάζοντας ένα διάγραμμα διασποράς. Είναι μια γραφική αναπαράσταση της σχέσης που υποδεικνύει η συσχέτιση. Στην περίπτωση μιας εντελώς θετικής ή εντελώς αρνητικής συσχέτισης, τα σημεία σχηματίζουν μια ευθεία γραμμή και μια μηδενική συσχέτιση παράγει ένα διάγραμμα διασποράς τύπου (α), τα σημεία του οποίου κατανέμονται τυχαία. Σε σύγκριση με τη μέτρια συσχέτιση (d και e), τα ισχυρά σημεία βρίσκονται πιο κοντά το ένα στο άλλο (b και c). Γενικά, καθώς εξασθενεί η συσχέτιση, τα σημεία στο διάγραμμα διασποράς απομακρύνονται περισσότερο από τη διαγώνιο που συνδέει τα σημεία σε πλήρη συσχέτιση. έξαρση ίση με +1,00 ή -1,00.

α) r = 0 β) r = -0,9 γ) r = +0,9

δ) r = - 0,56 δ) r = +0,61

Τα γραφήματα διασποράς που συζητήθηκαν παραπάνω (εκτός από το α) προσεγγίστηκαν με ευθείες γραμμές, δηλαδή αντανακλούσαν γραμμικές εξαρτήσεις. Ωστόσο, δεν είναι όλες οι σχέσεις γραμμικές και ο υπολογισμός του r του Pearson για μια μη γραμμική περίπτωση δεν θα βοηθήσει στην αποκάλυψη της φύσης μιας τέτοιας σχέσης. Το παρακάτω σχήμα δείχνει ένα υποθετικό παράδειγμα της σχέσης μεταξύ διέγερσης και απόδοσης εργασίας, απεικονίζοντας τον νόμο Yerkes-Dodson: οι σύνθετες εργασίες εκτελούνται καλά σε μέτρια επίπεδα διέγερσης, αλλά κακώς σε πολύ χαμηλά και πολύ υψηλά επίπεδα. Το διάγραμμα διασποράς δείχνει ότι τα σημεία πέφτουν κατά μήκος μιας συγκεκριμένης καμπύλης, αλλά αν προσπαθήσουμε να εφαρμόσουμε γραμμική συσχέτιση θα φτάσουμε το r κοντά στο μηδέν.

Κατά τη διεξαγωγή έρευνας συσχέτισης, είναι σημαντικό να λαμβάνονται υπόψη άτομα των οποίων οι βαθμολογίες εμπίπτουν σε ένα ευρύ φάσμα. Ο περιορισμός του εύρους μιας ή και των δύο μεταβλητών μειώνει τη συσχέτιση. Ας υποθέσουμε ότι μελετάμε τη σχέση μεταξύ της ΣΔΣ και των ακαδημαϊκών επιδόσεων σε ένα πανεπιστήμιο (αξιολογείται από τη μέση βαθμολογία που έλαβαν οι πρωτοετείς φοιτητές στο τέλος του έτους). Στο Σχ. α) δείχνει πώς μπορεί να μοιάζει ένα διάγραμμα διασποράς σε μια μελέτη 25 μαθητών. Ο συντελεστής συσχέτισης είναι +0,87. Αν όμως μελετήσεις αυτή τη σχέση απολίνωση χρησιμοποιώντας το παράδειγμα μαθητών που έλαβαν μέση βαθμολογία στο σχολείο 4,5 και άνω, t o η συσχέτιση θα αλλάξει, πέφτει στο +0,27.

α) r = 0,87 β) r = 0,27

Συντελεστής προσδιορισμού - g 2

Είναι σημαντικό να έχετε κατά νου ότι είναι αρκετά εύκολο λανθασμένοςκατανοήστε την έννοια μιας συγκεκριμένης τιμής Pearson r Εάν είναι +0,70, τότε η σχέση είναι πράγματι σχετικά ισχυρή, αλλά μην νομίζετε ότι το +0,70 σχετίζεται με κάποιο τρόπο με το 70%,και σε αυτή την περίπτωση η σχέση εδραιώνεται στο 70%. Αυτό δεν είναι αλήθεια. Για την ερμηνεία της τιμής συσχέτισης, θα πρέπει να χρησιμοποιηθεί ο συντελεστής προσδιορισμού (r 2). Βρίσκεται τετραγωνίζοντας το r και επομένως η τιμή του δεν είναι ποτέ αρνητική. Αυτός ο συντελεστής ορίζεται επίσημα ως ο βαθμός μεταβλητότητας σε μια μεταβλητή συσχέτισης που προκαλείται από τη μεταβλητότητα σε μια άλλη μεταβλητή. Ας το εξηγήσουμε αυτό με ένα συγκεκριμένο παράδειγμα.

Διεξάγεται μια μελέτη στην οποία μετράται το επίπεδο της συναισθηματικής κατάθλιψης και η μέση βαθμολογία σε 100 συμμετέχοντες. Δοκιμάζουμε τη σχέση μεταξύ των δύο μεταβλητών και βρίσκουμε μια αρνητική συσχέτιση: όσο υψηλότερο είναι το επίπεδο της κατάθλιψης, τόσο χαμηλότερη είναι η μέση βαθμολογία και αντίστροφα, όσο χαμηλότερη είναι η κατάθλιψη, τόσο υψηλότερη είναι η μέση βαθμολογία. Εξετάστε δύο τιμές συσχέτισης που μπορούν να ληφθούν από αυτήν τη μελέτη - -1,00 και -0,50. Ο συντελεστής προσδιορισμού θα είναι ίσος με 1,00 και 0,25, αντίστοιχα. Για να κατανοήσετε τη σημασία αυτών των τιμών, σκεφτείτε πρώτα ότι η μέση βαθμολογία 100 ατόμων που μελετήθηκαν πιθανότατα θα κυμαίνεται από 3,0 έως 5,0. Ως ερευνητές, θέλουμε να μάθουμε ο λόγος για μια τέτοια μεταβλητότητα– γιατί ένα άτομο παίρνει 3,2 βαθμούς και άλλο 4,4 κλπ. Θέλουμε δηλαδή να μάθουμε τι προκαλεί ατομικές διαφορές στις ΣΔΣ? Στην πραγματικότητα, αυτό μπορεί να οφείλεται σε διάφορους παράγοντες: συνήθειες μελέτης, γενικό επίπεδο νοημοσύνης, συναισθηματική σταθερότητα, τάση για επιλογή εύκολων θεμάτων για μελέτη κ.λπ. Όπως φαίνεται από τις βαθμολογίες του τεστ κατάθλιψης, Η υποθετική μας μελέτη εξετάζει έναν από αυτούς τους παράγοντες- συναισθηματική σταθερότητα, σολ 2 δείχνει πόση μεταβλητότητα στις μέσες βαθμολογίες μπορεί να αποδοθείκατευθείαν με κατάθλιψη.Στην πρώτη περίπτωση, όπου r = -1,00 και r 2 = 1,00, μπορούμε να συμπεράνουμε ότι το 100% της μεταβλητότητας στις μέσες βαθμολογίες οφείλεται στη μεταβλητότητα των βαθμολογιών κατάθλιψης. Επομένως, μπορούμε να πούμε ότι το 100% των διαφορών μεταξύ των μέσων βαθμολογίας (3,2 και 4,4 κ.λπ.) οφείλονται στην κατάθλιψη. Σε μια πραγματική μελέτη, ένα τέτοιο αποτέλεσμα, φυσικά, δεν μπορεί να επιτευχθεί. Στη δεύτερη περίπτωση, όπου r = -0,5 και r 2 = 0,25, μόνο το ένα τέταρτο (25%) της διακύμανσης στη μέση βαθμολογία θα οφείλεται σε κατάθλιψη. Το υπόλοιπο 75% οφείλεται σε άλλους παράγοντες παρόμοιους με αυτούς που αναφέρονται παραπάνω. Εν ολίγοις, ο συντελεστής προσδιορισμού είναι καλύτερο μέτρο της δύναμης μιας σχέσης από το r του Pearson.

Ανάλυση Παλινδρόμησης: Κάνοντας Υποθέσεις

Το πιο σημαντικό χαρακτηριστικό των μελετών συσχέτισης είναι η δυνατότητα αν υπάρχει ισχυρή συσχέτιση κάνουν υποθέσεις για τη μελλοντική συμπεριφορά. Η συσχέτιση μεταξύ δύο μεταβλητών καθιστά δυνατή, με βάση τις τιμές της μίας από αυτές, την πρόβλεψη των τιμών της άλλης. Αυτό είναι εύκολο να φανεί χρησιμοποιώντας ένα παράδειγμα με μέσο όρο βαθμολογίας. Εάν γνωρίζουμε ότι ο χρόνος που αφιερώνεται στη μελέτη και η ΣΔΣ συσχετίζονται και ότι κάποιος μελετά 45 ώρες την εβδομάδα, μπορούμε να προβλέψουμε με ακρίβεια ένα σχετικά υψηλό ΣΔΣ για αυτόν τον μαθητή. Ομοίως, ένα υψηλό GPA θα προβλέψει τον χρόνο που αφιερώνετε στη μελέτη. Η λήψη υποθέσεων με βάση τις μελέτες συσχέτισης ονομάζεται ανάλυση παλινδρόμησης.

Στο Σχ. δείχνει ένα διάγραμμα διασποράς για: α) χρόνο που αφιερώνεται στη μελέτη και ΣΔΣ και β) χαμένο χρόνο και ΣΔΣ. Κάθε γράφημα εμφανίζει επίσης μια γραμμή παλινδρόμησης, η οποία χρησιμοποιείται για να κάνει υποθέσεις. Η γραμμή παλινδρόμησης ονομάζεται επίσης «βέλτιστη γραμμή»: αντιπροσωπεύει ο καλύτερος δυνατός τρόπος για να συνοψίσουμε τα σημεία ενός διαγράμματος διασποράς. Αυτό σημαίνει ότι οι απόλυτες τιμές των κάθετων αποστάσεων μεταξύ κάθε σημείου του γραφήματος και της γραμμής παλινδρόμησης είναι ελάχιστες.

Η γραμμή παλινδρόμησης υπολογίζεται χρησιμοποιώντας τον τύπο Υ = ένα + σι X, όπου a είναι το σημείο στο οποίο η ευθεία τέμνει τον άξονα Υ (δηλαδή, το τμήμα που αποκόπτεται στον άξονα Υ), α σι– αυτή είναι η γωνία κλίσης της ευθείας ή η σχετική κλίση της. Το X είναι μια γνωστή ποσότητα και το Y είναι η ποσότητα που προσπαθούμε να προβλέψουμε Γνωρίζοντας 1) την ισχύ της συσχέτισης και 2) την τυπική απόκλιση για τις συσχετισμένες μεταβλητές, μπορούμε να υπολογίσουμε την ποσότητα. σι, γνωρίζοντας 1) την αξία σικαι 2) μπορούν να βρεθούν οι μέσες τιμές των συσχετισμένων μεταβλητών ΕΝΑ.

Η ανάλυση παλινδρόμησης χρησιμοποιεί μια εξίσωση παλινδρόμησης για να προβλέψει μια τιμή Y (όπως το GPA) με βάση μια τιμή X (όπως ο χρόνος που αφιερώνεται στη μελέτη). Το Y ονομάζεται μερικές φορές κριτήριαλμεταβλητή και X - κατηγορούμενο-σχισμένομεταβλητός. Ωστόσο, για να γίνουν ακριβείς υποθέσεις, η συσχέτιση πρέπει να είναι πολύ πάνω από το μηδέν. Όσο υψηλότερη είναι η συσχέτιση, τόσο πιο κοντά θα είναι τα σημεία διασποράς στη γραμμή παλινδρόμησης και τόσο πιο σίγουροι θα είστε ότι οι υποθέσεις σας είναι σωστές. Έτσι, το πρόβλημα περιορισμού εύρους που αναφέρθηκε προηγουμένως, το οποίο μειώνει τη συσχέτιση, μειώνει επίσης την εγκυρότητα των προβλέψεων.

Ένα γράφημα εξίσωσης παλινδρόμησης δείχνει πώς να κάνετε προβλέψεις χρησιμοποιώντας μια γραμμή παλινδρόμησης.

Για παράδειγμα, ποιος μέσος όρος πρέπει να αναμένεται από έναν μαθητή που ξοδεύει 34 ώρες την εβδομάδα μελετώντας. Για να λάβουμε την απάντηση, σχεδιάζουμε κάθετες από τον άξονα Χ στη γραμμή παλινδρόμησης και, στη συνέχεια, από το σημείο τομής στον άξονα Y Η τιμή του σημείου στον άξονα Y θα είναι η εκτιμώμενη τιμή (θυμηθείτε ότι η ορθότητα της υπόθεσης. εξαρτάται από την ισχύ της συσχέτισης). Έτσι, 40 ώρες χρόνου μελέτης θα προέβλεπαν ΣΔΣ 3,4 και χαμένες 41 ώρες θα προέβλεπαν ΣΔΣ λίγο πάνω από 2,3. Με τη χρήση τύπουςΗ παλινδρόμηση μπορεί να υπολογίσει πιο ακριβείς τιμές και να κάνει πιο ακριβείς προβλέψεις.

Θα πρέπει να γνωρίζετε ότι η ανάλυση παλινδρόμησης χρησιμοποιείται στις περισσότερες μελέτες για τις οποίες μαθαίνουμε από τα μέσα ενημέρωσης.

Για παράδειγμα, μπορεί να συναντήσουμε μια αναφορά μιας μελέτης για «παράγοντες κινδύνου για καρδιακή προσβολή», η οποία, με βάση μια σημαντική συσχέτιση μεταξύ καπνίσματος και καρδιακών παθήσεων, καταλήγει στο συμπέρασμα ότι οι βαρείς καπνιστές είναι πιο πιθανό να αναπτύξουν καρδιαγγειακή νόσο από τους μη καπνιστές. Αυτό σημαίνει ότι το κάπνισμα είναι προγνωστικός παράγοντας καρδιακών παθήσεων. Με βάση μια άλλη μελέτη που εξετάζει το «προφίλ ενός συζύγου που κακοποιεί», μπορεί να συναχθεί το συμπέρασμα ότι η πιθανότητα μιας τέτοιας συμπεριφοράς αυξάνεται εάν ο δράστης είναι άνεργος. Αυτό προκύπτει από τη συσχέτιση μεταξύ της ανεργίας και της τάσης για καταχρηστική συμπεριφορά. Με βάση την παρουσία συσχέτισης χρησιμοποιώντας ανάλυση παλινδρόμησης, γνωρίζοντας το πρώτο, μπορεί κανείς να κάνει μια υπόθεση για το δεύτερο.

Σκοπός της εργασίας:απόκτηση μιας ιδέας για την εξάρτηση συσχέτισης των ποσοτήτων. κατακτώντας τη μέθοδο υπολογισμού του συντελεστή συσχέτισης χρησιμοποιώντας τη συνάρτηση KOPPEL.
Λογισμικό που χρησιμοποιείται:επεξεργαστής υπολογιστικών φύλλων Microsoft Office Excel.

Εργασία 1

Απαιτείται η διενέργεια υπολογισμών της συσχέτισης μεταξύ της επίδοσης των μαθητών και των επαγγελματικών δαπανών του σχολείου, που περιγράφονται στην § 38 του σχολικού βιβλίου.
1. Συμπληρώστε το υπολογιστικό φύλλο με τα ακόλουθα δεδομένα:

2. Κατασκευάστε ένα διάγραμμα διασποράς της εξάρτησης των ποσοτήτων.

3. Εκτελέστε τη στατιστική συνάρτηση KOPEL, προσδιορίζοντας τα εύρη τιμών στο πλαίσιο διαλόγου: B2:B21 και C2:C21.
4. Γράψτε την τιμή του συντελεστή συσχέτισης.

Εργασία 2

Εκτελέστε υπολογισμούς συσχέτισης της επίδοσης των μαθητών για την παροχή σχολικών βιβλίων και για την παροχή ηλεκτρονικών υπολογιστών, που παρουσιάζονται στον παρακάτω πίνακα.

Εργασία για αυτοτελή συμπλήρωση με θέμα «Εξαρτήσεις συσχέτισης»

Καταλήξτε σε έναν πίνακα ζευγαρωμένων μετρήσεων των τιμών ορισμένων μεγεθών μεταξύ των οποίων υπάρχει υποθετική συσχέτιση. Αναλύστε αυτή την εξάρτηση για την παρουσία μιας γραμμικής συσχέτισης.

      Παραδείγματα σχετικών ποσοτήτων περιλαμβάνουν:
      επίπεδο εκπαίδευσης (μετρούμενο, για παράδειγμα, σε έτη σχολικής φοίτησης συνολικά) και επίπεδο μηνιαίου εισοδήματος·
      επίπεδο εκπαίδευσης και επίπεδο κατεχόμενης θέσης (για το τελευταίο, δημιουργήστε μια συμβατική κλίμακα).
      τον αριθμό των υπολογιστών στο σχολείο ανά μαθητή και τη μέση βαθμολογία του τεστ για το επίπεδο επάρκειας σε τυπικές τεχνολογίες επεξεργασίας πληροφοριών·
      ο αριθμός των ωρών που αφιερώνουν οι μαθητές του γυμνασίου για την εργασία και ο μέσος όρος βαθμολογίας.
      την ποσότητα του λιπάσματος που εφαρμόζεται στο έδαφος και την απόδοση μιας συγκεκριμένης καλλιέργειας.

Σε αυτή την περίπτωση, μπορείτε να ακολουθήσετε δύο τρόπους. Το πρώτο, πιο σοβαρό και πρακτικά χρήσιμο: δεν βρίσκετε απλώς μια υποθετική συσχέτιση, αλλά βρίσκετε και πραγματικά δεδομένα σχετικά με αυτήν στη βιβλιογραφία. Ο δεύτερος τρόπος είναι πιο εύκολος: το αντιμετωπίζετε ως παιχνίδι για να καταλάβετε τι είναι η συσχέτιση και να αναπτύξετε τις τεχνικές δεξιότητες για να την αναλύσετε και να βρείτε τα αντίστοιχα δεδομένα, προσπαθώντας να το κάνετε με τον πιο εύλογο τρόπο.