Δευτέρα, 4 Φεβρουαρίου 2013

Μεθοδολογία της Στατιστικής Έρευνας και λήψης αποφάσεων

      ΕΘΝΙΚΗ ΣΧΟΛΗ ΤΟΠΙΚΗΣ ΑΥΤΟΔΙΟΙΚΗΣΗΣ
             
ΕΙΔΙΚΗ ΦΑΣΗ ΣΠΟΥΔΩΝ

ΤΜΗΜΑΤΑ:
ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ

ΟΙΚΟΝΟΜΙΚΗΣ ΔΙΑΧΕΙΡΙΣΗΣ

ΜΕΤΑΝΑΣΤΕΥΤΙΚΗΣ ΠΟΛΙΤΙΚΗΣ

ΠΟΛΙΤΙΚΗΣ ΠΡΟΣΤΑΣΙΑΣ

             Επιστημονικός Υπεύθυνος: Παπαγεωργίου Γεώργιος



ΜΕΘΟΔΟΛΟΓΙΑ ΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΕΥΝΑΣ ΚΑΙ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ
Ο&Δ-Μ4.1, ΟικΔ-Μ4.1, ΜΠ-Μ4.1, ΠΠ-Μ4.1



Συγγραφή:           Δρ Ψαρόπουλος Xρήστος





1. Εισαγωγή

1.1 Βασικές έννοιες

Στατιστική, είναι η επιστήμη που εφαρμόζεται σε όλους σχεδόν τους επιστημονικούς κλάδους, από τις φυσικές και τις κοινωνικές επιστήμες έως ακόμη και τις κλασικές-θεωρητικές σπουδές και προσπαθεί να εξάγει γνώση μέσα από εμπειρικά δεδομένα. Έχει ως βασικό της αντικείμενο δηλαδή, τη συλλογή, την οργάνωση, την ομαδοποίηση, την ανάλυση και την ερμηνεία των αριθμητικών δεδομένων, με σκοπό τη διεξαγωγή συμπερασμάτων, δηλαδή την έρευνα. Ειδικότερα στους τομείς της διοίκησης και της οικονομίας η στατιστική βρίσκει σημαντική εφαρμογή στη λήψη κρίσιμων αποφάσεων και στο σχεδιασμό προβλέψεων και τάσεων. Μερικές επιστήμες χρησιμοποιούν τη στατιστική τόσο εκτεταμένα ώστε έχουν ειδική ορολογία. Μερικοί από αυτούς είναι: η βιοστατιστική, η δημογραφία, η οικονομετρία, η στατιστική φυσική, η επιχειρηματική στατιστική κ.ά..
Η εφαρμοσμένη στατιστική ανάλογα με τον τρόπο που χρησιμοποιεί τα δεδομένα, μπορεί να διαιρεθεί σε δύο βασικούς τομείς: την περιγραφική στατιστική και την επαγωγική στατιστική.
Στο σημείο αυτό, πριν αναλυθούν λεπτομερέστερα οι έννοιες της περιγραφικής και της επαγωγικής στατιστικής, κρίνεται σημαντικό να δοθούν συγκεκριμένοι ορισμοί που θα βοηθήσουν στην καλύτερη κατανόηση των θεμάτων που ακολουθήσουν.
Με τον όρο δεδομένα, ονομάζουμε ένα σύνολο τιμών που μπορεί να προκύψουν από παρατηρήσεις, μετρήσεις και καταγραφές. Αποτελούν την “πρώτη ύλη”, το ακατέργαστο υλικό της στατιστικής και η συλλογή τους μπορεί να γίνει από τις ακόλουθες πηγές:
·         Από διάφορους οργανισμούς, Δημόσιους (όπως η Εθνική Στατιστική Υπηρεσία), Διεθνείς (όπως η Eurostat), Ιδιωτικούς (όπως οι εταιρείες δημοσκοπήσεων), από διάφορα Ινστιτούτα Ερευνών κ.λπ., που διατηρούν και ενημερώνουν αρχεία δεδομένων ανάλογα με το αντικείμενό τους,
·         Μέσα από Δημοσκοπήσεις, όταν τα δεδομένα που απατούνται για ανάλυση δε περιέχονται στα αρχεία που διατηρούν και ενημερώνουν οι οργανισμοί, τότε οι δημοσκοπήσεις στα κατάλληλα άτομα, μπορούν να παρέχουν τα απαραίτητα δεδομένα,
·         Από Εξωτερικές Πηγές, όπως βάσεις δεδομένων, ερευνητικά συγγράμματα, βιβλιογραφία, δημοσιευμένους απολογισμούς, εκθέσεις κ.ά., και τέλος
·         Μέσα από πειραματικές διαδικασίες. Στο χώρο της ιατρικής επιστήμης για παράδειγμα, όπου συχνά υπάρχουν περιπτώσεις που τα απαραίτητα δεδομένα και οι κατάλληλες παρατηρήσεις, είναι δυνατόν να προκύψουν μόνο μέσα από τις πειραματικές διαδικασίες.
Με τον όρο Πληθυσμός, εννοούμε το σύνολο των υπό μελέτη υποκειμένων, αντικειμένων, γεγονότων, ή εκβάσεων μιας διαδικασίας, ενός πειράματος ή ενός φαινομένου, που έχουν τουλάχιστον ένα κοινό χαρακτηριστικό και μπορεί να οριστεί με σαφήνεια και χωρίς αμφιβολία. Ως παραδείγματα πληθυσμών θα μπορούσε κανείς να αναφέρει, το σύνολο των κατοίκων μιας χώρας, το σύνολο των μαθητών που πέτυχαν στις εξετάσεις, το σύνολο των πτηνών που προσβλήθηκαν από συγκεκριμένη νόσο κ.ά.. Όταν κατά τη διαδικασία συλλογής δεδομένων καταγράφεται ο αριθμός και οι ιδιότητες όλων των μελών ενός πληθυσμού, (χωρίς να εννοούμε απαραίτητα ανθρώπους όπως φαίνεται και από τα παραπάνω παραδείγματα), τότε αναφερόμαστε στη μέθοδο της Απογραφής. Χαρακτηριστικά παραδείγματα απογραφής, είναι η απογραφή του πληθυσμού μιας χώρας, η απογραφή των εμπορευμάτων ενός καταστήματος ή αποθήκης, απογραφή περιουσίας κ.ά.. Επειδή η διαδικασία της απογραφής, πολλές φορές είναι δύσκολο να πραγματοποιηθεί, είτε διότι για τη διεξαγωγή της απαιτείται πολύς χρόνος, είτε διότι έχει μεγάλο κόστος, είτε διότι είναι πολύ πιθανόν να γίνουν σφάλματα, τότε χρησιμοποιείται η μέθοδος της Δειγματοληψίας. Με τη μέθοδο αυτή, επιλέγεται ένα τμήμα του υπό μελέτη πληθυσμού, με τέτοιο τρόπο ώστε να τον αντιπροσωπεύει. Το τμήμα αυτό ονομάζεται δείγμα και οι τεχνικές που ακολουθούνται προκειμένου να επιλεγεί ένα αντιπροσωπευτικό δείγμα, ονομάζονται τεχνικές δειγματοληψίας και αναλύονται σε κεφάλαιο που ακολουθεί.
Οι ιδιότητες των μελών/αντικειμένων ενός πληθυσμού ονομάζονται χαρακτηριστικά. Για παράδειγμα, το φύλο, η ηλικία, το βάρος, το χρώμα των ματιών, η θερμοκρασία, η τιμή της χοληστερίνης, η πρόσληψη θερμίδων κ.λπ.. Το σύνολο των τιμών ενός χαρακτηριστικού σε όλα στα αντικείμενα ενός πληθυσμού, ονομάζεται μεταβλητή. Οι μεταβλητές μπορούν να διακριθούν στις εξής κατηγορίες:
Κατηγορικές ή ονομαστικές μεταβλητές. Κατηγορικές μεταβλητές ονομάζονται οι μεταβλητές οι οποίες απλώς ομαδοποιούν τα στοιχεία ενός πληθυσμού σε διαφοροποιημένες και αμοιβαία αποκλειόμενες μεταξύ τους κατηγορίες. Δεν επιδέχονται καμία μέτρηση, διάταξη, ιεράρχηση ή πράξη ανάμεσα στις κατηγορίες τους. Σε κάθε κατηγορία συνήθως αντιστοιχίζεται ένας αριθμός. Η ύπαρξη των αριθμών έχει απλώς ρόλο κωδικοποίησης, δηλαδή κάτι σαν ετικέτα. Παραδείγματα κατηγορικών μεταβλητών είναι: το χρώμα μαλλιών, το θρήσκευμα, η ομάδα αίματος, το νοσηλευτικό ίδρυμα κ.ά.. Όταν οι κατηγορίες που περιλαμβάνει μια ονομαστική μεταβλητή είναι μόνο δύο, τότε έχουμε την πιο απλή περίπτωση της και αναφερόμαστε στις δίτιμες κατηγορικές μεταβλητές. Παραδείγματα δίτιμων κατηγορικών μεταβλητών είναι: το φύλο (0=άνδρας, 1=γυναικά), η παρουσία ή η απουσία νόσου (0=όχι, 1=ναι) κ.ά.. Ειδικότερα για την περίπτωση των δίτιμων κατηγορικών μεταβλητών, η πραγματοποίηση πράξεων έχει κάποιο νόημα, αφού το άθροισμα των κατηγοριών υπολογίζει τον αριθμό των μονάδων (δηλαδή της κατηγορίας που έχει κωδικοποιηθεί με 1) και ο υπολογισμός του μέσου όρου δίνει το ποσοστό της κατηγορίας με κωδικό 1 στο δείγμα.
Διατεταγμένες μεταβλητές. Διατεταγμένες μεταβλητές, ονομάζονται οι κατηγορικές μεταβλητές των οποίων οι κατηγορίες, επιδέχονται κάποιας μορφής διάταξη ή ιεράρχηση. Για παράδειγμα η κατάσταση της υγείας ενός ατόμου θα μπορούσε να διαβαθμιστεί στις ακόλουθες κατηγορίες: «Πολύ καλή», «Καλή», «Μέτρια», «Κακή», «Πολύ κακή». Ο βαθμός συμφωνίας ενός ατόμου σε μια κατάσταση θα μπορούσε να διαβαθμιστεί ως εξής: «Συμφωνώ απόλυτα», «Συμφωνώ», «Ουδέτερος», «Διαφωνώ», «Διαφωνώ απόλυτα». Όπως και στις κατηγορικές μεταβλητές έτσι και εδώ, σε κάθε κατηγορία αντιστοιχίζεται ένας αριθμός. Η ύπαρξη τους έχει ρόλο κωδικοποίησης, δηλαδή κάτι σαν ετικέτα, χωρίς να επιτρέπει την πραγματοποίηση πράξεων μεταξύ τους. Εξαίρεση αποτελεί ο υπολογισμός της επικρατούσας τιμής, που ουσιαστικά δείχνει τον κωδικό της κατηγορίας, που εμφανίζεται τις περισσότερες φορές στο δείγμα.
Ποσοτικές μεταβλητές. Ποσοτικές μεταβλητές ονομάζονται οι μεταβλητές που αντιστοιχούν σε μετρήσιμα μεγέθη και οι τιμές τους εκφράζονται αποκλειστικά με αριθμούς Παραδείγματα τέτοιων μεταβλητών είναι: το ύψος, το βάρος, η χοληστερίνη, οι θερμίδες κ.λπ.. Στις ποσοτικές μεταβλητές επιτρέπεται η ιεράρχηση μεταξύ των τιμών τους, οι αποστάσεις ή τις διαφορές ανάμεσα στις θέσεις δύο μονάδων/τιμών/φαινομένων του πληθυσμού είναι συγκρίσιμες και για το λόγο αυτό επιτρέπεται η πραγματοποίηση πράξεων, καθώς και ο υπολογισμός διαφόρων στατιστικών μέτρων. Επίσης, επιτρέπεται να γνωρίζουμε την απόλυτη θέση τους, με την προϋπόθεση ότι η αρχή της κλίμακας είναι γνωστή και δεδομένη. Οι ποσοτικές μεταβλητές με τη σειρά τους μπορούν να διακριθούν σε διακριτές και συνεχείς.
Οι Διακριτές ποσοτικές μεταβλητές, είναι οι ποσοτικές μεταβλητές που μπορούν να λάβουν πεπερασμένο μόνο πλήθος τιμών και συνήθως οι τιμές τους εκφράζονται με ακέραιους αριθμούς. Παραδείγματα διακριτών ποσοτικών μεταβλητών είναι: ο αριθμός των μελών μιας οικογένειας, ο αριθμός των δωματίων ενός σπιτιού, ο αριθμός των κλινών σε ένα νοσοκομείο κ.λπ..
Οι Συνεχείς ποσοτικές μεταβλητές είναι οι ποσοτικές μεταβλητές που θεωρητικά μπορούν να πάρουν οποιαδήποτε τιμή μεταξύ δύο πραγματικών αριθμών, δηλαδή μπορούν να πάρουν οποιαδήποτε τιμή μέσα σε ένα διάστημα (α, β). Παραδείγματα συνεχών ποσοτικών μεταβλητών είναι η ηλικία, το βάρος, το ύψος κ.λπ..
Η Περιγραφική Στατιστική είναι εκείνος ο τομέας της στατιστικής που ασχολείται με τη συλλογή την οργάνωση την ομαδοποίηση και την παρουσίαση των δεδομένων. Οι συνηθέστερες τεχνικές που χρησιμοποιούνται στην περιγραφική στατιστική για την ομαδοποίηση και την παρουσίαση των δεδομένων είναι:
  • Οι Γραφικές Παραστάσεις, στις οποίες χρησιμοποιούνται διαγράμματα, όπως τα ραβδογράμματα, τα ιστογράμματα, τα θηκογράμματα κ.λπ.,
  • Οι Πινακοποιήσεις, στις οποίες χρησιμοποιούνται πίνακες, όπως οι πίνακες συχνότητας κ.λπ. και
·         Οι Συγκεντρωτικές Παρουσιάσεις δεδομένων, στις οποίες χρησιμοποιούνται συγκεκριμένα στατιστικά μέτρα που είτε είναι μέτρα κεντρικής τάσης (ή θέσης), όπως ο αριθμητικός μέσος, η επικρατούσα τιμή και η διάμεσος, είτε είναι μέτρα μεταβλητότητας, όπως η διακύμανση, η τυπική απόκλιση, το εύρος κ.ά..
Τα βήματα που συνήθως ακολουθούνται στην περιγραφική στατιστική είναι: η συλλογή των δεδομένων, η κατηγοριοποίησή, η ομαδοποίηση και η παρουσίαση τους. Τέλος, εάν υπάρχουν “αρκετά” δεδομένα, τότε πραγματοποιείται και η χρήση της επαγωγικής στατιστικής, προκειμένου να γίνουν οι γενικεύσεις των συμπερασμάτων που προέκυψαν από την περιγραφική στατιστική.
Η Επαγωγική Στατιστική είναι εκείνος ο τομέας της εφαρμοσμένης στατιστικής, που ασχολείται με τη γενίκευση των συμπερασμάτων της περιγραφικής στατιστικής, που προέκυψαν από τμήμα του συνόλου που ερευνάται, σε ολόκληρο το σύνολο αυτό. Η επαγωγική στατιστική με τη σειρά της, μπορεί να διακριθεί στην εκτιμητική στατιστική και στον έλεγχο υποθέσεων.
Η εκτιμητική στατιστική αντιμετωπίζει το πρόβλημα πως από τα δεδομένα ενός δείγματος είναι δυνατόν να υπολογιστεί (εκτιμηθεί) η τιμή μιας ή περισσοτέρων αγνώστων παραμέτρων του πληθυσμού και μπορεί να είναι σημείου και διαστήματος. Στις σημειακές εκτιμήσεις, χρησιμοποιούνται οι κατάλληλες στατιστικές συναρτήσεις και ένα δείγμα από τον υπό διερεύνηση πληθυσμό, προκειμένου να πραγματοποιηθεί η εκτίμηση μιας άγνωστης πληθυσμιακής παραμέτρου και για κάθε παράμετρο παρέχεται μία μόνο τιμή. Το μειονέκτημα των σημειακών εκτιμήσεων είναι ότι διαφορετικά δείγματα, δίνουν διαφορετικές τιμές για την αντίστοιχη πληθυσμιακή παράμετρο. Αντίθετα, στις εκτιμήσεις διαστήματος χρησιμοποιείται ένα δείγμα από τον πληθυσμό, προκειμένου να εκτιμηθεί ένα διάστημα πιθανών τιμών, εντός του οποίου μπορεί να βρίσκεται η άγνωστη πληθυσμιακή παράμετρος.
Κατά τον έλεγχο υποθέσεων όπως και στην εκτιμητική επαγωγική στατιστική, γίνεται προσπάθεια εκτίμησης άγνωστων πληθυσμιακών παραμέτρων μέσα από συγκεκριμένα δείγματα και με τη χρήση κατάλληλων στατιστικών συναρτήσεων, πραγματοποιώντας όμως τον έλεγχο συγκεκριμένων υποθέσεων, που αφορούν τις υπό διερεύνηση πληθυσμιακές παραμέτρους. Αναλυτικότερα, αντιμετωπίζεται το πρόβλημα πως από τα δεδομένα ενός δείγματος, μπορούμε να συμπεράνουμε αν γίνεται αποδεκτή ή ορθότερα αν πρέπει να απορριφθεί ή όχι μια υπόθεση, που διατυπώνεται για την τιμή κάποιας πληθυσμιακής παραμέτρου.

1.2 Έρευνα

Έρευνα είναι η συστηματική και αναλυτική διαδικασία διερεύνησης ενός προβλήματος, που έχει ως σκοπό την ερμηνεία και την επίλυσή του. Ο όρος αυτός, χρησιμοποιείται επίσης για να περιγράψει τη συλλογή πληροφοριών σχετικά με κάποιο συγκεκριμένο θέμα, που συνδέεται με την παραγωγή και την απόκτηση γνώσης.
Η θεμελιώδης ή βασική έρευνα, έχει ως πρωταρχικό της σκοπό την προαγωγή της γνώσης και τη θεωρητική κατανόηση των σχέσεων μεταξύ των μεταβλητών. Έχει διερευνητικό χαρακτήρα και πολύ συχνά καθοδηγείται από την περιέργεια τα ενδιαφέροντα και τη διαίσθηση του ερευνητή. Η βασική έρευνα διεξάγεται χωρίς να υπάρχει κάποιο “πρακτικό τέλος” στη σκέψη του ερευνητή και οι όροι “βασική” και “θεμελιώδης” υποδεικνύουν ότι μέσα από τη δημιουργία υποθέσεων και θεωριών, η βασική έρευνα παρέχει τη βάση και τη θεμελίωση για περαιτέρω και πολλές φορές εφαρμοσμένη έρευνα. Λόγω του ότι από τη βασική έρευνα δεν υπάρχει εγγύηση για βραχυπρόθεσμα πρακτικά αποτελέσματα, οι ερευνητές μπορεί να αντιμετωπίσουν δυσκολίες στην εξασφάλιση χρηματοδότησης για τη διεξαγωγή της. Η έρευνα όμως τελικά, είναι υποσύνολο της εφεύρεσης.
Υπάρχουν οι εξής μορφές έρευνας:
·         Η διερευνητική, η οποία διεξάγεται κυρίως επειδή ένα πρόβλημα δεν έχει οριστεί πλήρως ή με σαφήνεια. Αυτού του είδους η έρευνα βοηθάει στον καθορισμό του βέλτιστου ερευνητικού σχεδιασμού, στη μέθοδο συλλογής των δεδομένων και στην επιλογή των υποκειμένων που θα συμμετέχουν στην έρευνα. Πολύ συχνά στηρίζεται σε δευτερογενή έρευνα, όπως στη βιβλιογραφική αναζήτηση, σε διάφορες ποιοτικές προσεγγίσεις όπως ανεπίσημες συζητήσεις με καταναλωτές, εργαζόμενους, διοίκηση, ανταγωνιστές κ.ά., αλλά και σε άλλες πιο επίσημες προσεγγίσεις όπως, αναλυτικές συνεντεύξεις, μελέτες περιπτώσεων, ή και σε πιλοτικές έρευνες. Τα αποτελέσματα αυτού του είδους των ερευνών, συνήθως από μόνα τους δεν είναι χρήσιμα στη λήψη αποφάσεων, αλλά μπορούν να παρέχουν σημαντική γνώση για μια δεδομένη κατάσταση.
·         Η Κατασκευαστική, που αποτελεί την πιο συνηθισμένη ερευνητική μέθοδο για την επιστήμη των Η/Υ και με την οποία συνήθως αναπτύσσονται λύσεις σε προβλήματα. Ονομάζεται κατασκευαστική διότι συνεισφέρει στη δημιουργία μιας νέας θεωρίας, ενός νέου αλγορίθμου, μοντέλου, λογισμικού κ.λπ.. Αυτού του είδους η έρευνα απαιτεί κάποιας μορφής επικύρωση και επιβεβαίωση, η οποία όμως δε χρειάζεται να είναι τόσο εμπειρικά θεμελιωμένη όσο η διερευνητική.
·         Η Εμπειρική, η οποία ελέγχει την επιτευξιμότητα μιας λύσης, με τη χρήση εμπειρικής μαρτυρίας και αποδείξεων. Εμπειρική ονομάζεται οποιαδήποτε έρευνα στηρίζει τα ευρήματά της στην άμεση ή έμμεση παρατήρηση. Ο ερευνητής προσπαθεί να περιγράψει με ακρίβεια την αλληλεπίδραση μεταξύ των ανθρώπινων αισθήσεων (ή συγκεκριμένου οργάνου) και της υπό παρακολούθησης οντότητας. Στην περίπτωση που εμπειρική έρευνα περιλαμβάνει κάποιο όργανο, ο ερευνητής ρυθμίζει τη λειτουργία του πάνω σε γνωστά πρότυπα αντικειμένων και στη συνέχεια τεκμηριώνει τα αποτελέσματα, πριν την εφαρμογή τους σε άγνωστα αντικείμενα.
  • Η Αιτιώδης έρευνα, η οποία εξετάζει τις επιπτώσεις μίας μεταβλητής πάνω σε μία άλλη. Η έρευνα αυτή χρησιμοποιείται για να μετρήσει τον αντίκτυπο που μπορεί να έχει μια συγκεκριμένη αλλαγή στην κοινωνία, την αγορά και την ανθρώπινη συμπεριφορά. Επιτρέπει στους ερευνητές να διατυπώσουν υποθετικά σενάρια πάνω στα οποία ένας οργανισμός μπορεί να στηρίξει τα επιχειρησιακά του σχέδια.  Αυτή η μορφή έρευνας είναι αρκετά σύνθετη και ο ερευνητής δεν μπορεί να είναι απόλυτα σίγουρος ότι δεν υπάρχουν ή ότι δεν θα υπάρξουν και άλλοι παράγοντες που θα επηρεάσουν την αιτιώδη σχέση, ιδιαίτερα όταν πραγματεύεται την ανθρώπινη συμπεριφορά, την παρακίνησή κλπ. Υπάρχουν συχνά πολύ βαθύτερα ψυχολογικά αίτια που ενδεχομένως ούτε ο ίδιος ο αποκρινόμενος να γνωρίζει. Συνοψίζοντας η αιτιώδης έρευνα είναι ένας τρόπος να προβλέψουμε πως συγκεκριμένες ενέργειες σήμερα θα μπορέσουν να επηρεάσουν τη οργάνωση και λειτουργία ενός οργανισμού στο μέλλον. 

Η διαδικασία της έρευνα πάντως αποτελείται από τα εξής στάδια:

1.3 Επιλογή θέματος – Εύρεση ερευνητικού προβλήματος

Για τη διεξαγωγή της ερευνητικής διαδικασίας οποιασδήποτε από τις μορφές που αναφέρθηκαν, πρέπει να υπάρχει ένα πρόβλημα προς διερεύνηση. Το πρώτο θέμα που παρουσιάζεται όμως, είναι το πώς βρίσκει κανείς ένα πρόβλημα προς διερεύνηση; Αυτή η ερώτηση δεν είναι τόσο απλή όσο ακούγεται, ούτε όσο θα περίμενε κανείς. Ο ερευνητής μπορεί να έχει υπόψη του ένα πρόβλημα ή μια προβληματική κατάσταση με την οποία σκέφτεται να ξεκινήσει. Όμως στη φάση αυτή, η κατάσταση είναι ακαθόριστη, οι ιδέες ασαφείς, οι αμφιβολίες έντονες και αυτό γιατί ο ερευνητής, έχει μόνο μια γενική και όχι ξεκάθαρη αντίληψη για το συγκεκριμένο πρόβλημα. Την εικόνα αυτή ο ερευνητής πρέπει να ξεκαθαρίσει και αποσαφηνίσει σύντομα, γιατί στην αντίθετη περίπτωση το υπό διερεύνηση πρόβλημα δε θα επιλυθεί.
Όπως και σε οποιοδήποτε άλλο εγχείρημα, έτσι και η επιτυχία μιας ερευνητικής διαδικασίας εξαρτάται από τη σχολαστικότητα και τη σοβαρότητα με την οποία έγιναν οι προπαρασκευαστικές πράξεις και η απάντηση κρίσιμων ερωτήσεων σχετικών με το πρόβλημα. Οι νέοι ερευνητές θα εκπλαγούν με το πόσο χρόνο απαιτεί το αρχικό αυτό στάδιο. Ωστόσο, οποιαδήποτε ερευνητική διαδικασία δεν μπορεί να είναι εφικτή, αν το πρόβλημα στο οποίο αναφέρεται, δεν αναγνωριστεί, δεν κατανοηθεί πλήρως και στη συνέχεια να διατυπωθεί με εφικτό τρόπο.
Το πρόβλημα δεν υπόκειται στο ότι υπάρχει έλλειψη ερευνητικών θεμάτων, αλλά στο ότι το υπό μελέτη θέμα πρέπει να προσδιοριστεί πλήρως και η υπό επίλυση ερώτηση να διατυπωθεί στα αρχικά της στάδια. Επιπλέον, η αβεβαιότητα σχετικά με τη φύση του ερευνητικού προβλήματος, η απομόνωσή του, τα κριτήρια για την αποδοχή και ο τρόπος για την επίλυσή του, πολλές φορές είναι θέματα που κατακλύζουν και πολλές φορές καταβάλλουν ακόμη και τους πιο έμπειρους ερευνητές. Η ικανότητα για τη διεξαγωγή έρευνας, είναι σε μεγάλο βαθμό θέμα σωστών επιλογών σχετικά με το τι να ερευνηθεί και παρά το γεγονός ότι δεν υπάρχουν συγκεκριμένοι κανόνες για τον προσδιορισμό ενός προβλήματος, υπάρχουν τρεις σημαντικές πηγές για τον προσδιορισμό αυτό: η εμπειρία, η θεωρία και η βιβλιογραφία.
Η Εμπειρία
Ένας ερευνητής πρέπει πρώτα απ’ όλα να αποφασίσει σχετικά με το γενικό θέμα της έρευνας. Φυσικά, τέτοιου είδους επιλογές είναι καθαρά προσωπικές αλλά θα πρέπει να εντάσσονται και στα γενικότερα ενδιαφέροντα του ερευνητή, ή να είναι θέματα για τα οποία ο ερευνητής έχει πραγματική περιέργεια, αλλιώς το κίνητρο για την ολοκλήρωση της συγκεκριμένης έρευνας θα είναι πολύ δύσκολο να διατηρηθεί. Οι θεματικές επιλογές, συνήθως καθορίζονται από τις γνώσεις του ερευνητή, την εμπειρία του και τις συνθήκες που επικρατούν τη συγκεκριμένη χρονική στιγμή. Για παράδειγμα, οι καθηγητές αναρωτιούνται για την αποτελεσματικότητα των μεθόδων που χρησιμοποιούν για τη διδασκαλία της στατιστικής, προκειμένου να αποφασίσουν ποια είναι η αποτελεσματικότερη.
Επίσης, η παρατήρηση συγκεκριμένων σχέσεων για τις οποίες δεν υπάρχει επαρκής αιτιολόγηση, αποτελούν άλλη μια πηγή θεμάτων προς διερεύνηση. Για παράδειγμα, ένας καθηγητής παρατηρεί ότι συγκεκριμένες χρονικές στιγμές ο αυτοσεβασμός των σπουδαστών μειώνεται. Προκειμένου να διερευνηθούν τέτοιου είδους καταστάσεις, ο καθηγητής μπορεί να διατυπώσει προκαταρκτικές ερμηνείες και στη συνέχεια να τις ελέγξει εμπειρικά. Τέτοιου είδους διερευνήσεις, όχι μόνο επιλύουν το συγκεκριμένο πρόβλημα, αλλά συνεισφέρουν και στην κατανόηση του πως οι συνθήκες που επικρατούν στους χώρους διδασκαλίας επηρεάζουν τον αυτοσεβασμό των σπουδαστών.
Επίσης, αρκετά ενδιαφέρον προς διερεύνηση, αποτελεί και η εκτίμηση και αξιολόγηση συγκεκριμένων πρακτικών που εφαρμόζονται σε διάφορους επαγγελματικούς χώρους, για παράδειγμα οι κυρώσεις που επιβάλλονται για βραδεία προσέλευση, καθώς και αν υπάρχουν αποτελεσματικότερες εναλλακτικές που θα μπορούσαν να τις αντικαταστήσούν.
Μπορούμε να παρατηρήσουμε ότι η εμπειρία της καθημερινότητας, στην οποία στηρίζονται για ερευνητικές ιδέες κυρίως οι νέοι ερευνητές, μπορεί να οδηγήσει σε πολύ ενδιαφέροντα προβλήματα προς διερεύνηση, τα οποία μπορεί να αποτελέσουν τη βάση για τη βελτίωση των μεθόδων που ασκούνται στα διάφορα επαγγέλματα.

Η  Θεωρία
Σε πολλές επιστήμες και κυρίως σε εκείνες που σχετίζονται με την ανθρώπινη συμπεριφορά, υπάρχουν αρκετές θεωρίες, οι οποίες δεν είναι επιστημονικές. Οι θεωρίες αυτές χρειάζεται να ελεγχθούν μέσω συγκεκριμένων υποθέσεων, ώστε να αποδειχθεί, σε τι είδους καταστάσεις, περιβάλλοντα και συνθήκες ισχύουν ή όχι. Με αυτόν τον τρόπο, η έρευνα συνεισφέρει στη δημιουργία θεωριών. Για παράδειγμα, είναι γνωστό ότι οι διαφορές στην απόδοση μεταξύ αγοριών και κοριτσιών σε συγκεκριμένα αντικείμενα στο σχολείο (όπως η έκθεση, τα μαθηματικά, τα φιλολογικά κ.τ.λ.), οφείλονται στις προσδοκίες του περιβάλλοντος, στην αυτοεκτίμηση, στην προετοιμασία, στις ιδιαιτερότητες του κάθε ατόμου κ.λπ., σε αντίθεση με την παραδοσιακή άποψη που αναφέρεται στις ενδογενείς διαφορές των δύο φύλων. Αυτή λοιπόν, είναι μια θεωρία που πρέπει να αποδειχθεί επιστημονικά.
Η Βιβλιογραφική Ανασκόπηση
Η ανασκόπηση της βιβλιογραφίας συνήθως διεξάγεται σε δύο στάδια. Το πρώτο περιλαμβάνει μια γενική επισκόπηση της υπό μελέτη θεματικής περιοχής, χρησιμοποιώντας δευτερογενείς πηγές όπως εγχειρίδια, που περιλαμβάνουν σχετική θεματολογία και βιβλιογραφική ανασκόπηση. Όταν το υπό μελέτη πρόβλημα έχει απομονωθεί, μια πιο συγκεκριμένη και δομημένη επισκόπηση που συμπεριλαμβάνει πρωτογενείς πηγές βασικής έρευνας μπορεί να διεξαχθεί, χρησιμοποιώντας για παράδειγμα, δημοσιευμένη αρθρογραφία. Η διαδικασία αυτή, διαφέρει από την επισκόπηση των δευτερογενών πηγών, διότι είναι εκτενέστερη και πληρέστερη, αφού στοχεύει στην απόκτηση λεπτομερούς γνώσεως για το υπό διερεύνηση θέμα.
Η προκαταρκτική επισκόπηση, επικεντρώνεται σε πιο γενικά κείμενα, καθώς και σε ανασκοπήσεις που έχουν γίνει από προηγούμενες έρευνες και οι οποίες συνοψίζουν τη γνώση για την υπό διερεύνηση περιοχή. Οι δευτερογενείς πηγές που αναφέρθηκαν, είναι χρήσιμες, διότι συνδυάζουν τη γνώση αυτή, με δημοσιεύσεις που έχουν γίνει στο συγκεκριμένο τομέα.
Η βιβλιογραφική ανασκόπηση μπορεί να βοηθήσει στον περιορισμό του υπό διερεύνηση προβλήματος και στο σαφέστερο ορισμό του. Στην έρευνα είναι προτιμότερο να γίνει επιλογή ενός περιορισμένου προβλήματος και να μελετηθεί με λεπτομέρεια, παρά να γίνει προσπάθεια επίλυσης και διερεύνησης ενός γενικότερου προβλήματος και να μελετηθεί επιφανειακά. Η βιβλιογραφική ανασκόπηση θα δώσει στον ερευνητή την απαιτούμενη γνώση να μετατρέψει ένα αβέβαιο ερευνητικό πρόβλημα σε λεπτομερές και περιεκτικό σχέδιο δράσης. Επίσης, ανασκοπήσεις προηγούμενων ερευνών αποτελούν γόνιμη πηγή για ερευνητικά προβλήματα. Πολλές έρευνες προτείνουν επέκταση του συγκεκριμένου θέματος και πολύ συχνά εμφανίζονται νέες ερωτήσεις καθώς έχουν δοθεί οι απαντήσεις σε παλαιότερες. Επιπλέον, αρκετές ήδη υπάρχοντες μελέτες χρειάζεται να επαναληφθούν σε διαφορετικά δείγματα, πράξη που έχει ως αποτέλεσμα την επιβεβαίωση των ευρημάτων της αρχικής έρευνας.
Ωστόσο, ακόμη και αν κάποιος ερευνητής έχει ιδιαίτερο ενδιαφέρον για ένα συγκεκριμένο θέμα, υπάρχουν τα ακόλουθα σημεία που πρέπει να λάβει σημαντικό υπόψη του.
·         Το πρόβλημα πρέπει να είναι δυνατό να ερευνηθεί, δηλαδή θα πρέπει να μπορούν να παραχθούν συγκεκριμένες υποθέσεις προς έλεγχο.
·         Ο ερευνητής θα πρέπει να έχει τη δυνατότητα πρόσβασης σε δείγματα, υλικό και σε όσες ακόμη πηγές απαιτούνται από την έρευνα. Εάν δεν υπάρχει πρόσβαση στα δεδομένα που χρειάζεται να συγκεντρωθούν από την έρευνα, τότε ένα άλλο θέμα θα πρέπει να διερευνηθεί. Επίσης υπάρχουν και λόγοι όπως ο χρόνος, το κόστος και η διαθεσιμότητα των ερευνητικών εργαλείων, που πρέπει να ληφθούν σοβαρά υπόψη.
·         Όταν το πρόβλημα έχει επιλυθεί, θα πρέπει να έχει ως υποπροϊόν του την παραγωγή συγκεκριμένων θεωριών ή να έχει εφαρμογή σε πραγματικό περιβάλλον.
Εκτός από τις πηγές μέσα από τις οποίες μπορεί κανείς να προσδιορίσει ένα ερευνητικό πρόβλημα, υπάρχουν οι εξής θεματικές κατηγορίες που μπορεί να αποτελέσουν πιθανά ερευνητικά θέματα: η νοοτροπία, οι ιδέες/εντυπώσεις, οι αποφάσεις, οι ανάγκες, η συμπεριφορά, ο τρόπος ζωής, κοινωνικοί δεσμοί και η δημογραφία.

1.4 Διατύπωση υπόθεσης

Αφού το ο ερευνητής επιλέξει και προσδιορίσει πλήρως και με σαφήνεια το πρόβλημα προς διερεύνηση, ένα σημαντικό θέμα που ακολουθεί είναι η διατύπωση της υπόθεσης που πρόκειται να ελεγχθεί. Η λέξη υπόθεση στην έρευνα έχει περιορισμένη έννοια και αναφέρεται σε εικασίες που πιθανόν επεξηγούν παρατηρήσεις. Οι ερευνητικές υποθέσεις δεν αποδεικνύονται με μαρτυρίες ή γεγονότα που είναι σύμφωνα με αυτές, απλώς δεν διαψεύδονται. Στην αντίθετη περίπτωση όμως, όταν δηλαδή οι μαρτυρίες ή τα γεγονότα δεν είναι σύμφωνα με τη υπόθεση, τότε η υπόθεση απορρίπτεται συμπερασματικά. Αυτή είναι και η διαφορά των ερευνητικών υποθέσεων με τους καθημερινούς συλλογισμούς.
Η διατύπωση μιας ερευνητική υπόθεσης προκύπτει λογικά από την βιβλιογραφική ανασκόπηση του προβλήματος. Επίσης μπορεί να προκύψει και από τη θεωρία, αφού η θεωρία καθοδηγεί την έρευνα και δημιουργεί προβλέψεις που πρέπει να ελεγχθούν. Το πιο σημαντικό στοιχείο ωστόσο, δεν είναι από πού προκύπτει η υπόθεση αλλά ότι οι υποθέσεις πρέπει να εκφράζονται με τέτοιο τρόπο ώστε να είναι δυνατή είτε η επιβεβαίωσή τους είτε η απόρριψή τους. Η υπόθεση που δεν μπορεί να ελεγχθεί, δεν ανήκει στη σφαίρα της επιστήμης.
Πολλοί ερευνητές υποστηρίζουν ότι μπορεί να υπάρξει κάποιου είδους ιεραρχία στις υποθέσεις που μπορεί να προκύψουν σε μια ερευνητική μελέτη. Κάθε υπόθεση που ακολουθεί, θα είναι πιο συμπαγής στις έννοιες και με μεγαλύτερη δυνατότητα ελέγχου από την προγενέστερή της. Συχνά, για την αρχική υπόθεση χρησιμοποιείται ο όρος Ερευνητική, ενώ για εκείνη που προκύπτει στο τέλος, (τη σαφέστερα διατυπωμένη), χρησιμοποιείται ο όρος Λειτουργική.
Οι όροι που χρησιμοποιούνται σε κάθε ερευνητική υπόθεση πρέπει να εκφράζονται με ακρίβεια, με σωστή ορολογία, να είναι λειτουργικές και να έχουν ξεκάθαρο νόημα. Γενικοί όροι του τύπου προσωπικότητα, αυτοεκτίμηση, επίτευγμα, πρέπει να αποφεύγονται. Η υπόθεση απαιτεί, λιτή και περιεκτική γλώσσα, καθώς και ορισμό της ορολογίας.
Επίσης, όπως αναφέρθηκε, την κάθε υπόθεση πρέπει να τη διακρίνει η δυνατότητα για έλεγχο. Αφού οι υποθέσεις είναι εκείνες που προλέγουν το αποτέλεσμα μιας έρευνας, είναι προφανές ότι συγκεκριμένα εργαλεία πρέπει να υπάρχουν που να μπορούν να παρέχουν αξιόπιστες και έγκυρες μετρήσεις των μεταβλητών που εμπλέκονται.
Οι υποθέσεις θα πρέπει να εκφράζουν διαφορές ή σχέσεις μεταξύ των μεταβλητών αυτών. Μια ικανοποιητική υπόθεση είναι εκείνη μέσω της οποίας οι αναμενόμενες συσχετίσεις μεταξύ των μεταβλητών γίνονται αναμφίβολες. Η υπόθεση πρέπει να είναι λιτή, συγκεκριμένη και σχετικά απλή στον έλεγχο. Οι γενικές υποθέσεις δεν προτιμούνται. Οι υποθέσεις δε θα πρέπει να είναι ασύμβατες με γεγονότα που είναι γνωστά και θα πρέπει να στηρίζονται στην υπάρχουσα γνώση. Φυσικά υπάρχουν και οι μελέτες που δίνουν αντίθετα αποτελέσματα από εκείνα που υποστηρίζουν τα γνωστά γεγονότα. Σε περιπτώσεις σαν κι αυτές η υπόθεση πρέπει να διατυπώνεται προκειμένου να επιλυθεί η διαφωνία.
Συνήθως, οι τρόποι διατύπωσης υπόθεσης που υπάρχουν, οι οποίοι ταυτίζονται με τις κύριες προσεγγίσεις του ερευνητικού σχεδιασμού είναι:
·         Η διερεύνηση της ισότητας παραμέτρου με τιμή,
·         Η διερεύνηση διαφορών ανάμεσα σε ομάδες και
·         Η διερεύνηση σχέσεων ανάμεσα σε ομάδες.
Όταν λέμε ερευνητικός σχεδιασμός εννοούμε το πλάνο ή τη στρατηγική που ακολουθούμε προκειμένου να πάρουμε απαντήσεις σε ερευνητικές ερωτήσεις.

Από τους τρόπους διατύπωσης μιας υπόθεσης οδηγούμαστε στο σημαντικό σημείο ότι στη στατιστική ανάλυση, στην πραγματικότητα, δεν ελέγχουμε την λειτουργική υπόθεση, αλλά τη λογική της αντίθετη, ή αλλιώς μηδενική υπόθεση.
Αναλυτικότερα, δεν ελέγχουμε την υπόθεση ότι υπάρχει στατιστικά σημαντική πληθυσμιακή διαφορά ή συσχέτιση, αντίθετα ελέγχουμε την υπόθεση ότι δεν υπάρχει στατιστική σημαντική διαφορά ή συσχέτιση. Όταν βέβαια έχουμε να κάνουμε τέτοιου είδους ελέγχους, συνήθως εργαζόμαστε με δειγματικά δεδομένα, που έχουν προκύψει από τον υπό μελέτη πληθυσμό, τα οποία χρησιμοποιούμε για να εκτιμήσουμε τις πληθυσμιακές τιμές των μεταβλητών μας. Οποιαδήποτε εκτίμηση μιας πληθυσμιακής παραμέτρου εμπεριέχει δειγματοληπτικό σφάλμα. Έτσι, αυτό το οποίο στην ουσία γίνεται με τη διατύπωση της μηδενικής υπόθεσης, είναι να αποδεικνύεται αν υπάρχει στατιστικά ασήμαντη διαφορά (ή συσχέτιση), η οποία προέρχεται από το γεγονός ότι διερευνάται μόνο τμήμα του πληθυσμού και για το λόγο αυτό μπορεί να αποδοθεί στις αυξομειώσεις-κυμάνσεις της τυχαίας δειγματοληψίας με τη μορφή δειγματοληπτικού σφάλματος, ή ότι είναι διαφορά στατιστικά σημαντική, δηλαδή πραγματική, που δεν μπορεί να εξηγηθεί μόνο από τις κυμάνσεις της τυχαίας δειγματοληψίας.
Με τον τόπο αυτό, είναι δυνατόν να προσδιοριστούν τα ακριβή όρια (επίπεδο σημαντικότητας) για την απόρριψη της μηδενικής υπόθεσης. Αναλυτικότερα, αν μια διαφορά (μεταξύ εκτίμησης και παραμέτρου) τόσο μεγάλη όσο αυτή που παρατηρείται ή και ακόμη μεγαλύτερη, μπορεί να συμβεί από τύχη (δηλαδή λόγω δειγματοληπτικού σφάλματος) λιγότερο από μία φορά στις εκατό, τότε λέμε ότι η διαφορά αυτή είναι στατιστικά σημαντική σε επίπεδο σημαντικότητας 0,01 ή 1%. Αν η διαφορά αυτή μπορεί να συμβεί τυχαία λιγότερες από πέντε φορές αλλά περισσότερες από μία στις εκατό, τότε λέμε ότι η διαφορά αυτή είναι στατιστικά σημαντική σε επίπεδο σημαντικότητας 0,05 ή 5%.
Στην περίπτωση που απορριφθεί η μηδενική υπόθεση, τότε γίνεται αποδεκτή η εναλλακτική υπόθεση, δηλαδή, ότι η διαφορά (ή η συσχέτιση) πράγματι υπάρχει. Στην πραγματικότητα αυτή είναι και η υπόθεση για την οποία αρχικά ενδιαφερόμασταν, αλλά τώρα ονομάζεται Εναλλακτική Υπόθεση.
Τη μηδενική υπόθεση συνήθως τη συμβολίζουμε Η0 και την εναλλακτική της Η1. Εδώ πρέπει να τονίσουμε ότι αν δεν απορριφθεί η μηδενική υπόθεση αυτό δε σημαίνει ότι δεν υπάρχει διαφορά ή συσχέτιση, αλλά ότι δεν υπάρχει διαφορά ή συσχέτιση μεγαλύτερη από εκείνη που οφείλεται στη τύχη ή σε τυχαίες αυξομειώσεις.
Ο τρόπος με τον οποίο μπορούμε να γνωρίζουμε ότι η συσχέτιση ή η διαφορά είναι αρκετά μεγάλες ώστε να ξεπερνούν εκείνες που οφείλονται στη τύχη, είναι η χρησιμοποίηση των επιπέδων σημαντικότητας (0,01, 0,05, 0,001) και πινάκων κατάλληλων στατιστικών δοκιμασιών.
Οι πιθανές εκβάσεις μιας απόφασης που θα ληφθεί σε επίπεδο σημαντικότητας α σε σχέση με ότι ισχύει πραγματικά στον πληθυσμό, φαίνεται στον πίνακα που ακολουθεί:

Η Η0 γίνεται
Η Η0 στην πραγματικότητα είναι
Αληθής
Ψευδής
Αποδεκτή
Σωστό
Σφάλμα τύπου ΙΙ

Απορρίπτεται
Σφάλμα τύπου Ι
Σωστό

Σφάλμα τύπου Ι ονομάζουμε την πιθανότητα να απορρίψουμε την Η0 ενώ αυτή ισχύει. Το σφάλμα αυτό ονομάζεται και επίπεδο σημαντικότητας α του ελέγχου.
Σφάλμα τύπου ΙΙ ονομάζουμε την πιθανότητα να αποδεχτούμε την Η0 ενώ αυτή δεν ισχύει.
Φυσικά, θα ήταν επιθυμητό και οι δύο τύποι σφάλματος να μπορούσαν να γίνουν ίσοι με το μηδέν, όμως αυτό δεν είναι εφικτό, διότι παρά το γεγονός ότι δεν συνδέονται συναρτησιακά μεταξύ τους, είναι τέτοιοί ώστε για δεδομένο μέγεθος δείγματος n, η ελάττωση του ενός συνεπάγεται την αύξηση του άλλου. Για το λόγο αυτό, σε κάθε έλεγχο, αυτό που ενδιαφέρει πραγματικά είναι να μειωθεί το σφάλμα τύπου Ι.

1.5 Τεχνικές δειγματοληψίας

Η έννοια της δειγματοληψίας αφορά στην επιλογή ενός μικρού τμήματος από έναν πληθυσμό, στην παρατήρησή του και τέλος στη γενίκευση των ευρημάτων από το δείγμα, στον υπό μελέτη πληθυσμό. Η γενίκευση, είναι μια αναγκαία επιστημονική διαδικασία, αφού σπάνια κανείς μπορεί να μελετήσει όλα τα μέλη ενός καθορισμένου πληθυσμού. Κατά τη διαδικασία της δειγματοληψίας, ίσως το πρώτο θέμα με το οποίο πρέπει να ασχοληθεί κανείς είναι ο ακριβής καθορισμός του πληθυσμού αναφοράς, από τον οποίο θα επιλεχτεί το δείγμα. Για αυτόν τον καθορισμό, τα θέματα που πρέπει να ληφθούν υπόψη είναι: α) ότι ο πληθυσμός πράγματι αποτελείται από εκείνα τα υποκείμενα που κατέχουν τις πληροφορίες που αναζητούνται από την έρευνα και β) τα κριτήρια και οι κανόνες που καθορίζουν αν τα υποκείμενα θα συμπεριληφθούν ή όχι στην έρευνα. Μερικές φορές βέβαια είναι σκόπιμο να γίνει διάκριση ανάμεσα στον πληθυσμό στόχο και στον προσβάσιμο πληθυσμό μιας έρευνας. Πληθυσμός στόχος είναι όλος ο πληθυσμός για τον οποίο ενδιαφέρεται ο ερευνητής, ενώ προσβάσιμος πληθυσμός είναι ο πληθυσμός που αποτελείται μεν από τα υποκείμενα που πληρούν τις προϋποθέσεις επιλογής που έχει θέσει ο ερευνητής, αλλά παράλληλα είναι και προσβάσιμος σε αυτόν.
Ένα δείγμα μπορεί να είναι οποιοδήποτε τμήμα του πληθυσμού, ανεξάρτητα από το αν είναι αντιπροσωπευτικό ή όχι. Όταν λέμε ότι το δείγμα πρέπει να είναι αντιπροσωπευτικό, εννοούμε σε όρους εκείνων των μεταβλητών, που είναι γνωστό ότι σχετίζονται με τα χαρακτηριστικά του πληθυσμού που επιθυμούμε να μελετήσουμε. Η έννοια της αντιπροσωπευτικότητας δεν υπονοείται από την έννοια του δείγματος, γι΄ αυτό και ένα εξαιρετικά σημαντικό θέμα κατά τη διαδικασία της δειγματοληψίας, είναι η επιλογή ενός δείγματος από κάποιο πληθυσμό, να πραγματοποιείται με συγκεκριμένη τεχνική η οποία να εξασφαλίζει την αντιπροσωπευτικότητά του και παράλληλα, όσο είναι δυνατόν, την αμεροληψία του. Εάν το δείγμα δεν είναι αντιπροσωπευτικό του πληθυσμού, τότε δεν είναι δυνατόν να γίνουν έγκυρες γενικεύσεις σε αυτόν. Ένα επιπλέον σημαντικό χαρακτηριστικό εκτός από την αντιπροσωπευτικότητα ενός δείγματος, είναι και το μέγεθός του. Συνήθως, όσο πιο μικρό είναι το δείγμα τόσο μικρότερη ακρίβεια έχει. Ωστόσο το χαρακτηριστικό της αντιπροσωπευτικότητας είναι σημαντικότερο του μεγέθους του δείγματος. Προκειμένου να επιλεγούν αντιπροσωπευτικά δείγματα από τα οποία να μπορεί κανείς να πραγματοποιεί γενικεύσεις στους αντίστοιχους πληθυσμούς, υπάρχουν συγκεκριμένες τεχνικές που μπορεί να εφαρμοστούν. Οι τεχνικές αυτές παρουσιάζονται στη συνέχεια, όμως κρίνεται αναγκαίο να δοθούν επιπλέον και κάποιες βασικές έννοιες:
Οντότητες ή απλές μονάδες: είναι οι μονάδες εκείνες πάνω στις οποίες πραγματοποιείται κάποια μέτρηση ή παρατήρηση. Για παράδειγμα όταν θέλουμε να μελετήσουμε την ηλικία των καθηγητών σε ένα σχολείο τότε οι απλές μονάδες είναι οι καθηγητές.
Δειγματοληπτική μονάδα: είναι η μονάδα στην οποία στηρίζεται η διαδικασία της δειγματοληψίας και αποτελείται από μη επικαλυπτόμενες οντότητες. Για παράδειγμα, σε μια δημοσκόπηση κάθε άτομο αποτελεί δειγματοληπτική μονάδα. Σε άλλου είδους έρευνα, δειγματοληπτική μονάδα θα μπορούσε να είναι η οικογένεια, που αποτελείται από τους γονείς, τα παιδιά τους και τους συγγενείς.
Δειγματοληπτικό πλαίσιο: Είναι μια λίστα ή ένα σύνολο από οδηγίες που προσδιορίζει κάθε δειγματοληπτική μονάδα του πληθυσμού. Για παράδειγμα, δειγματοληπτικό πλαίσιο θα μπορούσε να είναι μια λίστα από ονόματα και τηλέφωνα για μια έρευνα που διεξάγεται από το τηλέφωνο, ή ένας χάρτης που αποτελείται από τα σπίτια μιας περιοχής για έρευνες που διεξάγονται στα σπίτια.
Οι τεχνικές δειγματοληψίας διακρίνονται σε δύο μεγάλες κατηγορίες. Στις δειγματοληψίες πιθανότητας (στοχαστικές ή πιθανολογικές) και στις δειγματοληψίες μη πιθανότητας (μη πιθανολογικές). Από τις δύο αυτές κατηγορίες, ιδιαίτερο ενδιαφέρον παρουσιάζουν κυρίως οι δειγματοληψίες πιθανότητας, διότι μόνο από αυτές μπορεί να πραγματοποιηθεί η διεξαγωγή συμπερασμάτων για τους πληθυσμούς από τους οποίους προήλθαν τα δείγματα.
Ένα δείγμα ονομάζεται δείγμα πιθανότητας (ή πιθανολογικό), όταν λαμβάνεται από έναν πληθυσμό με τέτοιο τρόπο ώστε κάθε στοιχείο του πληθυσμού να έχει μια εκ των προτέρων γνωστή πιθανότητα να συμπεριληφθεί σε αυτό. Υπάρχουν οι εξής τύποι δειγματοληψίας πιθανότητας:
·      Απλή Τυχαία Δειγματοληψία (Simple Random Sampling)
·      Συστηματική Δειγματοληψία (Systematic Sampling)
·      Δειγματοληψία κατά στρώματα (Stratified Sampling)
·      Δειγματοληψία κατά συστάδες (Cluster Sampling)

Οι παραπάνω τύποι δειγματοληψίας θα μελετηθούν αναλυτικότερα στο επόμενο κεφάλαιο.
Μη πιθανολογικό δείγμα, σε αντίθεση με το πιθανολογικό, ονομάζεται ένα δείγμα όταν λαμβάνεται από έναν πληθυσμό με τέτοιο τρόπο, ώστε για κάθε στοιχείο του πληθυσμού δεν υπάρχει εκ των προτέρων γνωστή πιθανότητα να συμπεριληφθεί σε αυτό. Σε αυτού του είδους τη δειγματοληψία τα αποτελέσματα θα είναι αντιπροσωπευτικά του δείγματος, όχι όμως όλου του πληθυσμού. Υπάρχουν οι εξής τύποι δειγματοληψίας μη πιθανότητας:
Δειγματοληψία ευκολίας (Convenience Sampling)
Σε αυτού του είδους τη δειγματοληψία, επιτρέπεται η χρησιμοποίηση οποιασδήποτε διαθέσιμης ομάδας μελών του πληθυσμού της έρευνας, αυθαίρετα και χωρίς οργάνωση. Για παράδειγμα, προκειμένου να μελετήσει τα παιδιά στις κλινικές υγιών βρεφών, ένας ερευνητής μπορεί να επιλέξει μια κλινική για τη γεωγραφική ευκολία στην πρόσβαση. Τα παιδιά αυτά είναι άτομα σχετικά με τη μελέτη και επιπλέον είναι διαθέσιμα στον ερευνητή. Ωστόσο, εξαιτίας έλλειψης τυχαιότητας στη δειγματοληψία, μπορεί, κατά κάποιον τρόπο, να μην είναι τα τυπικά υγιή βρέφη.
Δειγματοληψία σκοπού (Judgmental Sampling)
Σε αυτού του είδους τη δειγματοληψία, ο ερευνητής επιλέγει ένα δείγμα στηριζόμενος στη δική του κρίση σχετικά με το ποιος είναι κατάλληλος για συγκεκριμένη έρευνα. Συνήθως χρησιμοποιείται στην περίπτωση που υπάρχει περιορισμένος αριθμός ατόμων στην υπό διερεύνηση ομάδα.
Δειγματοληψία αναλογίας (Quota Sampling)
Σε αυτού του είδους τη δειγματοληψία, ο πληθυσμός χωρίζεται σε αμοιβαία αποκλειόμενα τμήματα, όπως και στην δειγματοληψία κατά στρώματα που παρουσιάζεται στο επόμενο κεφάλαιο, με τη διαφορά όμως ότι στο δειγματοληπτικό πλαίσιο δεν υποδεικνύεται η ιδιότητα ή το χαρακτηριστικό εκείνο, με βάσει του οποίου θα χωριστούν οι ομάδες. Αφού ο ερευνητής δε γνωρίζει την ομάδα στην οποία το κάθε πιθανό μέλος θα ανήκει, τότε αναγκαστικά αντιστοιχίζει έναν αριθμό (αναλογία) σε κάθε ομάδα και πριν εντάξει τα πιθανά μέλη σε κάθε μια από αυτές προηγείται μια διερευνητική ερώτηση, βάσει της οποίας αποφασίζει αν θα περιλάβει το συγκεκριμένο μέλος ή όχι. Η δειγματοληψία αυτή χρησιμοποιείται συνήθως σε έρευνες αγοράς και στις δημοσκοπήσεις. Για παράδειγμα, ένας ερευνητής μπορεί να επιθυμεί ένα δείγμα από 20 ενήλικες άντρες, 20 ενήλικες γυναίκες, 10 έφηβους νεαρούς και 10 έφηβες νεαρές προκειμένου να μελετήσει τις απόψεις και για την τηλεόραση.
Δειγματοληψία χιονοστιβάδας (snowball sampling)
Στην οποία τα μέλη του δείγματος προτείνουν άλλα μέλη στον ερευνητή. Με τη τεχνική αυτή το δείγμα φαίνεται να μεγαλώνει όπως μια χιονοστιβάδα. Η δειγματοληψία χιονοστιβάδας χρησιμοποιείται όταν τα μέλη κάποιου πληθυσμού είναι δύσκολο να αναγνωριστούν, γιατί είναι «κρυμμένα» μέσα στον πληθυσμό, ή υπάρχει δυσκολία στην πρόσβασή τους, για παράδειγμα, έρευνα που διενεργείται σε χρήστες ναρκωτικών. Επειδή τα άτομα που επιλέγονται με αυτόν τον τρόπο δε βρίσκονται στο δειγματοληπτικό πλαίσιο, τα δείγματα χιονοστιβάδας υπόκεινται σε μεροληψία.
Μελέτη περίπτωσης (Case study)
Σε αυτού του είδους τη δειγματοληψία, η έρευνα περιορίζεται σε μία ομάδα με παρόμοια χαρακτηριστικά ή μικρό μέγεθος.

Ολοκληρώνοντας το κεφάλαιο αυτό, αξίζει να αναφέρουμε ότι, η διαδικασία της δειγματοληψίας αποτελείται από τα εξής στάδια
·         Τον ορισμό του υπό μελέτη πληθυσμού,
·         Τον προσδιορισμό του δειγματοληπτικού πλαισίου,
·         Τον προσδιορισμό της δειγματοληπτικής τεχνικής,
·         Καθορισμό του μεγέθους του δείγματος,
·         Την πραγματοποίηση του δειγματοληπτικού σχεδίου,
·         Τη συλλογή των δεδομένων και τέλος,
·         Την ανασκόπηση της δειγματοληπτικής διαδικασίας










































2. Tο S. P. S. S. for Windows

2.1 Έρευνα αγοράς και στατιστική ανάλυση δεδομένων

Αν τα μαθηματικά είναι η γλώσσα της επιστήμης, η ανάλυση δεδομένων είναι η γλώσσα της έρευνας. Η έρευνα αγοράς είναι από τα πλέον χρήσιμα εργαλεία που έχουν οι επιχειρήσεις και οι οργανισμοί, αλλά ταυτόχρονα κι ένα από τα πιο περίπλοκα. Πολλοί άνθρωποι πιστεύουν λανθασμένα ότι «έρευνα αγοράς» είναι απλώς το να ρωτάς τον τελικό καταναλωτή τι νομίζει σχετικά με ένα προϊόν, μια διαφήμιση ή ένα θέμα. Επίσης λανθασμένα πιστεύουν ότι η στατιστική ανάλυση δεδομένων είναι ο απλός υπολογισμός διαφόρων στατιστικών μέτρων και η απεικόνισή τους με τη μορφή πίνακα ή διαγράμματος.
Ευτυχώς ή δυστυχώς τα πράγματα σε καμία περίπτωση δεν είναι τόσο απλά! Η έρευνα αγοράς και η στατιστική ανάλυση δεδομένων απαιτούν τρία πράγματα:
1.      βασικές γνώσεις επικοινωνίας (για να μπορέσετε να πάρετε από τους ερωτώμενους τις ακριβείς πληροφορίες που θέλετε και όχι κάτι παρεμφερές), καλή γνώση του αντικειμένου στο οποίο απασχολείστε (για να μπορείτε να εντοπίσετε τα προβλήματα που αντιμετωπίζετε και να επιλέξετε τη σωστή προσέγγιση) και γνώσεις στατιστικής (για να μπορείτε να μετατρέψετε τα δεδομένα σε πληροφορίες, να ερμηνεύσετε τα αριθμητικά αποτελέσματα, να εξάγετε συμπεράσματα, και να λάβετε αποφάσεις)
2.      εφαρμογή μεθόδων και τεχνικών στατιστικής ανάλυσης δεδομένων
3.      φαντασία και δημιουργικότητα
Για το τρίτο η επιστήμη κι εμείς σηκώνουμε τα χέρια ψηλά. Είναι θέμα γονιδίων και προσωπικότητας! Το πρώτο αποκτάται σ’ έναν ικανοποιητικό βαθμό κατά τη διάρκεια των σπουδών του επίδοξου ερευνητή. Επιπλέον υπάρχουν πάντα βιβλία, στα οποία μπορείτε να καταφύγετε για να συμπληρώσετε τα όποια κενά. Α, και τώρα τελευταία υπάρχει και το Internet, μην το παραβλέπετε. Το δεύτερο είναι το κομμάτι στο οποίο σας βοηθάει σημαντικότατα το SPSS. Αναλαμβάνει να κάνει για σας όλες τις περίπλοκες πράξεις, να χρησιμοποιήσει όλους τους εξαιρετικά πολύπλοκους αλγόριθμους και να σας δώσει σύντομα και αλάνθαστα τα αριθμητικά αποτελέσματα. Δεν μπορεί όμως ούτε να αποφασίσει για το είδος των αναλύσεων που πρέπει να κάνετε κάθε φορά ούτε και να συμμετέχει στην ερμηνεία των αποτελεσμάτων ή τη λήψη αποφάσεων. Αυτό είναι αποκλειστικό «προνόμιο» των ερευνητών.

2.2 SPSS for Windows 15.0

Το SPSS (Statistical Package for Social Sciences ή Statistical Product and Service Solutions) είναι ένα εξαιρετικά ισχυρό και δημοφιλές εργαλείο που μπορεί να πραγματοποιήσει οποιοδήποτε είδος ανάλυσης δεδομένων που χρησιμοποιείται στις κοινωνικές επιστήμες. Το SPSS 15.0 είναι πρόσφατη έκδοση του πακέτου αν και τα βασικά χαρακτηριστικά του παραμένουν ίδια σε σχέση με προηγούμενες εκδόσεις. Μεγάλες διαφορές στην παρουσίαση κυρίως υπάρχουν για τις εκδόσεις που προηγήθηκαν της 11ης. Αυτό σημαίνει ότι τα όσα ακολουθούν έχουν ισχύ κατά 99% και σε προγενέστερες εκδόσεις (με μικρότερο ποσοστό ταύτισης βέβαια). Οι προσθήκες και οι διαφορές αφορούν συγκεκριμένες –όχι ιδιαίτερα χρησιμοποιούμενες- αναλύσεις και κάποιες επιπλέον δυνατότητες και αυτοματισμούς. 
Το SPSS for Windows είναι ένα πολύπλοκο στατιστικό πρόγραμμα από οποιαδήποτε άποψη κι αν το κοιτάξει κανείς. Παρά το μέγεθος και την πολυπλοκότητα, η SPSS έχει καταφέρει να δημιουργήσει ένα πρόγραμμα που δεν είναι μόνον ισχυρό αλλά και πολύ φιλικό προς το χρήστη. Δημιουργώντας την έκδοση για τα Windows, η SPSS έχει κάνει για την ανάλυση δεδομένων ό,τι ο Henry Ford για το αυτοκίνητο, ό,τι ο Bill Gates για τους υπολογιστές: την έκανε διαθέσιμη στις μάζες. Το SPSS μπορεί να κάνει οποιοδήποτε είδος στατιστικής ανάλυσης που έχει ποτέ χρησιμοποιηθεί στις κοινωνικές επιστήμες, στον επιχειρηματικό κόσμο και σε άλλα επιστημονικά πεδία χωρίς σημαντική προσπάθεια από την πλευρά του χρήστη.
Τα αρχεία δεδομένων που χρησιμοποιούνται για τις αναλύσεις που ακολουθούν, παρουσιάζονται αναλυτικά στο Παράρτημα. Επιπλέον, χρησιμοποιούνται τα μενού και οι οθόνες του SPSS 14.
Τα βασικά παράθυρα του SPSS
1.      Data View
Στην Οθόνη 1 φαίνεται το παράθυρο του Data Editor. Η μπάρα του μενού και η εργαλειοθήκη είναι τοποθετημένες στο επάνω μέρος της οθόνης και περιγράφονται παρακάτω. Όταν ξεκινήσετε το SPSS, δεν υπάρχουν δεδομένα στον Data Editor. Για να συμπληρώσετε το παράθυρο του Data Editor, μπορεί να πληκτρολογήσετε δεδομένα στα άδεια κελιά (κατά προτίμηση αφού πρώτα ορίσετε τις μεταβλητές σας στο variable View –περιγράφεται στη συνέχεια) ή να ανοίξετε ένα ήδη υπάρχον αρχείο δεδομένων (περιγράφεται στη συνέχεια αυτού του κεφαλαίου).

Οθόνη 1: Το παράθυρο Data View
Στις στήλες καταχωρούνται οι μεταβλητές και στις γραμμές οι απαντήσεις των συμμετεχόντων στην έρευνα. Αφού ορίσετε τις μεταβλητές σας στο Variable View, η λέξη Var στο επάνω μέρος κάθε στήλης θα αντικατασταθεί από το όνομα της εκάστοτε μεταβλητής που έχετε ορίσει. Εάν σε κάποιο τετραγωνάκι δεν καταχωρήσετε καμία τιμή, τότε θα εμφανιστεί το σύμβολο (,) που αντιπροσωπεύει για το SPSS το κενό.
Τα εικονίδια της εργαλειοθήκης είναι τοποθετημένα κάτω από τη μπάρα του μενού στο επάνω μέρος της οθόνης. Καθένα από αυτά αντιπροσωπεύει και μια εντολή· πρόκειται για αυτοματισμούς που έχουν σκοπό να κάνουν τις ευρύτερα χρησιμοποιούμενες εντολές πιο εύκολα και πιο γρήγορα προσβάσιμες. Πρέπει να σημειωθεί ότι ακόμα και στις εφαρμογές του SPSS η μορφή της γραμμής με τα εικονίδια μπορεί να ποικίλει ελαφρώς ανάλογα με το τι κάνετε μια δεδομένη στιγμή. Η εργαλειοθήκη που φαίνεται παραπάνω αναφέρεται στο παράθυρο του data editor. Σημειώστε επίσης ότι κάποια από τα εικονίδια είναι φωτεινά και ξεκάθαρα και άλλα είναι «γκριζαρισμένα». Τα γκριζαρισμένα εικονίδια είναι εκείνα που δεν είναι διαθέσιμα τη δεδομένη στιγμή. Σημειώστε για παράδειγμα ότι το εικονίδιο Print File (Εκτύπωση Αρχείου) είναι γκριζαρισμένο  επειδή δεν υπάρχουν καθόλου δεδομένα για να εκτυπωθούν. Όταν εισαχθούν δεδομένα στον Data Editor, τότε αυτά τα εικονίδια γίνονται ξεκάθαρα επειδή τώρα είναι διαθέσιμα. Ο καλύτερος τρόπος για να μάθετε πώς δουλεύουν τα εικονίδια είναι να κάνετε κλικ πάνω τους και να δείτε τι θα συμβεί! Εναλλακτικά μπορείτε να φέρετε τον κέρσορα του ποντικιού πάνω απ’ το καθένα και να δείτε την εντολή στην οποία αντιστοιχεί. 
Υπάρχουν δύο τρόποι εισαγωγής των δεδομένων σας στο παράθυρο του Data Editor. Μπορείτε να πληκτρολογήσετε σε κάθε κουτάκι την αντίστοιχη τιμή ή να εισάγετε τα δεδομένα (εάν είναι διαθέσιμα ηλεκτρονικά) από κάποιο αρχείο excel, txt, access, κτλ. Στην πρώτη περίπτωση απλώς επιλέγετε το κατάλληλο κουτάκι, πληκτρολογείτε την αντίστοιχη τιμή και την καταχωρείτε πατώντας το enter ή κάποιο από τα βελάκια στο πληκτρολόγιό σας· εναλλακτικά κάνετε κλικ με το ποντίκι σας σε κάποιο άλλο σημείο του Data Editor (κατά προτίμηση στο κουτάκι όπου θέλετε να καταχωρήσετε την επόμενη τιμή). Στη δεύτερη περίπτωση επιλέγετε διαδοχικά τις εξής εντολές: FileàOpenàData. Στο πλαίσιο διαλόγου Open ορίζετε στο File Type το είδος του αρχείου στο οποίο υπάρχουν τα δεδομένα σας και στη συνέχεια εντοπίζετε το αρχείο σας στο σκληρό δίσκο (τη δισκέτα ή το CD ROM). Με το πλήκτρο Open τα δεδομένα σας θα μεταφερθούν στον Data Editor του SPSS.
2.      Variable View
Ενώ το παράθυρο των δεδομένων έχει σχεδιαστεί για την καταχώρηση των δεδομένων, το παράθυρο των μεταβλητών εξυπηρετεί τον ορισμό των μεταβλητών, για τις οποίες στη συνέχεια θα καταχωρηθούν δεδομένα. Κάθε γραμμή αντιπροσωπεύει μία μεταβλητή (η οποία στο data view θα αντιστοιχεί σε μια στήλη) και κάθε στήλη σε ένα από τα 10 χαρακτηριστικά που ορίζουν τις μεταβλητές. Τα 10 χαρακτηριστικά που καλείστε να ορίσετε για κάθε μεταβλητή είναι τα εξής: Όνομα, Τύπος, Εύρος, Δεκαδικά, Επιγραφή, Τιμές, Κενά, Στήλες, Ευθυγράμμιση, και Μέτρηση (Name, Type, Width, Decimals, Label, Values, Missing, Columns, Align, και Measure).

Οθόνη 2: Το παράθυρο Variable View

Όνομα (Name)
Στο αντίστοιχο πλαίσιο πληκτρολογείτε το όνομα που έχετε προαποφασίσει για την κάθε μεταβλητή. Μόλις ολοκληρωθεί η πληκτρολόγηση πατάτε το enter ή κάποιο από τα βελάκια στο πληκτρολόγιο προκειμένου να καταχωρηθεί το όνομα και να μεταφερθείτε σε κάποια επόμενη θέση. Προσέξτε ότι κάθε όνομα μεταβλητής πρέπει να υπακούει στους παρακάτω κανόνες. Υπήρχε μια εποχή που οι κανόνες αυτοί είχαν κάποιο νόημα. Τώρα, απλώς πρέπει να τους ακολουθείτε. Πάντως αν προσπαθήσετε να παραβείτε κάποιον απ’ αυτούς, το SPSS θα σας αποτρέψει παρουσιάζοντάς σας κάποιο αντίστοιχο μήνυμα.
o   Κάθε όνομα μεταβλητής μπορεί να έχει περιορισμένο αριθμό χαρακτήρων. Ο ακριβής αριθμός ποικίλει, αλλά μετά την έκδοση 13 είναι αρκετά μεγάλος ώστε να μην χρειάζεται να ανησυχείτε γι’ αυτόν. Μέχρι και την έκδοση 11, το όριο ήταν 8 χαρακτήρες.
o   Πρέπει να ξεκινάει με ένα γράμμα, αλλά μετά απ’ αυτό μπορεί να χρησιμοποιηθεί οποιοδήποτε γράμμα, αριθμός, μια τελεία, ή τα σύμβολα #, _, ή $. Πάντως το όνομα δεν μπορεί να τελειώνει με τελεία.
o   Όλα τα ονόματα των μεταβλητών πρέπει να είναι μοναδικά· δεν μπορεί δύο μεταβλητές να έχουν το ίδιο όνομα.
o   Τα ονόματα των μεταβλητών μπορεί να γραφτούν είτε με μικρά είτε με κεφαλαία γράμματα. Για παράδειγμα, οι λέξεις COLOUR, Colour, και colour είναι ακριβώς ίδιες για το SPSS.
o   Επειδή έχουν ξεχωριστή σημασία για το SPSS, κάποιες λέξεις δεν μπορούν να χρησιμοποιηθούν για ονόματα μεταβλητών, συμπεριλαμβανομένων των: all, ne, eq, to, le, lt, gt, and, not, ge  και width.
Θα προσέξετε ότι καθώς πατάτε enter ή κάποιο απ’ τα βελάκια, στα δεξιά της μεταβλητής, της οποίας μόλις πληκτρολογήσατε το όνομα, οχτώ από τις υπόλοιπες εννιά στήλες γεμίζουν με default πληροφορίες. Οι αρχικές ρυθμίσεις συνήθως θα πρέπει να μεταβληθούν, αλλά αυτό μπορεί να γίνει εύκολα αφού έχετε πληκτρολογήσει τα ονόματα κάθε μεταβλητής.

Τύπος (Type)
Όταν κάνετε κλικ σ’ ένα κελί οποιασδήποτε γραμμής υπό τον τίτλο Type θα προσέξετε ένα μικρό γκρι κουτάκι στα δεξιά της λέξης Numeric (=αριθμητικός). Προσέξτε ότι είναι επιλεγμένο το Numeric. Οι περισσότερες μεταβλητές σας ΘΑ ΕΙΝΑΙ αριθμητικές κι έτσι θα αφήσετε σε ισχύ την αρχική ρύθμιση. Η άλλη επιλογή την οποία ενδέχεται να χρησιμοποιήσετε είναι η String.
Μια μεταβλητή που λαμβάνει αλφαριθμητικές τιμές (αντί για αριθμούς μόνο) ονομάζεται μεταβλητή string. Οι μεταβλητές string μπορεί να περιέχουν και αριθμούς (π.χ. type2, Jones III) ή ακόμα και να αποτελούνται μόνο από αριθμούς, αλλά το SPSS τις αντιμετωπίζει σαν μη-αριθμητικές, και μόνον ένας περιορισμένος αριθμός λειτουργιών μπορεί να γίνει με τις μεταβλητές αυτές (χρησιμοποιούνται για λόγους αναφοράς αλλά όχι στις αναλύσεις). Μπορεί να προσέξατε ότι είναι διαθέσιμοι οκτώ διαφορετικοί τύποι μεταβλητών. Οι Numeric και String είναι μακράν οι πιο συχνά χρησιμοποιούμενοι τύποι κι έτσι οι υπόλοιποι δεν θα μας απασχολήσουν εδώ. Αν πάντως επιμένετε να γνωρίζετε τον ορισμό και τη χρήση και των υπολοίπων, ένα κλικ στο Help του συγκεκριμένου παραθύρου θα ικανοποιήσει με τον καλύτερο τρόπο την περιέργειά σας.

Εύρος (width)
Στη στήλη Width καθορίζετε το μέγιστο αριθμό ή το μέγιστο string που μπορείτε να έχετε για τις τιμές κάθε μεταβλητής. Όταν κάνετε κλικ στο κελί υπό τον τίτλο width στα δεξιά του ονόματος κάθε μεταβλητής το κελί τονίζεται κι εμφανίζονται δύο βελάκια στο δεξί περιθώριο του κελιού. Χρησιμοποιήστε τα για να αυξήσετε ή να μειώσετε το εύρος από το αρχικό των 8 χαρακτήρων, ή απλώς επιλέξτε το αρχικό νούμερο και πληκτρολογήστε αυτό που επιθυμείτε.

Δεκαδικά (Decimals)
Στη στήλη Decimals ορίζετε τον αριθμό των δεκαδικών ψηφίων που θέλετε να υπάρχουν στα δεδομένα σας. Αρχικά ορισμένα είναι τα δύο ψηφία. Για τις μεταβλητές string ο αριθμός των δεκαδικών είναι εξ’ αρχής 0. Σημείωση: αν επιχειρήσετε να μειώσετε ένα Width σε 2 ή λιγότερα ενώ τα δεκαδικά ψηφία παραμένουν 2, θα εμφανιστεί μια προειδοποίηση που θα σας πληροφορεί ότι δεν είναι δυνατό. Πρέπει να αλλάξετε την τιμή των δεκαδικών σε 0 πριν δημιουργήσετε εύρος μικρότερο ή ίσο του 2. Η τιμή του Width αφορά το σύνολο των ψηφίων του αριθμού και όχι μόνον το ακέραιο κομμάτι του, αν πρόκειται για δεκαδικό.

Ετικέτα (Label)
Η στήλη Label σας επιτρέπει να τοποθετήσετε ετικέτες (περιγραφή του τι αντιπροσωπεύει η μεταβλητή) στις μεταβλητές των οποίων η σημασία δεν είναι ξεκάθαρη από το όνομά τους. Πολλές φορές η σημασία είναι ξεκάθαρη από το ίδιο το όνομα (π.χ. colour, sex, age) και δεν απαιτείται ετικέτα. Άλλες φορές η σημασία ΔΕΝ είναι ξεκάθαρη και μια ετικέτα είναι πολύ χρήσιμη.
Τα κελιά στη στήλη Label είναι απλώς πλαίσια κειμένου κι εσείς πληκτρολογείτε την περιγραφή που θέλετε. Το μέγιστο μήκος είναι 256 χαρακτήρες, αλλά κάτι τόσο μεγάλο είναι δυσκίνητο. Είκοσι ή τριάντα χαρακτήρες είναι συνήθως αρκετοί για να ξεκαθαρίσετε τη σημασία της μεταβλητής.
Καθώς πληκτρολογείτε μια ετικέτα, το εύρος της στήλης Label θα αυξάνει για να χωρέσει αυτή. Αν γίνει υπερβολικά φαρδιά, απλώς τοποθετήστε τον κέρσορα στην κάθετη δεξιά γραμμή της στήλης Label στην πάνω πάνω σειρά. Ο κέρσορας θα γίνει τόξο διπλής κατεύθυνσης και μπορείτε να προσαρμόσετε τη στήλη σε μικρότερο (ή μεγαλύτερο) εύρος. Χρησιμοποιείστε αυτή τη διαδικασία για να μορφοποιήσετε την οθόνη απεικόνισης μεταβλητών.

Τιμές (Values)
Η επιλογή Value σας επιτρέπει να εντοπίζετε επίπεδα μιας μεταβλητής (π.χ.sex:  1=θηλυκό, 2=αρσενικό· marital: 1=έγγαμος, 2=ελεύθερος, 3=διαζευγμένος, 4=χήρος/α). Η εισαγωγή ετικετών Value για μεταβλητές που έχουν πολλές διακριτές ομάδες είναι εξαιρετικά κρίσιμη για τη σαφήνεια της ερμηνείας του αποτελέσματος. Το SPSS μπορεί να κάνει τις πράξεις είτε βάλετε ετικέτες είτε όχι, αλλά εσείς δεν πρόκειται να θυμάστε αν το 3 σημαίνει για παράδειγμα ελεύθερος ή διαζευγμένος. Άλλο ένα πλεονέκτημα που έχουν οι ετικέτες στις τιμές είναι ότι το SPSS μπορεί να τις δείχνει στο αρχείο δεδομένων σας και στα αποτελέσματα που ακολουθούν τις αναλύσεις. Το SPSS σας επιτρέπει μέχρι 60 χαρακτήρες για κάθε ετικέτα τιμής, αλλά κάτι μικρότερο είναι πιο πρακτικό.
Ακριβώς όπως στην επιλογή Type, ένα κλικ σε οποιοδήποτε κελί στη στήλη Values θα εμφανίσει ένα μικρό γκρι κουτί. Ένα κλικ σ’ αυτό το κουτί θα εμφανίσει ένα πλαίσιο διαλόγου που θα σας επιτρέψει να δημιουργήσετε ετικέτες για τις τιμές.

Κενά (Missing)
Η στήλη Missing χρησιμοποιείται σπάνια. Ο σκοπός της είναι να προσδιορίζει διαφορετικούς τύπους κενών στις παρατηρήσεις στα δεδομένα σας. Για παράδειγμα, ερωτώμενοι που αρνήθηκαν να απαντήσουν σε μια ερώτηση μπορεί να κωδικοποιηθούν με το 8 κι εκείνοι που ήθελαν να απαντήσουν κάτι διαφορετικό από ό,τι είχατε στη λίστα σας να κωδικοποιηθούν με το 9. Αν έχετε εισάγει αυτές τις τιμές στη στήλη Missing, τότε μπορεί να ορίσετε ότι τα 8 και τα 9 δεν θα συμμετέχουν στις αναλύσεις που ακολουθούν. Ένα μικρό πλαίσιο διαλόγου ανοίγει όταν κάνετε κλικ στο γκρι κουτάκι δεξιά που σας επιτρέπει να ορίσετε ποιες τιμές (διακριτές ή και διαστήματα) αντιπροσωπεύουν τα κενά.

Στήλες (Columns)
Η στήλη Columns χρησιμοποιείται για τις περισσότερες μεταβλητές. Αυτό σας επιτρέπει να ορίσετε πόσο χώρο θα επιτρέψετε για τα δεδομένα και τις ετικέτες τους (ορίζεται στο variable view, αλλά αναφέρεται στο data view). Τα υπέρ και κατά των πλατιών στηλών σε σχέση με τις στενές είναι ξεκάθαρα: Αν έχετε πλατιές στήλες μπορείτε να δείτε ολόκληρο το όνομα της μεταβλητής κι έτσι φαίνονται λιγότερο στριμωγμένες. Αν έχετε στενές στήλες, έχετε το πλεονέκτημα να είναι ορατές στην οθόνη πολλές στήλες αλλά για να το πετύχετε αυτό μπορεί να πρέπει να περικόψετε τα ονόματα. Για παράδειγμα αν έχετε στήλες εύρους 3 χαρακτήρων μπορείτε να χωρέσετε 33 μεταβλητές στην οθόνη (ανάλογα βέβαια τις διαστάσεις του μόνιτορ σας)· αν οι στήλες είναι όλες εύρους 8 χαρακτήρων (το αρχικά ορισμένο), μπορείτε να χωρέσετε μόνο 12.
Ακόμα μια φορά το γκρι κουτάκι γίνεται ορατό στο δεξί περιθώριο όταν κάνετε κλικ σ’ ένα κελί στη στήλη Columns. Μπορείτε είτε να κάνετε κλικ στα βελάκια για μεγαλύτερο ή μικρότερο αριθμό είτε να πληκτρολογήσετε τον επιθυμητό αριθμό αφού επιλέξετε τον ήδη υπάρχοντα, το 8.

Στοίχιση (Align)
Η στήλη Align παρέχει ένα drop-down μενού που σας επιτρέπει να ευθυγραμμίσετε τα δεδομένα σας σε κάθε κελί, είτε δεξιά είτε αριστερά ή στο κέντρο. Εξ ορισμού οι αριθμητικές μεταβλητές είναι στοιχισμένες δεξιά, οι μεταβλητές string στα αριστερά. Μπορείτε φυσικά να επιλέξετε κάτι διαφορετικό, αν θέλετε.

Μέτρο (Measure)
Η στήλη Measure παρέχει επίσης ένα drop-down μενού που σας επιτρέπει να διαλέξετε μεταξύ τριών εναλλακτικών βασιζόμενοι στη φύση των δεδομένων σας: Scale (διαστήματος και λόγου), Ordinal (ιεράρχησης), και Nominal (ονομαστικής).
Τα μέτρα διαστήματος και λόγου έχουν εσωτερική αριθμητική σημασία που επιτρέπει γενικούς μαθηματικούς χειρισμούς. Για παράδειγμα, η ηλικία είναι μεταβλητή κλίμακας λόγου: το 16 είναι δύο φορές όσο το 8, το 4 είναι το μισό του 8, το άθροισμα του 4 και του 8 είναι 12μ και ούτω καθ’ εξής. Η επιλογή scale είναι η αρχικά καθορισμένη για τις αριθμητικές μεταβλητές.
Τα μέτρα  Ιεράρχησης έχουν εσωτερική διάταξη αλλά οι μαθηματικοί χειρισμοί συνήθως δεν σημαίνουν τίποτα. Σε μια κλίμακα επιθετικότητας από το 1 έως το 10μ κάποιος που βρίσκεται υψηλότερα στην κλίμακα είναι πιο επιθετικός από κάποιον που βρίσκεται χαμηλότερα, αλλά κάποιος που είναι στο 4 δεν είναι δυο φορές πιο επιθετικός απ’ αυτόν που είναι στο 2.
Τα Ονομαστικά μέτρα χρησιμοποιούνται για αναγνώριση αλλά δεν έχουν καμία εσωτερική διάταξη (λιγότερο σε περισσότερο) όπως η εθνικότητα, η οικογενειακή κατάσταση, και άλλες κατηγορικές μεταβλητές. Τα ονομαστικά δεδομένα μπορούν να χρησιμοποιηθούν για κατηγοριοποίηση αλλά δεν μπορούν να χρησιμοποιηθούν στις περισσότερες αναλύσεις.
Στο SPSS ισχύουν οι εξής κανόνες:
¯  Οι Μεταβλητές String μετρώνται σε Κλίμακα Nominal (χρησιμοποιούνται για κατηγοριοποίηση, αλλά δεν συμμετέχουν στις περισσότερες αναλύσεις).
¯  Οι μεταβλητές με προκαθορισμένες κατηγορίες τιμών μετρώνται σε Κλίμακα Ordinal. Αν υπάρχουν περισσότερες από 24 κατηγορίες (default), τότε η κλίμακα αλλάζει σε Scale.
¯  Οι Μεταβλητές Numeric οι τιμές των οποίων είναι καθαροί αριθμοί μετρώνται σε Κλίμακα Scale.
Μερικές φορές μπορεί να είναι δύσκολο να διαλέξετε μεταξύ κλίμακας και ιεράρχησης. Αν συμβεί αυτό, μην ανησυχείτε πολύ. Σε όλες τις αναλύσεις, το SPSS αντιμετωπίζει και τις δύο κατηγορίες μεταβλητών με τον ίδιο τρόπο. Εκείνο που διαφέρει είναι τα στατιστικά και οι αναλύσεις που έχουν έννοια για κάθε περίπτωση. Αλλά αυτό είναι κάτι που αποφασίζετε εσείς και η στατιστική.

3.   Output Navigator
Οθόνη 3: Το παράθυρο Αποτελεσμάτων

«Output» είναι ο όρος που χρησιμοποιείται για να ορίσει τα αποτελέσματα από αναλύσεις που έχουν γίνει και είναι ο αντικειμενικός στόχος της χρήσης του προγράμματος. Το SPSS έχει μια μακρά και πλούσια ιστορία προσπαθειών προκειμένου να δημιουργηθεί μια μορφή των αποτελεσμάτων που θα είναι ξεκάθαρη και ταυτόχρονα περιεκτική. Η τωρινή έκδοση χρησιμοποιεί πίνακες.
Στην οθόνη 3 συνοψίζονται τα βασικά στοιχεία του παραθύρου αποτελεσμάτων και παρέχεται μια λεπτομερής περιγραφή κάθε στοιχείου της εργαλειοθήκης στο παράθυρο. Θα προσέξετε ότι αρκετά από τα εικονίδια της εργαλειοθήκης είναι πανομοιότυπα με εκείνα στο παράθυρο του Data Editor του SPSS·αυτά τα πλήκτρα κάνουν το ίδιο πράγμα που κάνουν και στον Data Editor, αλλά στα αποτελέσματα αντί για τα δεδομένα. Για παράδειγμα, το κλικ πάνω στο εικονίδιο εκτύπωσης εκτυπώνει τα αποτελέσματα αντί για τα δεδομένα. Δεν θα αναφερθούμε λεπτομερώς σ’ αυτά μιας και πρόκειται για ευρέως χρησιμοποιούμενες εντολές, τις οποίες πιθανότατα γνωρίζετε. Στην περίπτωση που δεν συμβαίνει αυτό, τοποθετήστε τον κέρσορα του ποντικιού πάνω στο εικονίδιο που σας ενδιαφέρει και το SPSS θα σας δώσει την περιγραφή του.
Ένα από τα σημαντικότερα πράγματα που πρέπει να μάθετε για το παράθυρο Output του SPSS είναι η χρήση του περιγράμματος (outline view) στα αριστερά της οθόνης. Στη δεξιά πλευρά του παραθύρου είναι τα αποτελέσματα των διαδικασιών του SPSS που έτρεξαν και στην αριστερή το περίγραμμα (σαν ένας πίνακας περιεχομένων χωρίς αρίθμηση σελίδων) αυτών των αποτελεσμάτων. Τα αποτελέσματα του SPSS αποτελούνται στην πραγματικότητα από μια σειρά πραγμάτων· αυτά μπορεί να είναι τίτλοι (π.χ. Συχνότητες (=frequencies), ετικέτες ή νούμερα ή διαγράμματα, μεταξύ άλλων.
Σημείωση: θα προσέξετε ότι δεν υπάρχει ενότητα «σημειώσεων» στο παράθυρο Output που να αντιστοιχεί στις «σημειώσεις» του περιγράμματος. Αυτό συμβαίνει επειδή οι σημειώσεις είναι (εξ ορισμού) κρυμμένες. Αν θέλετε να δείτε τις σημειώσεις, κάντε διπλό κλικ στο εικονίδιο κλειστού βιβλίου στα δεξιά του τίτλου notes (σημειώσεις). Το εικονίδιο κλειστού βιβλίου θα γίνει τότε εικονίδιο ανοιχτού βιβλίου και οι σημειώσεις θα εμφανιστούν στο παράθυρο στα δεξιά.
Αν δουλεύετε με τα ίδια δεδομένα για κάμποσο καιρό, μπορεί να παράγετε πολλά αποτελέσματα. Στην πραγματικότητα, μπορεί να παράγονται τόσα πολλά αποτελέσματα που γίνεται δύσκολο να πλοηγηθείτε σ’ αυτά ακόμα και χρησιμοποιώντας το περίγραμμα. Για να βοηθηθείτε σ’ αυτό, μπορείτε να τοποθετήσετε μια ομάδα αντικειμένων αποτελεσμάτων κάτω από  μια επικεφαλίδα. Για να το κάνετε αυτό, κάντε κλικ στο σύμβολο πλην στα αριστερά της επικεφαλίδας. Για παράδειγμα, αν θέλετε να τοποθετήσετε το αποτέλεσμα των Συχνοτήτων (για να το βγάλετε απ’ τη μέση και να επιστρέψετε σ’ αυτό αργότερα) απλώς κάντε κλικ στο σύμβολο πλην στα αριστερά της λέξεις frequencies (συχνότητες). Αν θέλετε να ξεδιπλώσετε την επικεφαλίδα frequencies αργότερα, το μόνο που πρέπει να κάνετε είναι να κάνετε κλικ στο σύμβολο συν στα αριστερά του τίτλου frequencies.
Μια ιδιαιτέρως χρήσιμη εντολή όταν δουλεύετε με τα αποτελέσματα είναι η εντολή insert new text (εισάγετε κείμενο). Όταν κάνετε κλικ σ’ αυτό το πλήκτρο, εισάγεται ένα πλαίσιο κειμένου. Σ’ αυτό το πλαίσιο μπορείτε να πληκτρολογήσετε σχόλια που θα σας υπενθυμίζουν τι ενδιαφέρον υπάρχει στο συγκεκριμένο αποτέλεσμα (για παράδειγμα, «Το επόμενο διάγραμμα θα ταιριάζει στην ενότητα αποτελεσμάτων», ή «Ω, όχι, η υπόθεσή μου δεν επαληθεύτηκε»). Μόλις πληκτρολογήσετε τα σχόλιά σας, κάντε κλικ σε ένα άλλο σημείο του SPSS για να αποεπιλέξετε το πλαίσιο κειμένου. Σημείωση: Αν πληκτρολογήσετε σχόλια που καταλαμβάνουν περισσότερες από μία γραμμές, θα πρέπει να κάνετε κλικ στο τετράγωνο μαύρο κουτί στο κάτω μέρος του πλαισίου κειμένου του SPSS, και να το σύρετε προς τα κάτω για να κάνετε το πλαίσιο μεγαλύτερο.

4.      Παράθυρο Διαλόγου
Στις περισσότερες από τις εντολές ή τις αναλύσεις που θα χρησιμοποιήσετε θα χρειαστεί να «επικοινωνήσετε» με τον υπολογιστή μέσω ενός παράθυρου διαλόγου όπου θα κληθείτε να κάνετε συγκεκριμένες επιλογές. Στη συντριπτική τους πλειοψηφία τα παράθυρα αυτά θα έχουν τη γενική μορφή που θα περιγράψουμε ευθύς αμέσως χρησιμοποιώντας το παράθυρο Frequencies, το οποίο φαίνεται στην παρακάτω οθόνη.
Οθόνη 4: Ενδεικτικό παράθυρο διαλόγου
Ουσιαστικά χωρίζεται σε 4 νοητά μέρη. Αριστερά υπάρχει ένα πλαίσιο όπου βρίσκονται καταχωρημένες όλες οι διαθέσιμες μεταβλητές (αυτές που έχετε ορίσει στο Variable View). Κάνοντας πρώτα κλικ σε κάποια από αυτές και στη συνέχεια στο βελάκι που βρίσκεται στα δεξιά, η μεταβλητή περνάει στο δεύτερο πλαίσιο (κενό στην παραπάνω οθόνη) υπό τον τίτλο Variable(s). Εκεί τοποθετούνται κάθε φορά η μεταβλητή ή οι μεταβλητές που θα συμμετέχουν στη συγκεκριμένη ανάλυση. Στο κάτω μέρος του παραθύρου υπάρχουν οι διαθέσιμες επιλογές που σχετίζονται με την εκάστοτε ανάλυση. Κάνοντας κλικ σε οποιαδήποτε από αυτές ανοίγει ένα καινούριο παράθυρο όπου καλείστε να προσδιορίσετε συγκεκριμένα πράγματα για αυτήν και τα αποτελέσματα που θα εμφανιστούν από το SPSS μετά την ολοκλήρωση της ανάλυσης.
Τέλος, δεξιά υπάρχουν τα σταθερά πλήκτρα OK, Paste, Reset, Cancel, Help που χρησιμοποιείτε όταν ολοκληρώσετε την εργασία σας στο συγκεκριμένο παράθυρο (OK), όταν θέλετε να επαναφέρετε τις αρχικές default ρυθμίσεις του SPSS αναιρώντας ό,τι έχετε κάνει ως τώρα (Reset), όταν θέλετε να ακυρώσετε την επιλογή της συγκεκριμένης ανάλυσης –κλείνει το παράθυρο διαλόγου- (Cancel) ή όταν χρειάζεστε βοήθεια σχετικά με τη συγκεκριμένη ανάλυση που επιχειρείτε (Help). Η εντολή Paste αφορά όσους γνωρίζουν προγραμματισμό και δεν θα σας απασχολήσει ποτέ· τουλάχιστον όχι στο πλαίσιο του συγκεκριμένου μαθήματος.
Η menu bar του SPSS
Η menu bar παρουσιάζει τις εντολές, οι οποίες εκτελούν τις περισσότερες από τις εφαρμογές που παρέχει το SPSS. Όποτε κάνετε κλικ πάνω σε μια συγκεκριμένη εντολή, εμφανίζονται μια σειρά από υπό-επιλογές κι εσείς επιλέγετε εκείνη που κάθε φορά επιθυμείτε. Τα βασικά μενού εντολών είναι τα εξής:
¯  File: Περιλαμβάνει όλες τις εντολές για την εκτέλεση συνηθισμένων λειτουργιών (δημιουργία νέου αρχείου, άνοιγμα υπάρχοντος αρχείου, αποθήκευση-εκτύπωση αρχείων, έξοδος απ’ το SPSS, κτλ.).
¯  Edit: Περιλαμβάνει εντολές για την εκτέλεση διορθωτικών λειτουργιών (αναίρεση, αντιγραφή, αποκοπή, επικόλληση, εύρεση, κτλ.)
¯  View: Περιλαμβάνει τις διαθέσιμες επιλογές σχετικά με το τι εμφανίζεται στην οθόνη (εργαλειοθήκες, παράθυρα) και πώς εμφανίζεται (fonts).
¯  Data: Περιλαμβάνει εντολές για την εκτέλεση λειτουργιών που αφορούν τον ορισμό, το σχηματισμό, την εισαγωγή δεδομένων, την ταξινόμηση των παρατηρήσεων, τη συγχώνευση αρχείων, και την επιλογή ή την προσθήκη βάρους στις παρατηρήσεις.
¯  Transform: Περιλαμβάνει εντολές για τη διαμόρφωση και την αλλαγή σε ήδη καταχωρημένα δεδομένα (επανακωδικοποίηση, υπολογισμός νέων μεταβλητών, χειρισμός των missing values).
¯  Analyze: Απ’ αυτό το μενού γίνεται η επιλογή και η εκτέλεση όλων των διαθέσιμων αναλύσεων.
¯  Graphs: Απ’ αυτό το μενού γίνεται η επιλογή και η δημιουργία όλων των διαθέσιμων γραφημάτων.
¯  Utilities: Περιλαμβάνει σύνθετες εντολές που αποβλέπουν στην απλοποίηση πολύπλοκων διαδικασιών. Αφορά εξαιρετικά εξοικειωμένους χρήστες.
¯  Windows: Επιλογές για τα διάφορα παράθυρα του SPSS
¯  Help: Παρέχει βοήθεια σχετικά με τις λειτουργίες και τις διαδικασίες του SPSS (οδηγός, ευρετήριο, αναζήτηση).

Οι εντολές καθενός από τα μενού που θα παρουσιάσουμε στη συνέχεια είναι εκείνες που χρησιμοποιούνται συνηθέστερα και είναι απαραίτητες στην πλειοψηφία των αναλύσεων για τις κοινωνικές επιστήμες. Αφού μάθετε τα βασικά, θα είστε σε θέση να αναζητήσετε σε άλλες πηγές (βιβλία, manual & help του SPSS)  και να κατανοήσετε τη λειτουργία και τη χρησιμότητα πιο σύνθετων και εξεζητημένων εντολών.

Το μενού File
Οθόνη 5: Το μενού File
Στην οθόνη 5 βλέπετε το μενού File. Οι εντολές που θα μας απασχολήσουν είναι οι New, Open, Save, Save As, Print, Print Preview, και Exit. Οι εντολές αυτές είναι κοινές στη συντριπτική πλειοψηφία των προγραμμάτων και λειτουργούν με τον ίδιο ακριβώς τρόπο σε κάθε περίπτωση έχοντας τα ίδια αποτελέσματα. Να σημειώσουμε εδώ ότι (ισχύει για οποιοδήποτε μενού εντολών στα Windows)  όταν δίπλα από μια διαθέσιμη επιλογή υπάρχει το σύμβολο 4 αυτό σημαίνει ότι η συγκεκριμένη εντολή έχει περισσότερες από μία διαθέσιμες υποεντολές και μόλις φέρουμε τον κέρσορα του ποντικιού επάνω της θα εμφανιστεί δεξιά ένα καινούριο υπομενού με τις εντολές αυτές. 
Με την εντολή New μπορούμε να δημιουργήσουμε ένα καινούριο αρχείο. Η μόνη από τις υποεπιλογές που θα χρειαστείτε στην παρούσα φάση των σπουδών σας είναι η FileàNewàData. Κάνοντας αυτά τα τρία βήματα θα δημιουργηθεί ένα νέο αρχείο, εντελώς κενό. Στη συνέχεια μπορείτε να προσθέσετε σ’ αυτό δεδομένα και μεταβλητές.
Με την εντολή Open εμφανίζουμε ένα υπάρχον αρχείο, το οποίο είναι αποθηκευμένο στο σκληρό δίσκο του υπολογιστή, σε κάποια δισκέτα ή οπουδήποτε αλλού. Επιλέγοντας διαδοχικά FileàOpenàData  (κι εδώ η DATA είναι η μοναδική υποεπιλογή που θα χρειαστείτε) εμφανίζεται το παράθυρο διαλόγου Open, όπως φαίνεται στην παρακάτω οθόνη.
Οθόνη 6: Το παράθυρο της εντολής Open File
Σ’ αυτό το σημείο καλείστε να προσδιορίσετε δύο πράγματα: ποιο είναι το όνομα του αρχείου που θέλετε να ανοίξετε (File Name) και πού βρίσκεται αυτό (Look in). Ξεκινώντας από το δεύτερο, κάνετε κλικ στο βέλος που βρίσκεται στο τέλος του μενού που ακολουθεί τον τίτλο Look in:. Θα εμφανιστεί ένα drop down μενού απ’ όπου θα έχετε πρόσβαση σε όλους τους πιθανούς χώρους αποθήκευσης (σκληρός δίσκος, δισκέτα, CD-ROM) του υπολογιστή σας. Όταν προσδιορίσετε το φάκελο στον οποίο βρίσκεται το αρχείο που ψάχνετε, τον επιλέγετε και το μενού κλείνει (στη σχετική θέση φαίνεται το όνομα του φακέλου του [SPSS στην παραπάνω οθόνη]) και κάτω ακριβώς εμφανίζονται τα περιεχόμενα του φακέλου (μεταξύ των οποίων προφανώς και το αρχείο που θέλετε να επιλέξετε). Επιλέγετε το αρχείο σας (κλικ πάνω στο όνομά του) και στη συνέχεια κάνετε κλικ στο πλήκτρο Open προκειμένου αυτό να εμφανιστεί. Στο πλαίσιο που ακολουθεί τον τίτλο Files of type: όπου μπορείτε να προσδιορίσετε τον τύπο του αρχείου που ψάχνετε. Προς το παρόν και στο πλαίσιο του συγκεκριμένου μαθήματος η default επιλογή του SPSS είναι στην συντριπτική πλειοψηφία των περιπτώσεων η σωστή και δεν χρειάζεται να προβείτε σε καμιά αλλαγή. Το πλήκτρο Cancel σας επιτρέπει να ακυρώσετε ανά πάσα στιγμή τη διαδικασία.
Οι εντολές Save και Save As χρησιμοποιούνται για την αποθήκευση αρχείων ή και αλλαγών/ προσθηκών σε αυτά. Την Save As τη χρησιμοποιούμε σε δύο περιπτώσεις: την πρώτη φορά που θα χρειαστεί να αποθηκεύσουμε ένα καινούριο αρχείο και κάθε φορά που θέλουμε να αποθηκεύσουμε ένα ήδη αποθηκευμένο αρχείο και σε κάποιο διαφορετικό σημείο ή και με κάποιο διαφορετικό όνομα. Σε κάθε άλλη περίπτωση (όταν δηλαδή απλώς θέλουμε να αποθηκεύσουμε αλλαγές που κάναμε σε κάποιο υπάρχον αρχείο) χρησιμοποιούμε την Save. Η διαφορά τους έγκειται στο γεγονός ότι κάθε φορά που χρησιμοποιείτε την Save As, το SPSS θα σας ζητήσει να προσδιορίσετε το όνομα του αρχείου που επιχειρείτε να αποθηκεύσετε καθώς και το ακριβές σημείο (σκληρός δίσκος, δισκέτα, κτλ) όπου θέλετε να τοποθετηθεί το αρχείο σας. Το αντίστοιχο παράθυρο διαλόγου φαίνεται στην παρακάτω οθόνη και παρουσιάζει εξαιρετική ομοιότητα με το παράθυρο διαλόγου Open που περιγράψαμε παραπάνω.
Και εδώ, στο πλαίσιο δεξιά του τίτλου Save in (αντίστοιχο του Look in) προσδιορίζουμε το σημείο όπου θέλουμε να αποθηκεύσουμε το αρχείο μας και στο πλαίσιο δεξιά του τίτλου File name πληκτρολογούμε το όνομα που επιθυμούμε. Τέλος κάνουμε κλικ στο πλήκτρο Save προκειμένου να ολοκληρωθεί η διαδικασία αποθήκευσης.

Οθόνη 7: Το παράθυρο της εντολής Save File
Όταν επιλέγουμε την εντολή Save η αποθήκευση των αλλαγών που έχουμε κάνει στο αρχείο αποθηκεύονται αυτόματα χωρίς να χρειαστεί να προσδιορίσουμε περαιτέρω λεπτομέρειες και χωρίς να εμφανιστεί κάποιο παράθυρο διαλόγου. Μην ξεχνάτε να χρησιμοποιείτε σε τακτά διαστήματα τη εντολή Save προκειμένου να μην χάσετε μεγάλο κομμάτι της δουλειάς σας, εάν κάτι δεν πάει καλά και χρειαστεί να κλείσετε ή να επανεκκινήσετε το SPSS ή και τον υπολογιστή σας. Να θυμάστε ότι η ΔΕΗ, τα Windows και οι Υπολογιστές δεν είναι τα πλέον αξιόπιστα πράγματα σ’ αυτό τον κόσμο!
Οι εντολές Print και Print Preview σχετίζονται με την εκτύπωση του περιεχομένου των αρχείων μας (δεδομένα ή και αποτελέσματα αναλύσεων). Η εντολή Print Preview προηγείται της Print και μας δίνει τη δυνατότητα προεπισκόπησης του αρχείου που θέλουμε να εκτυπώσουμε. Η χρησιμότητα της εντολής αυτής έγκειται στο γεγονός ότι μας επιτρέπει να δούμε πώς πραγματικά θα εμφανίζεται η εκτύπωση και να επιλέξουμε τις ακριβείς σελίδες (τμήματα του αρχείου) που επιθυμούμε να εκτυπώσουμε. Όταν πρόκειται για μεγάλα αρχεία, όπως είναι συνήθως αυτά του SPSS, είναι πολύ συνηθισμένο να μη γνωρίζουμε σε ποια σελίδα βρίσκεται το τμήμα που μας ενδιαφέρει να εκτυπώσουμε η Print Preview μας βοηθάει στον εντοπισμό του.
Όταν πια είμαστε έτοιμοι να καθορίσουμε το τι θέλουμε να εκτυπώσουμε (τμήμα του αρχείου ή ολόκληρο) επιλέγουμε την εντολή Print και (με την προϋπόθεση ότι υπάρχει κάποιος εκτυπωτής συνδεδεμένος με τον υπολογιστή) στο παράθυρο διαλόγου που ακολουθεί καθορίζουμε τι θα εκτυπωθεί και σε πόσα αντίτυπα. Υπάρχουν πολλές ακόμη επιλογές που αφορούν τη συγκεκριμένη εντολή αλλά δεν θα μας απασχολήσουν εδώ.
Τέλος, με την εντολή Exit εγκαταλείπουμε το SPSS.
Το μενού Edit
Οθόνη 8: Το μενού Edit
Οι εντολές που θα μας απασχολήσουν από το μενού Edit είναι οι Undo, Cut, Copy, Clear, Paste και Find. Στην οθόνη αριστερά, δίπλα από κάθε εντολή, μπορείτε να δείτε και την αντίστοιχη συντόμευση, το συνδυασμό πλήκτρων δηλαδή που σας επιτρέπει να δώσετε τη συγκεκριμένη εντολή χωρίς να χρειαστεί να χρησιμοποιήσετε το μενού edit.
H εντολή Undo είναι από τις πλέον χρήσιμες εντολές που θα συναντήσετε μιας και ουσιαστικά ‘διορθώνει’ τυχόν λάθη που κάνετε ή πιο σωστά σας δίνει την ευκαιρία να το κάνετε εσείς. Σας επιτρέπει να αναιρέσετε κάποια ενέργεια που κάνατε αμέσως πριν. Η Undo σας δίνει αυτή τη δυνατότητα αναίρεσης για αρκετά βήματα πίσω, αλλά καλό θα ήταν να μην το παρακάνετε με τη χρήση της και να μην επαναπαυτείτε στο γεγονός ότι υπάρχει η προσοχή σας είναι πάντα επιβεβλημένη. Να θυμάστε ότι η εντολή Save, η αποθήκευση δηλαδή μιας ενέργειας που κάνατε, καθιστά την Undo ανενεργή για οτιδήποτε έχει προηγηθεί. Δεν μπορείτε δηλαδή να αναιρέσετε κάτι που έχετε ήδη αποθηκεύσει.
Οι εντολές Cut και Paste δεν μπορούν να λειτουργήσουν αυτόνομα αλλά μόνον σε συνδυασμό με την Paste. Χρησιμοποιούνται όταν θέλουμε να αντιγράψουμε κάτι που ήδη υπάρχει σε ένα σημείο του αρχείου μας σε κάποιο άλλο. Η διαδικασία είναι εξαιρετικά απλή. Επιλέγουμε το κομμάτι που θέλουμε να αντιγράψουμε και στη συνέχεια δίνουμε την εντολή EditàCopy. Το επόμενο βήμα μας είναι να κάνουμε κλικ στο σημείο όπου θέλουμε να αντιγραφεί το κομμάτι που επιλέξαμε. Από το μενού edit επιλέγουμε Paste και η αντιγραφή ολοκληρώνεται. Με τον ίδιο ακριβώς τρόπο χρησιμοποιούμε και την εντολή Cut (αντί της Copy). Η μόνη τους διαφορά έγκειται στο γεγονός ότι όταν χρησιμοποιούμε την Copy, το κομμάτι που αντιγράψαμε εμφανίζεται μεν στη νέα θέση στο αρχείο μας, αλλά εξακολουθεί να υπάρχει και στην παλαιά. Όταν χρησιμοποιούμε την Cut το κομμάτι που διαλέξαμε εμφανίζεται στη νέα θέση που υποδείξαμε αλλά παύει να υπάρχει στην παλαιά.
Με την εντολή Clear διαγράφουμε οτιδήποτε έχουμε επιλέξει προηγουμένως. Αν υποθέσουμε ότι θέλουμε να διαγράψουμε το περιεχόμενο ενός κελιού, επιλέγουμε αυτό το κελί και δίνοντας την εντολή EditàClear οτιδήποτε είναι γραμμένο σ’ αυτό διαγράφεται. Η λειτουργία της εντολής αυτής είναι πανομοιότυπη με τη λειτουργία του πλήκτρου Delete.
Η εντολή Find χρησιμοποιείται όταν έχουμε αρχεία εξαιρετικά μεγάλου μεγέθους. Μας επιτρέπει να βρούμε εύκολα και γρήγορα (χωρίς δηλαδή να χρειαστεί να διαβάσουμε όλο το αρχείο) το ακριβές σημείο όπου αναφέρεται μια συγκεκριμένη λέξη που μας ενδιαφέρει. Αν για παράδειγμα θέλουμε να βρούμε πού είναι οι απαντήσεις που έδωσε σε κάποια μας έρευνα ο ερωτώμενος με το επώνυμο Γεωργίου, δεν έχουμε παρά να επιλέξουμε EditàFind και στο πλαίσιο διαλόγου που εμφανίζεται να πληκτρολογήσουμε τη λέξη “Γεωργίου” και στη συνέχεια να πατήσουμε το πλήκτρο Find Next. Εάν όντως αναφέρεται σε κάποιο σημείο η λέξη που ψάχνουμε, το SPSS αυτόματα θα εμφανίσει το συγκεκριμένο τμήμα του αρχείου στην οθόνη μας και θα επιλέξει το κελί όπου είναι γραμμένη η λέξη.
Το μενού View
Οθόνη 9: Το μενού View
Οι εντολές του μενού View που θα μας απασχολήσουν εδώ είναι οι Status Bar, Fonts, και Grid Lines. Όπως βλέπετε στην οθόνη αριστερά, δίπλα από τις εντολές Status Bar και Grid Lines υπάρχει ένα ü. Αυτό σημαίνει ότι οι δύο επιλογές είναι ενεργές. Κάνοντας κλικ σε οποιαδήποτε από τις δύο, το ü θα εξαφανιστεί και θα πάψουν να ισχύουν. Μπορούμε να τις επαναφέρουμε κάνοντας και πάλι κλικ επάνω τους.
Όταν η Status Bar είναι ενεργή, αυτό σημαίνει ότι στο κάτω μέρος του παραθύρου του Data Editor εμφανίζεται ανά πάσα στιγμή μια γραμμή που μας ενημερώνει για την κατάσταση στην οποία βρίσκεται το SPSS (SPSS Processor is Ready, Running Frequencies, ή οτιδήποτε σχετικό με τη λειτουργία που εκτελεί κάθε φορά το πρόγραμμα). Όταν η εντολή Grid Lines είναι ενεργή, τότε τα κελιά στο παράθυρο Data Editor χωρίζονται διακριτά με κάθετες και οριζόντιες γραμμές. Αν απενεργοποιήσουμε τη συγκεκριμένη εντολή τότε το παράθυρο του Data Editor θα εμφανίζεται σαν μια λευκή σελίδα, χωρίς όμως αυτό να σημαίνει ότι στην πραγματικότητα ο Data Editor δεν είναι χωρισμένος σε στήλες και γραμμές· απλώς αυτές δεν είναι εμφανείς σε μας.
Η εντολή Fonts μας επιτρέπει να μορφοποιήσουμε τον τρόπο με τον οποίο εμφανίζονται οι χαρακτήρες που πληκτρολογούμε σε κάθε κελί. Κάνοντας κλικ στην εντολή Fonts εμφανίζεται το αντίστοιχο παράθυρο διαλόγου, όπως φαίνεται στην παρακάτω οθόνη.
Οθόνη 10: Το παράθυρο της εντολής Fonts
Στο μενού Font επιλέγετε τη  γραμματοσειρά που επιθυμείτε, στο Font Style προσδιορίζετε αν θέλετε οι χαρακτήρες να εμφανίζονται πλάγιοι (Italic), έντονοι(Bold), έντονοι πλάγιοι (Bold Italic) ή κανονικοί (Regular). Τέλος από το Size επιλέγετε το μέγεθος που θέλετε να έχουν οι χαρακτήρες σας. Στο πλαίσιο Sample μπορείτε να βλέπετε πώς θα διαμορφωθούν οι χαρακτήρες ανάλογα με τις επιλογές που έχετε κάνει. Όταν προσδιορίσετε την επιθυμητή εμφάνιση, κάνετε κλικ στο OK για να ενεργοποιηθούν οι επιλογές σας.

Το μενού Data
Οθόνη 11: Το μενού Data
Από το μενού Data θα δούμε τις εντολές Insert Variable, Insert Case, Go to Case, Sort Cases, και Select Cases.
Insert Variable
Με την εντολή Insert variable εισάγουμε μία νέα μεταβλητή σε όποιο σημείο του data editor θέλουμε. Έχοντας επιλέξει το σημείο που μας ενδιαφέρει (κλικ σε κάποιο τετραγωνάκι) επιλέγουμε dataàInsert Variable κι αμέσως εισάγεται μια νέα στήλη στα αριστερά του σημείου που έχουμε επιλέξει. Προφανώς δεν υπάρχουν δεδομένα για τη μεταβλητή αυτή (στα αντίστοιχα κελιά υπάρχει σημειωμένο το «,») και το όνομα που σημειώνει το SPSS αυτόματα είναι Var00001. Από το Variable View θα προσδιορίσουμε το όνομα, τον τύπο, το μέτρο και τα υπόλοιπα χαρακτηριστικά της μεταβλητής, με τη διαδικασία που περιγράψαμε στην παρουσίαση του παραθύρου Variable View.
Insert Case
Με την εντολή Insert Case εισάγουμε μία νέα παρατήρηση σε όποιο σημείο του data editor θέλουμε. Έχοντας επιλέξει το σημείο που μας ενδιαφέρει (κλικ σε κάποιο τετραγωνάκι) επιλέγουμε dataàInsert Case κι αμέσως εισάγεται μια νέα γραμμή επάνω από το σημείο που έχουμε επιλέξει. Προφανώς δεν υπάρχουν δεδομένα για την παρατήρηση αυτή (στα αντίστοιχα κελιά υπάρχει σημειωμένο το «,»).
Go to Case
Την εντολή Go to Case τη χρησιμοποιούμε όταν έχουμε πολλές παρατηρήσεις και δεν επιθυμούμε να χρησιμοποιήσουμε τη δύσχρηστη μερικές φορές scroll bar. Στο πλαίσιο διαλόγου που εμφανίζεται μόλις επιλέξουμε τη συγκεκριμένη εντολή γράφουμε τον αριθμό της παρατήρησης στην οποία θέλουμε να μεταφερθούμε και στην οθόνη μας εμφανίζεται αυτόματα το τμήμα των δεδομένων που περιέχει την παρατήρηση που μας ενδιαφέρει. Πρόκειται για μια λειτουργία παρόμοια με το Find από το μενού Edit.
Select Cases
Ο σκοπός της επιλογής Select Cases είναι να σας επιτρέψει να κάνετε αναλύσεις σ’ ένα υποσύνολο των δεδομένων σας. Πρόκειται για μια ευρέως χρησιμοποιούμενη διαδικασία. Για παράδειγμα, μπορεί να θέλουμε να ξέρουμε τη συχνότητα ή το μέσο μίας ή περισσότερων μεταβλητών μόνον για τις γυναίκες που συμμετείχαν στην έρευνά μας. Αυτό σημαίνει ότι με κάποιο τρόπο θα πρέπει να ζητήσουμε από το SPSS να συμπεριλάβει στη συγκεκριμένη ή στις συγκεκριμένες αναλύσεις μόνον τις παρατηρήσεις που προέρχονται από γυναίκες. Ο τρόπος αυτός είναι η εντολή Select Cases. Μόλις γίνουν οι αναλύσεις με ένα υποσύνολο των δεδομένων, μπορείτε να επιστρέψετε σε ολόκληρο το αρχείο κάνοντας κλικ στο All cases στο πλαίσιο Select Cases.
Αν θέλετε να δημιουργήσετε ένα αρχείο που αποτελείται μόνον από τις επιλεγμένες παρατηρήσεις, πρέπει πρώτα να διαγράψετε τις μη επιλεγμένες παρατηρήσεις και στη συνέχεια να αποθηκεύσετε το αρχείο. Τότε θα παραμείνουν μόνον οι επιλεγμένες παρατηρήσεις. Για να εντοπίζετε ευκολότερα τις παρατηρήσεις που έχουν επιλεγεί και εκείνες που δεν έχουν επιλεγεί, μετά την εντολή select cases τοποθετείται μια διαγώνια γραμμή στον αύξοντα αριθμό κάθε γραμμής που περιέχει μη επιλεγμένη παρατήρηση. Στη συνέχεια, όταν έχουν επιλεγεί συγκεκριμένες παρατηρήσεις, το SPSS δημιουργεί μια νέα μεταβλητή που ονομάζεται filter_$ όπου κωδικοποιούνται σαν 1 οι παρατηρήσεις που έχουν επιλεγεί και σαν 0 αυτές που δεν έχουν επιλεγεί, Μπορείτε να κρατήσετε τη μεταβλητή αυτή για μελλοντική αναφορά (αν θέλετε να κάνετε συγκρίσεις ανάμεσα στις δύο ομάδες), ή μπορείτε να το διαγράψετε.
Από το πλαίσιο Select Cases θα αναλύσουμε μόνον δύο επιλογές. Η επιλογή All cases απλώς απενεργοποιεί την επιλογή select και οι περαιτέρω αναλύσεις γίνονται για όλες τις παρατηρήσεις. Για να αποκτήσετε πρόσβαση στην οθόνη που σας επιτρέπει να δημιουργήσετε υποθέσεις (βάσει των οποίων θα γίνει η επιλογή των παρατηρήσεων) κάντε κλικ στο radio button If condition is satisfied και στη συνέχεια στο πλήκτρο If.
Στο πλαίσιο που ανοίγει μπορείτε είτε να πληκτρολογήσετε είτε να κάνετε κλικ και να επικολλήσετε τις σχετικές πληροφορίες. Στο κάτω μέρος βρίσκεται το πληκτρολόγιο και στα δεξιά οι 70 προεπιλεγμένες συναρτήσεις.
Η επεξήγηση των συμβόλων του πληκτρολογίου φαίνεται στον παρακάτω πίνακα:
+
πρόσθεση
< 
Μικρότερο από
&
και: και οι δύο σχέσεις πρέπει να είναι αληθείς
-
Αφαίρεση
> 
Μεγαλύτερο από

*
Πολλαπλασιασμός
<=
Μικρότερο ή ίσο από
|
ή: οποιαδήποτε σχέση μπορεί να είναι αληθής
/
Διαίρεση
>=
Μεγαλύτερο ή ίσο από

**
Ύψωση σε δύναμη
=
Ίσο
~
άρνηση: το αληθές γίνεται ψευδές, το ψευδές γίνεται αληθές
( )
Σειρά εκτέλεσης πράξεων
~=
Όχι ίσο


Μπορούν να δημιουργηθούν άπειρες υποθέσεις. Ακολουθούν κάποια παραδείγματα:
1.      Έστω η μεταβλητή Sex (φύλο ερωτώμενων)
με κωδικοποίηση: Γυναίκες=1, Άνδρες=2
Θέλουμε να επιλέξουμε τις παρατηρήσεις που προέρχονται από γυναίκες:
Η σχετική υπόθεση εκφράζεται ως: sex = 1
2.      Έστω η μεταβλητή year (έτος σπουδών)
με κωδικοποίηση: πρώτο=1, δεύτερο=2, τρίτο=3, τέταρτο=4
Θέλουμε να επιλέξουμε τις παρατηρήσεις που προέρχονται από πρωτοετείς ή τριτοετείς: (year = 1) | (year = 3)  [φαίνεται στην οθόνη 12]
Οθόνη 12: Το παράθυρο της εντολής Select Cases
Από το μενού Data θα δούμε τις εντολές Compute και Recode.
Compute
Με την εντολή Compute μπορούμε να υπολογίσουμε μία νέα μεταβλητή συναρτήσει κάποιας ήδη υπάρχουσας. Αν για παράδειγμα έχουμε την ηλικία ενός ανθρώπου (age) σε έτη και θέλουμε να την υπολογίσουμε και σε μήνες (age_m) θα χρησιμοποιήσουμε την εντολή Compute. Επιλέγοντας διαδοχικά τις εντολές TransformàCompute εμφανίζεται το παράθυρο διαλόγου Compute Variable, όπως παρουσιάζεται στην οθόνη 13.
Οθόνη 13: Το παράθυρο της εντολής Compute
Στο πλαίσιο υπό τον τίτλο Target Variable που βρίσκεται πάνω αριστερά στο παράθυρο διαλόγου, πληκτρολογούμε το όνομα της νέας μεταβλητής που θέλουμε να ορίσουμε. Να θυμάστε ότι οι κανόνες που αναφέραμε για τα ονόματα μεταβλητών κατά την παρουσίαση του παραθύρου Variable View ισχύουν και για τα ονόματα που επιλέγετε εδώ. Πατώντας το πλήκτρο Type & Label ανοίγει ένα νέο παραθυράκι όπου μπορείτε να ορίσετε τον τύπο και την ετικέτα της νέας σας μεταβλητής. Το τρίτο βήμα είναι ο υπολογισμός της νέας μεταβλητής συναρτήσει κάποιας ήδη υπάρχουσας. Η σχέση που συνδέει τα έτη με τους μήνες είναι 1 προς 12. Επομένως η μεταβλητή που υπολογίζει την ηλικία σε μήνες (age_m) θα ισούται με την τιμή σε ευρώ (age) επί 12. Αυτό ακριβώς πληκτρολογούμε στο πλαίσιο υπό τον τίτλο Numeric Expression. Καλό είναι να χρησιμοποιείτε το πληκτρολόγιο που υπάρχει στο συγκεκριμένο παράθυρο και όχι το πληκτρολόγιο του υπολογιστή σας προκειμένου οι αριθμητικές και λογικές σχέσεις να εκφράζονται με μεγαλύτερη ακρίβεια και με τρόπο κατανοητό για το SPSS.
Με την εντολή Recode μπορούμε να αλλάξουμε την κωδικοποίηση των τιμών μιας μεταβλητής έτσι ώστε να είναι σε μορφή κατάλληλη για τις αναλύσεις μας. Η εντολή αυτή χρησιμοποιείται σε μεταβλητές των οποίων οι τιμές αντιπροσωπεύουν κάποιες κατηγορίες. Για παράδειγμα έστω η μεταβλητή age η οποία μετράει την ηλικία (σε έτη) των συμμετεχόντων σε μια έρευνα.
Εάν επιθυμούμε να διαφοροποιήσουμε την ανωτέρω κωδικοποίηση, μπορούμε χρησιμοποιώντας την εντολή recode να υποδείξουμε ότι η κατηγορία «έως 18» αντιπροσωπεύεται πια από τον αριθμό 1, η «19-24» από τον αριθμό 2, η «25-45» από τον αριθμό 3, η «41-60» από τον αριθμό 4 και η «πάνω από 61» από τον αριθμό 1.
Με τη Recode έχουμε δύο επιλογές: είτε να κάνουμε την επανακωδικοποίηση στην υπάρχουσα μεταβλητή μας αντικαθιστώντας τις παλιές τιμές με τις νέες είτε να δημιουργήσουμε μια καινούρια στην οποία θα καταχωρήσουμε τις νέες διατηρώντας και τις παλαιές στην υπάρχουσα μεταβλητή. Καλό είναι να προτιμάτε τη δημιουργία μιας νέας μεταβλητής ώστε ακόμη κι αν κάνετε κάποιο λάθος να έχετε διατηρήσει την αρχική σας κωδικοποίηση.
Επιλέγοντας TransformàRecodeàInto Different Variables εμφανίζεται το παράθυρο διαλόγου Recode Into Different Variables, όπως στην οθόνη 14.
Οθόνη 14: Το παράθυρο της εντολής Recode
Από τη λίστα με τις μεταβλητές μας αριστερά επιλέγουμε εκείνη που θέλουμε να επανακωδικοποιήσουμε και πατώντας το βελάκι στα δεξιά της λίστα η μεταβλητή μεταφέρεται στο διπλανό πλαίσιο υπό τον τίτλο Numeric VariableàOutput Variable. Στα δύο κενά πλαίσια που υπάρχουν στο αριστερό μέρος του παραθύρου ορίζουμε το όνομα της νέας μεταβλητής (επιλέγουμε το πλήκτρο change για να καταχωρηθεί) και την ετικέτα της. Για να προσδιορίσουμε την αντιστοιχία των νέων και παλιών μεταβλητών επιλέγουμε το πλήκτρο Old and New Values. Εμφανίζεται το παράθυρο διαλόγου που παρουσιάζεται στην οθόνη 15.
Οθόνη 15: Επανακωδικοποίηση της μεταβλητής Age
Στο πλαίσιο Value κάτω από τον τίτλο Old Value πληκτρολογούμε την πρώτη παλαιά τιμή και δίπλα, στο πλαίσιο Value κάτω από τον τίτλο New Value, τη νέα τιμή, αυτή με την οποία θα αντικατασταθεί η παλιά. Στη συνέχεια επιλέγουμε Add και η αντιστοιχία καταχωρείτε στο πλαίσιο OldàNew. Επαναλαμβάνουμε τα παραπάνω βήματα για κάθε τιμή που θέλουμε να επανακωδικοποιήσουμε. Μόλις ολοκληρωθεί η διαδικασία, επιλέγουμε Continue και ΟK.
Η διαδικασία είναι αντίστοιχη και όταν η επανακωδικοποίηση γίνεται στην ίδια μεταβλητή (Recode into Same Variable). Το σημείο που πρέπει να προσέξετε είναι εκείνο όπου η παλιά και η νέα τιμή ταυτίζονται. Όταν η επανακωδικοποίηση γίνεται στην ίδια μεταβλητή, μπορείτε να παραλείψετε την αντιστοιχία. Όταν όμως η επανακωδικοποίηση γίνεται σε διαφορετική μεταβλητή, θα πρέπει σαφώς να ορίζεται, διαφορετικά στις παρατηρήσεις όπου υπάρχει η συγκεκριμένη τιμή στην παλαιά μεταβλητή, στη νέα θα υπάρχει κενό.
Η Recode μπορεί να χρησιμεύσει κατά κύριο λόγο σε τρεις περιπτώσεις.
o   Έχουμε δύο διαφορετικά αρχεία, τα οποία θέλουμε να συγχωνεύσουμε σε ένα για να κάνουμε συνολικές αναλύσεις, με τις ίδιες μεταβλητές αλλά με διαφορετική κωδικοποίηση σε κάποια ή κάποιες. Πριν γίνει η συγχώνευση, προφανώς θα πρέπει να αλλάξει η κωδικοποίηση σε κάποιο από τα δύο έτσι ώστε κάθε νούμερο (σύμβολο κωδικοποίησης) να αντιπροσωπεύει το ίδιο πράγμα.
o   Έχουμε ένα αριθμό κατηγοριών για μια μεταβλητή και θέλουμε να τον μειώσουμε, τοποθετώντας περισσότερες από μια κατηγορίες σε μια νέα ευρύτερη. Για παράδειγμα, έστω ότι σε μια έρευνα στην οποία συμμετέχουν επιχειρήσεις, έχουμε 15 κατηγορίες για τον κλάδο δραστηριότητας. Για κάποιο λόγο επιθυμούμε να τις διακρίνουμε σε τρεις κατηγορίες: πρωτογενής, δευτερογενής και τριτογενής τομέας. Αυτό απαιτεί επανακωδικοποίηση της συγκεκριμένης μεταβλητής.
o   Όταν χρησιμοποιούμε την κλίμακα Likert, οι προτάσεις που επιλέγουμε για να μετρήσουμε ένα συγκεκριμένο χαρακτηριστικό δεν έχουν πάντα (σχεδόν ποτέ) την ίδια «φορά». Δηλαδή αν κάποιος δηλώσει «Διαφωνώ Απόλυτα» στη μία πρόταση, το αναμενόμενο είναι να δηλώσει «Συμφωνώ Απόλυτα» στην άλλη. Προκειμένου να κάνουμε κάποιες αναλύσεις (π.χ. Reliability Analysis) θα πρέπει να τις έχουμε όλες στην ίδια φορά. Θα πρέπει η αναμενόμενη απάντηση σε όλες να είναι η ίδια ή κάποια κοντινή της (π.χ. Διαφωνώ Απόλυτα – Διαφωνώ). Όταν συμβαίνει αυτό, απλώς επιλέγουμε κάποια ή κάποιες μεταβλητές και αντιστρέφουμε την κωδικοποίηση: το 1 γίνεται 5, το 2 γίνεται 4, τό 3 παραμένει 3, το 4 γίνεται 2 και το 5 γίνεται 1.
Count
Με την εντολή count μπορούμε να υπολογίσουμε πόσες φορές εμφανίζεται μια συγκεκριμένη τιμή (ή περισσότερες) σε μια σειρά μεταβλητών. Το αποτέλεσμα της count είναι η δημιουργία μιας νέας μεταβλητής που για κάθε παρατήρηση έχει υπολογίσει τα παραπάνω. Η νέα μεταβλητή μπορεί να πάρει τιμές από 0 (καμία φορά δεν εμφανίστηκε η τιμή (ή οι τιμές) που αναζητούσαμε) μέχρι τον αριθμό των μεταβλητών (εμφανίστηκε σε κάθε μία). Για παράδειγμα, έστω ότι οι μεταβλητές Q1-Q5 μετρούν τη βαθμολογία των μαθητών ενός σχολείου σε πέντε διαγωνίσματα του πρώτου τετράμηνου. Αν θέλουμε να δούμε σε πόσα απ’ αυτά αρίστευσε κάθε μαθητής, μπορούμε χρησιμοποιώντας την εντολή count να μετρήσουμε πόσες φορές εμφανίζεται η τιμή 10 στα πέντε αυτά διαγωνίσματα για κάθε παρατήρηση του αρχείου μας, δηλαδή για κάθε μαθητή.
Από το μενού Transform επιλέγουμε count κι εμφανίζεται το παρακάτω πλαίσιο διαλόγου.
Οθόνη 16α: Το παράθυρο της εντολής Count
Στο πλαίσιο κάτω από τον τίτλο target variable εισάγουμε το όνομα της νέας μεταβλητής που θέλουμε να εισάγουμε. Προσέξτε ότι το όνομα αυτό υπόκειται στους περιορισμούς που αναφέραμε σε προηγούμενη συζήτηση για το παράθυρο variable view. Από τις διαθέσιμες μεταβλητές, που βρίσκονται στο αριστερό μέρος του παραθύρου επιλέγουμε εκείνες, στις οποίες θέλουμε να γίνει η αναζήτηση. Μόλις επιλέξουμε τις μεταβλητές, γίνεται ενεργό το πλήκτρο Define Values, το οποίο μόλις επιλέξουμε μας οδηγεί στο υπομενού της παρακάτω οθόνης.
Οθόνη 16β: Το παράθυρο της εντολής Count
Το παράθυρο στο οποίο οδηγεί η επιλογή Define Values χωρίζεται σε δύο μέρη. Στο αριστερό κομμάτι υπάρχουν μια σειρά επιλογές, με τη χρήση των οποίων μπορούμε να ορίσουμε διακριτές τιμές (value) ή κάποιο εύρος τιμών (Range), τις οποίες θα αναζητήσει το SPSS στις μεταβλητές που ήδη έχουμε ορίσει. Για να ολοκληρωθεί η επιλογή των τιμών αυτών θα πρέπει να τις καταχωρήσουμε, χρησιμοποιώντας το πλήκτρο add, στο πλαίσιο Values to Count. Το πλήκτρο Add, το οποίο στην οθόνη μας είναι ανενεργό, ενεργοποιείται αμέσως μόλις πληκτρολογήσουμε κάποια από τις τιμές στο αριστερό τμήμα του παραθύρου.
Εκτός από την επιλογή Value που αναφέρεται σε διακριτές τιμές, υπάρχουν επιλογές για εύρος τιμών.
α) range:  ……through……
Σ’ αυτή την περίπτωση πρέπει να δηλώσουμε και τα δύο άκρα του διαστήματος τιμών που επιθυμούμε να ορίσουμε. Για παράδειγμα, μπορούμε να ζητήσουμε να υπολογιστούν οι φορές που εμφανίζεται κάποια τιμή, η οποία ανήκει στο διάστημα 5 έως 10. Αυτό συμβαίνει αν πληκτρολογήσουμε την τιμή 5 στο πρώτο πλαίσιο και την τιμή 10 στο δεύτερο (5 through 10).

β) range:  Lowest through    ……
Σ’ αυτή την περίπτωση δηλώνουμε μόνον το άνω άκρο το διαστήματος, το οποίο συμπεριλαμβάνει όλες τιμές που είναι μικρότερες ή ίσες από την τιμή που ορίσαμε. Για παράδειγμα αν ορίσουμε Lowest through 10, όλες οι τιμές που είναι μικρότερες ή ίσες με το 10 θα υπολογιστούν.

γ) range:  …….. through highest
Σ’ αυτή την περίπτωση δηλώνουμε μόνον το κάτω άκρο το διαστήματος, το οποίο συμπεριλαμβάνει όλες τιμές που είναι μεγαλύτερες ή ίσες από την τιμή που ορίσαμε. Για παράδειγμα αν ορίσουμε 10 through highest, όλες οι τιμές που είναι μεγαλύτερες ή ίσες με το 10 θα υπολογιστούν.

Το σύνολο των εντολών υπό τον όρο Utilities αφορά εξαιρετικά περίπλοκες εφαρμογές και διαδικασίες που ξεπερνούν κατά πολύ το σκοπό του μαθήματος και των σημειώσεων. Το μενού Windows απλώς παρέχει έναν εναλλακτικό τρόπο εναλλαγής μεταξύ των τριών διαφορετικών παραθύρων που είναι διαθέσιμα στο SPSS (Data View, Variable View, Output Navigator, περιγράφονται παρακάτω). Το μενού Help παρέχει εξαιρετική βοήθεια οποιαδήποτε στιγμή κι αν τη χρειαστείτε. Μπορείτε να χρησιμοποιήσετε το ευρετήριο ή την ελεύθερη αναζήτηση προκειμένου να δείτε πληροφορίες σχετικά με κάποια από τις αναλύσεις ή τις διαθέσιμες λειτουργίες του SPSS. Επίσης στο πλαίσιο διαλόγου κάθε ανάλυσης είναι διαθέσιμο ένα πλήκτρο Help, το οποίο εάν επιλέξετε θα σας δώσει μια σύντομη περιγραφή της ανάλυσης την οποία επιχειρείτε. 
Με το μενού Graphs δεν θα ασχοληθούμε εδώ καθώς τα γραφήματα που θα μας χρειαστούν θα τα παρουσιάσουμε μέσα από τις αντίστοιχες αναλύσεις.

 Το μενού Analyze
Από το μενού Analyze θα δούμε τις εντολές Descriptive Statistics (Frequencies, Crosstabs).
Frequencies
Με την εντολή Frequencies, το SPSS υπολογίζει τη συχνότητα εμφάνισης κάθε τιμής των μεταβλητών που έχουμε επιλέξει καθώς επίσης και κάποια βασικά μέτρα περιγραφικής στατιστικής. Επιλέγουμε διαδοχικά Analyzeà Descriptive StatisticsàFrequencies κι εμφανίζεται το αντίστοιχο παράθυρο διαλόγου, όπως φαίνεται στην παρακάτω οθόνη.
Οθόνη 17α: Το παράθυρο της εντολής Frequencies
Επιλέγουμε τις μεταβλητές εκείνες για τις οποίες θέλουμε να υπολογίσουμε συχνότητες και άλλα στατιστικά μέτρα και στη συνέχεια τις μεταφέρουμε στο πλαίσιο υπό τον τίτλο Variables. Επιλέγουμε το πλήκτρο Statistics για να προσδιορίσουμε ποια μέτρα ακριβώς θέλουμε να υπολογιστούν και να παρουσιάζονται στα αποτελέσματά μας. Εμφανίζεται το παρακάτω παράθυρο με όλες τις διαθέσιμες επιλογές και εκεί επιλέγουμε αυτές που ταιριάζουν (έχουν νόημα) στις μεταβλητές που μας ενδιαφέρουν.
Οθόνη 17β: Το παράθυρο της εντολής Frequencies
Επειδή οι εντολές στο SPSS είναι στην αγγλική γλώσσα, θα δώσουμε τη μετάφραση των όρων που φαίνονται στο παραπάνω παράθυρο. Η ερμηνεία τους είναι διαθέσιμη στο βιβλίο στατιστικής που έχετε.
Percentile Values = Τιμές Ποσοστώσεων
Quartiles = Τεταρτημόρια
Cut points for ___ equal groups =Σημεία τομής για __ ισοδύναμες ομάδες
Percentile(s) = Ποσοστώσεις
Dispersion = Διασπορά
Std. Deviation =Τυπική απόκλιση
Variance =Διακύμανση
Range = Εύρος
Minimum = Ελάχιστο
Maximum = Μέγιστο
S.E. mean = Τυπικό Σφάλμα Μέσου
Central Tendency = Κεντρική Τάση
Mean = Μέσος
Median = Διάμεσος
Mode = Επικρατούσα Τιμή
Sum = Άθροισμα
Distribution = Κατανομή
Skewness = Ασυμμετρία
Kurtosis = Κύρτωση

Αφού επιλέξετε τα μέτρα που σας ενδιαφέρουν, επιλέγετε Continue και βρίσκεστε ξανά στο κεντρικό παράθυρο των frequencies. Επιλέγοντας το πλήκτρο Chart, εμφανίζεται το παρακάτω παράθυρο στο οποίο έχετε τη δυνατότητα να επιλέξετε τη γραφική απεικόνιση των δεδομένων σας.
Οθόνη 17γ: Το παράθυρο της εντολής Frequencies
Αν επιλέξετε το ραβδόγραμμα (Bar Chart) ή το κυκλικό διάγραμμα (Pie Chart), τότε μπορείτε να προσδιορίσετε αν στις ράβδους ή στις φέτες του κυκλικού διαγράμματος θα απεικονίζονται οι συχνότητες ή τα αντίστοιχα ποσοστά. Αφού ορίσετε τις επιλογές σας, επιλέγετε Continue κι επανέρχεστε στο αρχικό παράθυρο των frequencies. Εκεί μπορείτε να διατηρήσετε την ήδη επιλεγμένη εντολή Display Frequency Tables ή να την ακυρώσετε (αποεπιλέγοντάς την). Συνήθως δεν τη διατηρούμε όταν οι μεταβλητές μας έχουν πάρα πολλές πιθανές τιμές, πράγμα που σημαίνει ότι θα προκύψει ένας εξαιρετικά μεγάλος και δύσχρηστος πίνακας, πολλά από τα κελιά του οποίου δεν αποκλείεται να είναι κενά (ανάλογα τον αριθμό των παρατηρήσεων που έχουμε συγκεντρώσει). Κάνοντας κλικ στο OK, το SPSS θα τρέξει την ανάλυση που του ζητήσαμε και μόλις αυτή ολοκληρωθεί θα ανοίξει το παράθυρο των αποτελεσμάτων με τα αριθμητικά και γραφικά αποτελέσματα της ανάλυσής μας.
Οι δύο παρακάτω εικόνες παρουσιάζουν τους πίνακες που προκύπτουν από την ανάλυση Frequencies.
Στον πρώτο πίνακα εμφανίζονται οι τιμές για τα διάφορα μέτρα που επιλέξαμε. Θα σταθούμε ιδιαίτερα στα μέτρα κανονικότητας, την κύρτωση και την ασυμμετρία, για να διευκρινιστεί ότι οι τιμές τους δείχνουν αν μπορεί η κατανομή που εξετάζουμε να θεωρηθεί ότι προσεγγίζει την κανονική κατανομή –κι επομένως μπορεί να συμμετέχει σε παραμετρικούς ελέγχους- ή όχι. Το ιδανικό διάστημα για τις τιμές αυτές είναι το ±1, ενώ στις περισσότερες περιπτώσεις μπορούμε να δεχτούμε και τιμές που δεν ξεπερνούν τα όρια του διαστήματος ±2.
Ο δεύτερος είναι ο πίνακας συχνοτήτων για τη μεταβλητή Quiz1 (όπως φαίνεται και από τον τίτλο του). Στην πρώτη στήλη φαίνονται οι πιθανές τιμές της μεταβλητής. Στη δεύτερη η συχνότητα εμφάνισης κάθε μίας από αυτές στα δεδομένα μας. Στην τρίτη το αντίστοιχο ποσοστό στο σύνολο των παρατηρήσεων ενώ στην τέταρτη το ποσοστό στο σύνολο των έγκυρων παρατηρήσεων (εξαιρούνται δηλαδή τα missing values—στη συγκεκριμένη περίπτωση δεν έχουμε). Τέλος στην τελευταία στήλη παρουσιάζονται τα αθροιστικά ποσοστά. Να θυμάστε ότι τα αθροιστικά ποσοστά στηρίζονται πάντα στα έγκυρα, δηλαδή στη στήλη Valid Percent.
Με την εντολή Crosstabs μπορούμε να παρουσιάσουμε σε μορφή πίνακα τη σχέση μεταξύ δύο ποιοτικών μεταβλητών. Οι ποιοτικές μεταβλητές είναι εκείνες που έχουν διακριτές κατηγορίες, όπως το φύλο (γυναίκα, άνδρας), τόπος κατοικίας (πόλη, προάστια, εξοχή), απαντήσεις (ναι, όχι), βαθμός (A, B, C, D, F) και πολλές άλλες. Η εντολή Crosstabs μπορεί να χρησιμοποιηθεί και για συνεχή δεδομένα μόνον αν αυτά τα δεδομένα είναι χωρισμένα σε ξεχωριστές κατηγορίες, όπως για παράδειγμα η ηλικία (0-19 έτη, 20-39 έτη, 40-59 έτη, 60-79 έτη, 80-99 έτη).
Μπορούμε επίσης να παρουσιάσουμε τη σχέση δύο μεταβλητών με βάση κάποια τρίτη. Έστω ότι υπάρχουν τρία τμήματα (section) που παρακολουθούν ένα μάθημα, στα οποία υπάρχουν φοιτητές και μαθήτριες (gender) διαφορετικών εθνικοτήτων (ethnicit). Μπορούμε να δούμε πώς σχετίζονται οι δύο μεταβλητές gender και ethnicit ανά τμήμα (section). Δηλαδή θα έχουμε στα αποτελέσματα ουσιαστικά τρεις πίνακες, έναν για κάθε τμήμα.
Κάνοντας διαδοχικά κλικ στις εντολές AnalyzeàDescriptive StatisticsàCrosstabs εμφανίζεται το αντίστοιχο παράθυρο διαλόγου, όπως φαίνεται στην παρακάτω οθόνη.
Οθόνη 18α: Το παράθυρο της εντολής Crosstabs
Στο παράθυρο αυτό, με τη γνωστή πλέον διαδικασία, επιλέγουμε τις μεταβλητές που μας ενδιαφέρουν και τις τοποθετούμε στις αντίστοιχες θέσεις. Ποια από τις δύο μεταβλητές θα είναι στο πλαίσιο Rows και ποια στο columns έχει μικρή σημασία. Εκείνο στο οποίο θα πρέπει να δώσετε προσοχή είναι ότι στο τρίτο διαθέσιμο πλαίσιο υπό το layer 1 of 1 τοποθετείται η μεταβλητή κριτήριο (στο παράδειγμά μας η section). Θεωρητικά απ’ το μενού στο οποίο οδηγεί το πλήκτρο cells, θα πρέπει να σημειώσουμε την επιλογή Observed για να προκύψει ο παρακάτω πίνακας· επειδή όμως αποτελεί επιλογή που κάνει εξ ορισμού το SPSS, μπορούμε να το παραλείψουμε. Αφού καθορίσουμε όλες τις μεταβλητές μας, κάνουμε κλικ στο OK και το SPSS ετοιμάζει τα αποτελέσματά μας, όπως φαίνονται στην παρακάτω οθόνη.
Οι αριθμοί στα κελιά αντιπροσωπεύουν τον αριθμό των παρατηρήσεων που πληρούν και τις τρεις προϋποθέσεις για κάθε κελί (τμήμα, φύλο, εθνικότητα). Η τελευταία γραμμή και η τελευταία στήλη δίνουν το συνολικό αριθμό παρατηρήσεων για την αντίστοιχη κατηγορία που υπολογίζουν.
Εκτός από τις απόλυτες συχνότητες μπορούμε να ζητήσουμε και την εμφάνιση ποσοστών. Από το κεντρικό παράθυρο των crosstabs, επιλέγουμε το πλήκτρο cells ώστε να εμφανιστούν περισσότερες επιλογές, οι οποίες φαίνονται στην παρακάτω οθόνη.
Οθόνη 18β: Το παράθυρο της εντολής Crosstabs:Cell Display
Η επιλογή Observed, όπως ήδη έχει αναφερθεί, είναι πάντα επιλεγμένη. Από το υπομενού percentages έχουμε τρεις διαθέσιμες επιλογές: για κάθε κελί των crosstabs να εμφανίζεται το ποσοστό που αντιπροσωπεύει η συχνότητα στο σύνολο των συχνοτήτων α) της γραμμής στην οποία ανήκει (rows), β) της στήλης στην οποία ανήκει (columns) και γ) στο σύνολο (total).
Το μενού Graphs
Παρόλο που ήδη έχουμε αναφερθεί στην μεγάλη ποικιλία γραφημάτων που είναι διαθέσιμα στο μενού graphs, εξηγώντας ότι ξεπερνά το σκοπό των σημειώσεων αυτών μια εκτενής περιγραφή τους, είναι σκόπιμο να εξετάσουμε ένα ιδιαίτερα χρήσιμο γράφημα, το Box Plot ή Box Whisker. Το διάγραμμα αυτό είναι γνωστό και ως το διάγραμμα των 5 σημείων, ακριβώς επειδή απεικονίζει πέντε στατιστικά μέτρα.
Για να το δημιουργήσουμε επιλέγουμε από το μενού Graphs την εντολή Boxplot. Εμφανίζεται το παρακάτω πλαίσιο διαλόγου (BoxPlot), απ’ το οποίο επιλέγουμε το απλό  (Simple) διάγραμμα και ζητάμε τα δεδομένα στο γράφημα (Data in chart are) να αντιπροσωπεύουν ξεχωριστές μεταβλητές (summaries of separate variables). Στη συνέχεια, επιλέγουμε το πλήκτρο Define για να προσδιορίσουμε τη μεταβλητή (ή τις μεταβλητές) για την οποία θα δημιουργηθεί το Box Plot. Από τις διαθέσιμες μεταβλητές (αριστερά) επιλέγουμε και τοποθετούμε αυτές που χρειαζόμαστε στο πλαίσιο Boxes Represent.

Οθόνη 19α: Το παράθυρο του γραφήματος Box-Whisker
Ένα τυπικό γράφημα Box Plot είναι σαν αυτό που παρουσιάζεται στη συνέχεια. Όπως μπορούμε να δούμε τα πέντε στατιστικά μέτρα, στα οποία αναφερθήκαμε, είναι εκείνα που παρουσιάζονται στα δεξιά του: η διάμεσος, η τιμή που αντιστοιχεί στο 25% των παρατηρήσεων (1ο τεταρτημόριο), η τιμή που αντιστοιχεί στο 75% των παρατηρήσεων (3ο τεταρτημόριο), η μέγιστη τιμή και η ελάχιστη τιμή.
Οι απολήξεις του γραφήματος απεικονίζουν τη μέγιστη και την ελάχιστη τιμή της κατανομής. Εξαίρεση αποτελεί η περίπτωση κατά την οποία η μέγιστη (ή η ελάχιστη) τιμή απέχει από το σημείο του 3ου τεταρτημόριου (ή του 1ου τεταρτημόριου) περισσότερο από 1.5 φορά το ενδοτεταρτημοριακό εύρος. Σ’ αυτή την περίπτωση οι απολήξεις του γραφήματος είναι σε τιμές που πληρούν αυτή την προϋπόθεση και οι τυχόν μεγαλύτερες ή μικρότερες εμφανίζονται ως ακραίες τιμές.

Εικόνα 19β: Ενδεικτικό γράφημα Box-Whisker
3.2 Crosstabs και Ανάλυση  X2
Ο ΣΚΟΠΟΣ της crosstabulation είναι να παρουσιάσει σε μορφή πίνακα τη σχέση μεταξύ δύο ή περισσότερων ποιοτικών μεταβλητών. Οι ποιοτικές μεταβλητές περιλαμβάνουν εκείνες στις οποίες ενυπάρχουν διακριτές κατηγορίες, όπως το φύλο (γυναίκα, άνδρας), η εθνικότητα (Ασιάτες, Λευκοί, ισπανόφωνοι), τόπος κατοικίας (πόλη, προάστια, εξοχή), απαντήσεις (ναι, όχι), βαθμός (A, B, C, D, F) και πολλές άλλες. Η διασταύρωση πινάκων μπορεί να χρησιμοποιηθεί για συνεχή δεδομένα μόνον αν τα δεδομένα αυτά είναι χωρισμένα σε διακριτές κατηγορίες, όπως η ηλικία (0-19 έτη, 20-39 έτη, 40-59 έτη, 60-79 έτη, 80-99 έτη), το σύνολο βαθμών (0-99, 100- 149, 150-199, 200-250), και ούτω καθ’ εξής. Παρόλο που είναι αποδεκτό να κάνετε διασταύρωση πινάκων με συνεχή δεδομένα που έχουν κατηγοριοποιηθεί, είναι σπάνιο επειδή κατά τη διάρκεια της κατηγοριοποίησης χάνονται πολλές χρήσιμες πληροφορίες. Για παράδειγμα, στην κατανομή του συνόλου των βαθμών (παραπάνω), δύο άτομα που συγκέντρωσαν 99 και 100 βαθμούς αντίστοιχα, θα βρίσκονταν στην πρώτη και δεύτερη κατηγορία και θα θεωρούνταν πανομοιότυποι με δύο άτομα που συγκέντρωσαν 0 και 149 βαθμούς, αντίστοιχα. Παρόλα αυτά η ανάλυση crosstabs με συνεχή δεδομένα χρησιμοποιείται συχνά για λόγους περιγραφής και παρουσίασης δεδομένων. Η εντολή του SPSS Crosstabs (=πίνακες διπλής εισόδου) και οι υποεντολές Cells (=κελιά) και Statistics (=στατιστικά στοιχεία) χρησιμοποιούνται για να αποκτήσει κανείς πρόσβαση σε όλες τις απαραίτητες πληροφορίες σχετικά με τις συγκρίσεις μεταξύ συχνοτήτων.
Crosstabs
Ενώ η εντολή Frequencies μπορεί να μας πει ότι υπάρχουν 5 Ιθαγενείς, 20 Ασιάτες, 24 Μαύροι, 45 Λευκοί, και 11 ισπανόφωνοι (και ότι υπάρχουν 64 γυναίκες και 41 άνδρες) στο αρχείο grades.sav, δεν μπορεί να μας πει πόσες γυναίκες Ασιάτισσες ή πόσοι Λευκοί άνδρες υπάρχουν. Αυτή είναι η λειτουργία της εντολής Crosstabs. Θα ήταν σωστό να «διασταυρώσουμε» δύο μεταβλητές (την ethnic με τη sex) για να απαντήσουμε τις ερωτήσεις που τίθενται παραπάνω. Αυτό θα είχε σαν αποτέλεσμα έναν πίνακα με 10 διαφορετικά κελιά με τις σχετικές συχνότητες σε καθένα από αυτά διασταυρώνοντας τα δύο (2) επίπεδα του φύλου (sex) με τα πέντε (5) επίπεδα της εθνικότητας (ethnic). Είναι δυνατό να διασταυρώσετε τρεις ή περισσότερες μεταβλητές, παρόλο που κάποιος ερευνητής θα έκανε διασταύρωση πινάκων με τρεις μεταβλητές μόνον αν διέθετε ένα πολύ μεγάλο σύνολο δεδομένων γιατί διαφορετικά θα υπήρχαν πολλά κελιά με ελάχιστα δεδομένα -ακόμα και άδεια κελιά, αν ο αριθμός των παρατηρήσεων δεν ήταν επαρκής. Για το δείγμα που έχουμε εδώ μια διασταύρωση των μεταβλητών ethnic, sex, grade μάλλον δεν συνιστάται. Η διαδικασία θα δημιουργούσε μια παρουσίαση συχνοτήτων 5 (ethnic) x 2(sex) x 5 (grade) – ένα σύνολο από 50 κελιά που θα έπρεπε να συμπληρωθούν με 105 μόνον παρατηρήσεις. Σ’ αυτή την περίπτωση θα υπήρχε σίγουρα ένας μεγάλος αριθμός κελιών με ελάχιστα ή καθόλου δεδομένα. Αν μια τέτοια διασταύρωση πινάκων δημιουργούνταν με μεγαλύτερο δείγμα, το SPSS θα παρήγαγε πέντε διαφορετικούς πίνακες 5x2 για να παρουσιάσει αυτά τα δεδομένα.

ΕΛΕΓΧΟΙ ΑΝΕΞΑΡΤΗΣΙΑΣ CHI-SQUARE (χ2)
Μαζί με τις συχνότητες ( ή πραγματικές τιμές) μέσα σε κάθε κελί του πίνακα διπλής εισόδου, το SPSS μπορεί να υπολογίσει την αναμενόμενη τιμή για κάθε κελί. Η αναμενόμενη τιμή βασίζεται στην υπόθεση ότι οι δύο μεταβλητές είναι ανεξάρτητες μεταξύ τους. Με ένα απλό παράδειγμα θα παρουσιάσουμε πώς προκύπτει η αναμενόμενη τιμή. Υποθέστε ότι υπάρχει μια ομάδα 100 ανθρώπων σε ένα δωμάτιο εκ των οποίων οι 30 είναι άνδρες και οι 70 γυναίκες. Αν υπάρχουν 10 Ασιάτες στην ομάδα, θα προσδοκούσαμε (αναμενόμενη τιμή) –αν οι δύο μεταβλητές είναι ανεξάρτητες μεταξύ τους—ότι ανάμεσα στους 10 Ασιάτες θα υπήρχαν 3 άνδρες και 7 γυναίκες (η ίδια αναλογία που παρατηρείται και στο σύνολο της ομάδας). Πάντως, στην ίδια ομάδα των 100, αν 10 απ’ αυτούς έπαιζαν ποδόσφαιρο δεν θα περιμέναμε 3 άνδρες παίκτες και 7 γυναίκες παίκτριες. Στην σύγχρονη κοινωνία, οι περισσότεροι ποδοσφαιριστές είναι άνδρες και οι δύο κατηγορίες (φύλο και παίκτης ποδοσφαίρου) δεν είναι ανεξάρτητες μεταξύ τους. Αν δεν υπήρχαν καθόλου επιπλέον πληροφορίες, θα περιμέναμε ότι και οι 10 παίκτες θα ήταν άνδρες. Ο σκοπός ενός ελέγχου ανεξαρτησίας chi-square είναι να καθορίσει αν οι πραγματικές τιμές για τα κελιά αποκλίνουν σημαντικά από τις αντίστοιχες αναμενόμενες τιμές. Τα στατιστικά μέτρα για την chi-square υπολογίζονται αθροίζοντας τα τετράγωνα των αποκλίσεων [πραγματική τιμή (f0) μείον την αναμενόμενη τιμή (fe)] διαιρεμένα με την αναμενόμενη τιμή για κάθε κελί:
χ2 = Σ[(f0 -fe)2/fe]
Όπως μπορείτε να δείτε, αν υπάρχει μεγάλη ασυμφωνία μεταξύ των πραγματικών και των αναμενόμενων τιμών, η τιμή της χ2 θα είναι μεγάλο, υποδηλώνοντας σημαντική διαφορά μεταξύ των πραγματικών και των αναμενόμενων τιμών. Μαζί με το μέτρο αυτό υπολογίζεται και μια τιμή πιθανότητας. Με p < 0.05, είναι κοινώς αποδεκτό ότι οι τιμές που παρατηρήθηκαν διαφέρουν σημαντικά από τις αναμενόμενες τιμές και ότι οι δύο μεταβλητές ΔΕΝ είναι ανεξάρτητες μεταξύ τους. Πληρέστερες περιγραφές και ορισμοί συμπεριλαμβάνονται στην ενότητα των αποτελεσμάτων αυτού του κεφαλαίου.
Ένα επιπλέον ζήτημα είναι το γεγονός ότι ένα μέτρο της chi-square θεωρείται συχνά έλεγχος σχέσης (το αντίθετο της ανεξαρτησίας) μεταξύ μεταβλητών. Αυτή η άκυρη υπόθεση μπορεί να δημιουργήσει δυσκολίες επειδή μια τιμή chi-square εξαρτάται σημαντικά από τον αριθμό των διαστάσεων και το μέγεθος του δείγματος κι επομένως οι συγκρίσεις μιας τιμής chi-square με μια άλλη είναι συχνά παραπλανητικές. Για να ελέγξουμε αυτή τη δυσκολία, ο Pearson πρότεινε το μέτρο (φ), το οποίο διαιρεί την τιμή της chi-square με το πλήθος του δείγματος (Ν) και στη συνέχεια λαμβάνει τη θετική τετραγωνική ρίζα του αποτελέσματος. Ο σκοπός ήταν να τυποποιηθεί ένα μέτρο σχέσης σε τιμές ανάμεσα στο 0 και το 1 (με το 0 να υποδηλώνει εντελώς ανεξάρτητες μεταβλητές και μια τιμή κοντά στο 1 να υποδηλώνει μια ισχυρή σχέση μεταξύ μεταβλητών). Παρόλα αυτά, αν μία από τις διαστάσεις της διασταύρωσης είναι μεγαλύτερη του 2, το φ μπορεί να πάρει τιμή μεγαλύτερη του 1.0. Για να ελεγχθεί αυτό παρουσιάστηκε το Cramér’s V(η θετική τετραγωνική ρίζα του χ2/[Ν(k-1)], όπου k είναι ο μικρότερος από τον αριθμό των στηλών και των γραμμών). Αυτό το μέτρο όντως ποικίλει ανάμεσα στο 0 και το 1.0 και είναι ένα ευρέως χρησιμοποιούμενο μέτρο για τη δύναμη της σχέσης μεταξύ των μεταβλητών σε μια ανάλυση chi-square.
Το αρχείο που χρησιμοποιούμε για να παρουσιάσουμε τα Crosstabs στο παράδειγμά μας περιγράφεται στην αρχή. Το αρχείο καλείται grades.sav κι έχει αριθμό παρατηρήσεων Ν = 105. Η ανάλυση που παρουσιάζουμε στη συνέχεια δημιουργεί πίνακες διπλής εισόδου και υπολογίζει στατιστικά μέτρα chi-square για τις μεταβλητές sex και ethnic.

ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ
Crosstabs και Έλεγχοι Ανεξαρτησίας Chi-Square
Από το Μενού Analyze, επιλέγεται την εντολή Descriptive Statistics και στη συνέχεια την υποεντολή Corsstabs.
Ένα νέο παράθυρο εμφανίζεται τώρα (Οθόνη 20, παρακάτω) που παρέχει το σκελετό για τη διεξαγωγή μιας ανάλυσης διασταύρωσης πινάκων. Η διαδικασία που πρέπει να ακολουθήσετε είναι να κάνετε κλικ στην επιθυμητή μεταβλητή από τη λίστα που βρίσκεται αριστερά (τη sex σ’ αυτό το παράδειγμα), στη συνέχεια κλικ στο βέλος (4) που βρίσκεται πάνω πάνω για να δηλώσετε ότι επιθυμείτε το φύλο να είναι η μεταβλητή που αντιστοιχεί στις γραμμές του πίνακα. Στη συνέχεια κάντε κλικ σε μια δεύτερη μεταβλητή (την ethnic σ’ αυτό το παράδειγμα) και κάντε κλικ στο μεσαίο βέλος (για να δηλώσετε ότι επιθυμείτε η εθνικότητα να είναι η μεταβλητή που αντιστοιχεί στις στήλες). Αυτό είναι το μόνο απαραίτητο για τη δημιουργία ενός  πίνακα διπλής εισόδουγια δύο μεταβλητές. Αυτό θα δημιουργήσει έναν πίνακα 2 (sex) επί 5 (ethnic) που περιέχει 10 κελιά.
Οθόνη 20:
Το Παράθυρο Crosstabs
Το τρίτο πλαίσιο στο παράθυρο επιτρέπει τη διασταύρωση πινάκων για τρεις ή περισσότερες μεταβλητές. Αν, για παράδειγμα, θέλαμε να βρούμε το φύλο κατά εθνικότητα για τα τρία τμήματα, θα κάναμε κλικ στη μεταβλητή section στη λίστα με τις μεταβλητές και στη συνέχεια κλικ στο βέλος που βρίσκεται κάτω κάτω. Αυτό θα είχε σαν αποτέλεσμα τρεις πίνακες: Έναν με το φύλο κατά εθνικότητα για το πρώτο τμήμα, ένα με το φύλο κατά εθνικότητα για το δεύτερο τμήμα, κι ένα με το φύλο κατά εθνικότητα για το τρίτο τμήμα. Τα πλήκτρα Previous (=προηγούμενο) και Next (=επόμενο) στα αριστερά και δεξιά του Layer 1 of 1 θα χρησιμοποιούνταν αν θέλαμε την ανάλυση για το φύλο κατά εθνικότητα για περισσότερες από μία μεταβλητές. Για παράδειγμα, αν θέλατε αυτή την ανάλυση και για κάθε τμήμα και για κάθε έτος  (έτος στο σχολείο), θα έπρεπε να κάνετε κλικ στη μεταβλητή section (=τμήμα), κλικ στο βέλο κάτω κάτω, κλικ στο Next, κλικ στο year (=έτος), και στη συνέχεια κλικ ξανά στο βέλος κάτω κάτω. Αυτό θα είχε σαν αποτέλεσμα τρεις 2 x 5 πίνακες για το τμήμα και τέσσερις 2 x 5 πίνακες για το έτος.
Είναι σπάνιο για έναν ερευνητή να θέλει να υπολογίσει μόνο κελιά συχνοτήτων. Μαζί με τις συχνότητες είναι δυνατό να συμπεριλάβετε μέσα σε κάθε κελί μια σειρά επιπλέον επιλογών. Αυτές που χρησιμοποιούνται πιο συχνά παρουσιάζονται παρακάτω συνοδευόμενες από ένα σύντομο ορισμό. Όταν πατήσετε το πλήκτρο Cells (= κελιά) (Οθόνη 20), εμφανίζεται μια καινούρια οθόνη (Οθόνη 21, παρακάτω) που σας επιτρέπει να σημειώσετε μια σειρά επιλογών. Ο αριθμός παρατηρήσεων Observed είναι η αρχικά επιλεγμένη. Ο αριθμός παρατηρήσεων Expected (συχνά αναφερόμαστε σ’ αυτόν ως αναμενόμενη τιμή)  είναι σε πολλές περιπτώσεις επίσης επιθυμητή επιλογή. Το αν θα συμπεριληφθούν κι άλλες τιμές εξαρτάται από την προτίμηση του ερευνητή.
Οθόνη 21:
Το Παράθυρο Crosstabs: Cell Display

o   Observed Count (=εκτίμηση που έχει παρατηρηθεί)
Ο πραγματικός αριθμός παρατηρήσεων σε κάθε κελί.
o   Expected Count (=αναμενόμενη εκτίμηση)
Η αναμενόμενη τιμή για κάθε κελί.
o   Row Percentages (=ποσοστά γραμμών)
Το ποσοστό των τιμών σε κάθε κελί γι’ αυτή τη γραμμή.
o   Column Percentages (=ποσοστά στηλών)
Το ποσοστό των τιμών σε κάθε κελί γι’ αυτή τη στήλη.
o      Total Percentages (=συνολικά ποσοστά)
Το ποσοστό των τιμών σε κάθε κελί για ολόκληρο τον πίνακα.
o   Unstandardized Residuals (=μη  τυποποιημένα υπόλοιπα)
Πραγματική τιμή μείον αναμενόμενη τιμή.

Μέχρι τώρα έχουμε απλώς δημιουργήσει πίνακες με νούμερα στα κελιά τους. Συνήθως, μαζί με την ανάλυση crosstabs, γίνεται και μια ανάλυση chi-square. Αυτό απαιτεί ένα κλικ στο πλήκτρο statistics (δείτε Οθόνη 20). Όταν κάνουμε κλικ σ’ αυτό το πλήκτρο, ανοίγει ένα νέο παράθυρο (Οθόνη 22, παρακάτω). Εδώ υπάρχουν πολλοί διαφορετικοί έλεγχοι ανεξαρτησίας ή σχέσης. Εμείς θα εξετάσουμε μόνον τους ελέγχους Chi-square και Phi and Cramér’s V. Όπως και στο παράθυρο Cells, η διαδικασία είναι να κάνουμε κλικ στο μικρό κουτί στα αριστερά του επιθυμητού στατιστικού μέτρου πριν επιστρέψουμε στην προηγούμενη οθόνη για να κάνουμε την ανάλυση.
Οθόνη 22:
Το Παράθυρο Crosstabs: Statistics
Συχνά θέλουμε να κάνουμε ανάλυση crosstabs ή ανάλυση chi-square σ’ ένα υποσύνολο μιας συγκεκριμένης μεταβλητής. Για παράδειγμα, στη διασταύρωση των μεταβλητών sex και ethnic που περιγράφηκε νωρίτερα, μπορεί να θέλουμε να εξαιρέσουμε την κατηγορία «Ιθαγενείς» από την ανάλυση μιας και υπάρχουν μόλις 5 τέτοιες παρατηρήσεις και προηγούμενες αναλύσεις έδειξαν ότι υπάρχει πρόβλημα με κελιά που έχουν χαμηλό αριθμό παρατηρήσεων. Αυτό σημαίνει δημιουργία μιας 2 (επίπεδα φύλου) x 4 (επίπεδα εθνικότητας μετά την εξαίρεση του πρώτου επιπέδου) ανάλυσης. Αφού έχετε επιλέξει τις μεταβλητές για το crosstabs, έχετε επιλέξει τις τιμές των κελιών και τα επιθυμητά στατιστικά μεγέθη, τότε κάντε κλικ στην εντολή Data (=δεδομένα) στη κεντρική μπάρα στο πάνω μέρος της οθόνης. Σ’ αυτό το μενού επιλογών που ανοίγει παρακάτω, κάντε κλικ στο Select Cases (επιλογή περιπτώσεων). Στο παράθυρο που εμφανίζεται, κάντε κλικ στο κυκλάκι στα δεξιά του Ιf condition is satisfied (=αν ικανοποιείται η συνθήκη) (έτσι ώστε να εμφανιστεί μια μαύρη τελεία στο εσωτερικό του), στη συνέχεια κάντε κλικ στο πλήκτρο If ακριβώς από κάτω.
Ένα νέο πλαίσιο διαλόγου ανοίγει ξανά (με τίτλο Select Cases: If(=επιλέξτε παρατηρήσεις: αν)). Το παράθυρο δίνει πρόσβαση σε μια μεγάλη ποικιλία λειτουργιών, στις οποίες έχουμε αναφερθεί σε προηγούμενη ενότητα. Προς το παρόν μας ενδιαφέρει μόνο πώς θα επιλέξουμε τα επίπεδα 2, 3, 4, και 5 της μεταβλητής ethnic. Πρώτο βήμα είναι να επιλέξετε την ethnic από τη λίστα μεταβλητών στα αριστερά, στη συνέχεια να κάνετε κλικ στο 4για να επικολλήσετε τη μεταβλητή στο «ενεργό» πλαίσιο, στη συνέχεια κλικ στο >= (στο μικρό πληκτρολόγιο κάτω από το ενεργό πλαίσιο), κι ύστερα κλικ στο 2. Έχετε τώρα δηλώσει ότι θέλετε να επιλέξετε όλα τα επίπεδα της ethnic που είναι μεγαλύτερα ή ίσα του 2. Στη συνέχεια κάντε κλικ στο Continue, κλικ στο ΟΚ, κλικ στο ΟΚ της Οθόνης 20 και η ανάλυσή σας θα ολοκληρωθεί με τέσσερα μόνο επίπεδα εθνικότητας.
ΑΠΟΤΕΛΕΣΜΑΤΑ (OUTPUT)
Crosstabs και Αναλύσεις Chi-Square (χ2)
Αυτό που ακολουθεί είναι τμήμα των αποτελεσμάτων που προκύπτουν από τα βήματα που έχουμε περιγράψει.
Πίνακας: SPSS for Windows: Crostabulation and Chi-square analyses
 
Το τελικό βήμα στην ερμηνεία μιας ανάλυσης crosstabs ή μιας ανάλυσης chi-square είναι να παρατηρήσετε τις πραγματικές τιμές και τις αναμενόμενες τιμές σε κάθε κελί. Με την πρώτη ματιά βλέπουμε ότι οι πραγματικές τιμές και οι αναμενόμενες τιμές είναι αρκετά όμοιες. Η μεγαλύτερη συμφωνία είναι για τους Λευκούς (γυναίκες, 26 πραγματική εκτίμηση, 27.4 αναμενόμενη· και άνδρες 19 πραγματική εκτίμηση, 17.6 αναμενόμενη). Προσέξτε επίσης ότι η τιμή των υπολοίπων (ο αριθμός κάτω από τους άλλους δύο) είναι απλώς η πραγματική τιμή μείον την αναμενόμενη. Ακόμη και χωρίς να κοιτάξετε στα στατιστικά μέτρα της chi-square θα περιμένατε ότι οι πραγματικές και οι αναμενόμενες τιμές δεν θα διαφέρουν σημαντικά (δηλαδή το φύλο και η εθνικότητα σ’ αυτό το δείγμα είναι ανεξάρτητα μεταξύ τους). Τα αποτελέσματα υποστηρίζουν αυτή την παρατήρηση αφού δίνουν μια χαμηλή τιμή της chi-square (1.19288) και πιθανότητα σφάλματος μεγαλύτερη του 0.8 (0.87927). Προσέξτε ότι τα μέτρα σχέσης είναι επίσης μικρά και δεν προσεγγίζουν τη σημαντικότητα. Όπως προτάθηκε στην ενότητα Βήμα προς Βήμα, τα κελιά με μικρό αριθμό παρατηρήσεων αποτελούν πρόβλημα. 3 από τα 10 έχουν αναμενόμενη τιμή μικρότερη του 5. Η συνήθης απάντηση θα ήταν να ξανακάνουμε την ανάλυση αφού εξαιρέσουμε την κατηγορία «Ιθαγενείς» (Native). Για περαιτέρω βοήθεια στην κατανόηση, ακολουθούν οι ορισμοί των όρων που υπάρχουν στα αποτελέσματα.
Όρος
Ορισμός/ Περιγραφή
COUNT (=ΕΚΤΙΜΗΣΗ)
Ο πρώτος αριθμός σε κάθε ένα από τα 10 κελιά (4, 13, 14,...) δείχνει τον αριθμό των παρατηρήσεων σε κάθε κατηγορία
EXP. COUNT (=ΑΝΑΜΕΝΟΜΕΝΗ ΕΚΤΙΜΗΣΗ)
Ο δεύτερος αριθμός σε κάθε ένα από τα 10 κελιά (3.0, 12.2, 14.6,...), δείχνει τον αριθμό που θα εμφανίζονταν αν οι δύο μεταβλητές ήταν τελείως ανεξάρτητες μεταξύ τους.
RESIDUAL (=ΥΠΟΛΟΙΠΟ)
Η πραγματική τιμή μείον την αναμενόμενη τιμή.
ROW TOTAL (=ΣΥΝΟΛΟ ΓΡΑΜΜΩΝ)
Ο συνολικός αριθμός των παρατηρήσεων σε κάθε γραμμή (64 γυναίκες, 41 άνδρες)
COLUMN TOTAL (=ΣΥΝΟΛΟ ΣΤΗΛΩΝ)
Ο συνολικός αριθμός των παρατηρήσεων σε κάθε κατηγορία για κάθε στήλη (5 Αμερικανοί Ινδιάνοι, 20 Ασιάτες, 24 Μαύροι, 45 Λευκοί, 11 Ισπανόφωνοι).
CHI SQUARE: PEARSON and LIKELIHOOD RATIO (=χ2: ΛΟΓΟΣ PEARSON και ΠΙΘΑΝΟΤΗΤΑΣ)
Δύο διαφορετικές μέθοδοι για υπολογισμό των στατιστικών της chi-square. Όταν το N είναι μεγάλο, αυτές οι δύο τιμές θα είναι σχεδόν ίσες. Η εξίσωση για την Pearson chi-square είναι:
χ2 = Σ[(f0 -fe)2/fe]
VALUE  (=TIMH)
Για τις μεθόδους PEARSON και MAXIMUM LIKELIHOOD, καθώς η τιμή του ελέγχου μεγαλώνει, η πιθανότητα οι δύο μεταβλητές να μην είναι ανεξάρτητες (π.χ. είναι εξαρτημένες) επίσης αυξάνει. Οι τιμές που είναι κοντά στο 1 (1.193, 1.268) υποδηλώνουν ότι η ισορροπία του φύλου δεν εξαρτάται από το ποιες εθνικότητες εμπλέκονται.
DEGREES OF FREEDOM (=ΒΑΘΜΟΙ ΕΛΕΥΘΕΡΙΑΣ)
Οι βαθμοί ελευθερίας είναι ο αριθμός των επιπέδων στην πρώτη μεταβλητή μείον 1 (2 - 1 = 1) επί τον αριθμό των επιπέδων στη δεύτερη μεταβλητή μείον 1 (5 – 1 = 4). Δηλαδή 1 x 4 = 5.
SIGNIFICANCE (=ΣΗΜΑΝΤΙΚΟΤΗΤΑ)
Η πιθανότητα αυτά τα αποτελέσματα να προέκυψαν τυχαία. Η μεγάλη τιμή p εδώ υποδηλώνει ότι οι πραγματικές τιμές δεν διαφέρουν σημαντικά από τις αναμενόμενες τιμές.
LINEAR-BY-LINEAR ASSOCIATION (=ΓΡΑΜΜΙΚΗ ΠΡΟΣ ΓΡΑΜΜΙΚΗ ΣΧΕΣΗ)
Αυτό το στατιστικό μέτρο ελέγχει αν οι δύο μεταβλητές συσχετίζονται μεταξύ τους. Το μέτρο αυτό είναι συχνά ασήμαντο επειδή δεν υπάρχει λογική ή αριθμητική σχέση με τη σειρά των μεταβλητών. Για παράδειγμα, δεν υπάρχει λογική σειρά (από μια χαμηλή τιμή σε μια υψηλή) για την εθνικότητα. Επομένως, η συσχέτιση μεταξύ του φύλου και της εθνικότητας είναι ασήμαντη. Αν πάντως η δεύτερη μεταβλητή ήταν το εισόδημα, διατεταγμένο από το χαμηλότερο στο υψηλότερο, το αποτέλεσμα θα ήταν μια έγκυρη συσχέτιση.
MINIMUM EXPECTED COUNT (=ΕΛΑΧΙΣΤΗ ΑΝΑΜΕΝΟΜΕΝΗ ΕΚΤΙΜΗΣΗ)
Η ελάχιστη αναμενόμενη εκτίμηση είναι για το πρώτο κελί στη δεύτερη γραμμή (άνδρας, Αμερικάνος Ινδιάνος). Η αναμενόμενη τιμή εκεί στρογγυλοποιείται στο κοντινότερο δεκαδικό (2.0). Η τιμή με δύο δεκαδικά είναι 1.95.
PHI (=ΦΙ)
Ένα μέτρο της δύναμης της συσχέτισης μεταξύ δύο ονομαστικών μεταβλητών. Μια τιμή 0.10659 αντιπροσωπεύει μια πολύ αδύναμη συσχέτιση μεταξύ του φύλου και της εθνικότητας. Η συνάρτηση
φ=
CELLS WITH EXPECTED COUNT <5 (=ΚΕΛΙΑ ΜΕ ΑΝΑΜΕΝΟΜΕΝΗ ΕΚΤΙΜΗΣΗ <5)
Τρία από τα 10 κελιά έχουν αναμενόμενη συχνότητα μικρότερη από 5. Αν έχετε πολλά κελιά με μικρό αριθμό παρατηρήσεων (περισσότερα από το 25% είναι ένα αποδεκτό κριτήριο), η συνολική τιμή της chi-square είναι λιγότερο πιθανό να είναι έγκυρη.
CRAMÉR’S V

Ένα μέτρο για την ισχύ της σχέσης μεταξύ δύο ονομαστικών μεταβλητών. Διαφέρει από την phi στο ότι η Cramér’s V ποικίλει αυστηρά μεταξύ 0 και 1, ενώ σε συγκεκριμένες περιπτώσεις η phi μπορεί να είναι μεγαλύτερη του 1. Ακολουθεί η εξίσωση: (Σημείωση: ο k είναι ο μικρότερος από τον αριθμό των γραμμών και των στηλών)
V=
APPROXIMATE SIGNIFICANCE (=ΣΗΜΑΝΤΙΚΟΤΗΤΑ ΚΑΤΑ ΠΡΟΣΕΓΓΙΣΗ)
Είναι ίδιο με τη σημαντικότητα για την Pearson και την chi-square. Η υψηλή τιμή (0.87927) υποδηλώνει πολύ αδύναμη σχέση.


4.3: Διμεταβλητή Συσχέτιση
Οι συσχετίσεις μπορούν να υπολογιστούν χρησιμοποιώντας την εντολή Correlate(=συσχετίζω) του SPSS. Οι συσχετίσεις προσδιορίζονται με το μικρό γράμμα r και οι τιμές τους κυμαίνονται από -1 έως 1. Η συσχέτιση συνήθως καλείται διμεταβλητή συσχέτιση για να υποδηλώσει μια απλή συσχέτιση μεταξύ δύο μεταβλητών, σε αντίθεση με σχέσεις μεταξύ περισσότερων από δύο μεταβλητών που συχνά παρατηρούνται σε αναλύσεις πολλαπλής διακύμανσης ή στην ανάλυση δομικών εξισώσεων (structural equation modeling). Η συσχέτιση καλείται επίσης Pearson r. Η φόρμουλα με την οποία υπολογίζονται οι συσχετίσεις αποδίδεται στον  Karl S. Pearson. Παρότι η Pearson r στηρίζεται στην υπόθεση ότι οι δύο εμπλεκόμενες μεταβλητές ακολουθούν περίπου την κανονική κατανομή, ο τύπος συχνά αποδίδει καλά ακόμα κι όταν η υπόθεση της κανονικότητας δεν ικανοποιείται ή όταν μία από τις μεταβλητές δεν είναι συνεχής. Ιδανικά, όταν οι μεταβλητές δεν ακολουθούν κανονική κατανομή, η συσχέτιση Spearman (ένα μέτρο που βασίζεται στη διάταξη των τιμών) είναι πιο κατάλληλη. Τόσο η συσχέτιση Pearson όσο και η συσχέτιση Spearman είναι διαθέσιμες με τη χρήση της εντολής Correlate. Υπάρχουν κι άλλοι τύποι απ’ τους οποίους παράγονται συσχετίσεις που αντανακλούν χαρακτηριστικά διαφόρων τύπων δεδομένων, αλλά μια τέτοια συζήτηση ξεπερνάει το σκοπό των σημειώσεων αυτών.
ΤΙ ΕΙΝΑΙ ΣΥΣΧΕΤΙΣΗ;
Απόλυτα θετική (r = 1) συσχέτιση: Μια συσχέτιση  +1 δηλώνει μια τέλεια, θετική συσχέτιση. Το «τέλεια» σημαίνει ότι κάποια μεταβλητή είναι με ακρίβεια προβλέψιμη από κάποια άλλη μεταβλητή. Το «θετική» σημαίνει ότι όταν η τιμή μιας μεταβλητής αυξάνει, η τιμή της άλλης μεταβλητής επίσης αυξάνει (ή αντίθετα, καθώς μειώνεται η μία, μειώνεται επίσης και η άλλη).
Τέλειες συσχετίσεις δε βρίσκονται ουσιαστικά ποτέ στις κοινωνικές επιστήμες και υπάρχουν μόνο σε μαθηματικούς τύπους και άμεσες φυσικές ή αριθμητικές σχέσεις. Ένα παράδειγμα θα ήταν η σχέση μεταξύ των ωρών εργασίας και του ποσού της αμοιβής που λαμβάνει κάποιος. Καθώς αυξάνει ο ένας αριθμός, αυξάνει και ο άλλος. Με δεδομένη τη μία τιμή, είναι δυνατό να προσδιοριστεί με ακρίβεια η άλλη τιμή.
Θετική (0 < r < 1) συσχέτιση: Μια θετική (αλλά όχι τέλεια) συσχέτιση δηλώνει ότι καθώς η τιμή μιας μεταβλητής αυξάνει, η τιμή της άλλης μεταβλητής επίσης τείνει να αυξάνει. Όσο πιο κοντά στο 1 είναι η τιμή της συσχέτισης τόσο ισχυρότερη είναι αυτή η τάση· και όσο πιο κοντά στο 0 είναι η τιμή της συσχέτισης τόσο ασθενέστερη είναι αυτή η τάση.
Ένα παράδειγμα ισχυρής θετικής συσχέτισης είναι η σχέση μεταξύ του ύψους και του βάρους των ενηλίκων ανθρώπων (r = 0.83). Οι ψηλοί άνθρωποι είναι συνήθως βαρύτεροι από τους κοντούς. Ένα παράδειγμα ασθενούς θετικής συσχέτισης είναι η σχέση μεταξύ ενός μέτρου της τάσης για συναισθηματική κατανόηση και του μεγέθους βοήθειας που δίδεται σε κάποιον που τη χρειάζεται (r = 0.12). Άτομα με υψηλότερα σκορ στην τάση για συναισθηματική κατανόηση παρέχουν μεγαλύτερη βοήθεια απ’ ότι τα άτομα με χαμηλότερα αντίστοιχα σκορ, αλλά η σχέση είναι ασθενής.
Καμία (r = 0) Συσχέτιση: Μια συσχέτιση ίση με 0 δείχνει απουσία συσχέτισης μεταξύ των δύο μεταβλητών. Για παράδειγμα, δεν θα περιμέναμε να συσχετίζεται το IQ με το ύψος.
Αρνητική (-1 < r < 0) συσχέτιση: Μια αρνητική (αλλά όχι τέλεια) συσχέτιση δηλώνει ότι καθώς η τιμή μιας μεταβλητής αυξάνει, η τιμή της άλλης μεταβλητής τείνει να μειώνεται. Όσο πιο κοντά στο -1 είναι η τιμή της συσχέτισης τόσο ισχυρότερη είναι αυτή η τάση· και όσο πιο κοντά στο 0 είναι η τιμή της συσχέτισης τόσο ασθενέστερη είναι αυτή η τάση.
Ένα παράδειγμα ισχυρής αρνητικής συσχέτισης είναι η σχέση ανάμεσα στην ανησυχία και τη συναισθηματική σταθερότητα (r = -0.73).  Άτομα που έχουν υψηλότερα σκορ στην ανησυχία τείνουν να έχουν χαμηλότερη συναισθηματική σταθερότητα. Μια ασθενής αρνητική συσχέτιση παρουσιάζεται στη σχέση μεταξύ του θυμού ενός ατόμου απέναντι σ’ ένα φίλο που υποφέρει από κάποιο πρόβλημα και την ποιότητα της βοήθειας που θα δώσει σ’ αυτό το φίλο (r = -0.13). Αν ο θυμός ενός ατόμου είναι μικρότερος, η ποιότητα βοήθειας είναι υψηλότερη, αλλά η σχέση είναι ασθενής.
Τέλεια αρνητική (r = -1) συσχέτιση: Ακόμα μια φορά, τέλειες συσχετίσεις (θετικές ή αρνητικές) υπάρχουν μόνον σε μαθηματικούς τύπους και άμεσες φυσικές ή αριθμητικές σχέσεις. Ένα παράδειγμα τέλειας αρνητικής συσχέτισης βασίζεται στον τύπο απόσταση = ταχύτητα x χρόνος. Όταν οδηγείτε από το σημείο Α στο σημείο Β, αν οδηγήσετε δυο φορές πιο γρήγορα θα χρειαστείτε το μισό χρόνο.
ΕΠΙΠΛΕΟΝ ΖΗΤΗΜΑΤΑ
Γραμμική vs. Καμπυλόγραμμη
Είναι σημαντικό να καταλάβετε ότι η εντολή Correlate αφορά μόνον τις γραμμικές σχέσεις. Υπάρχουν πολλές σχέσεις που δεν είναι γραμμικές. Πάρτε για παράδειγμα το άγχος πριν από κάποιες σημαντικές εξετάσεις. Υπερβολικά πολύ ή υπερβολικά λίγο άγχος γενικώς κάνει κακό στην απόδοση ενώ σε λογικά πλαίσια συνήθως βοηθάει την απόδοση. Η σχέση σ’ ένα διάγραμμα διασποράς θα έμοιαζε με ένα ανάποδο U αλλά ο υπολογισμός της συσχέτισης Pearson δεν θα έδειχνε καμία σχέση ή θα έδινε μια ασθενή σχέση. Πολλές φορές είναι καλή ιδέα να δημιουργήσετε ένα διάγραμμα διασποράς για τα δεδομένα πριν υπολογίσετε συσχετίσεις για να δείτε αν η σχέση μεταξύ δύο μεταβλητών είναι γραμμική. Αν είναι γραμμική, το διάγραμμα διασποράς θα μοιάζει λίγο πολύ με ευθεία γραμμή. Παρότι ένα διάγραμμα διασποράς μπορεί να βοηθήσει την ανίχνευση γραμμικών ή καμπυλόγραμμων σχέσεων, είναι αλήθεια ότι μπορεί να υπάρχουν σημαντικές συσχετίσεις ακόμη κι αν δεν μπορούν να εντοπιστούν μέσω της οπτικής ανάλυσης.
Σημαντικότητα
Όπως και με τις περισσότερες στατιστικές διαδικασίες, η σημαντικότητα (ή πιθανότητα) υπολογίζεται για να καθορίσει την πιθανότητα μια συγκεκριμένη συσχέτιση να έχει προκύψει τυχαία. Η σημαντικότητα (ή τιμή p) αντιπροσωπεύει το βαθμό σπανιότητας ενός συγκεκριμένου αποτελέσματος. Μια τιμή σημαντικότητας μικρότερη από 0.05 (p < 0.05) σημαίνει ότι υπάρχει πιθανότητα μικρότερη από 5% αυτή η σχέση να προέκυψε τυχαία. Το SPSS έχει δυο διαφορετικά μέτρα σημαντικότητας, τη μονομερή (one-tailed) σημαντικότητα και τη διμερή (two-tailed) σημαντικότητα. Για να αποφασίσετε ποια θα χρησιμοποιήσετε, ο εμπειρικός κανόνας που ακολουθείται γενικά είναι να χρησιμοποιείτε τη δικατάληκτη όταν υπολογίζετε έναν πίνακα συσχετίσεων, για τις οποίες ξέρετε πολύ λίγα όσον αφορά την κατεύθυνση των συσχετίσεων. Αν όμως έχετε εκ των προτέρων προσδοκίες σχετικά με την κατεύθυνση των συσχετίσεων (θετικές ή αρνητικές), τότε χρησιμοποιείται η μονοκατάληκτη.
Αιτιότητα
Η συσχέτιση δεν υποδεικνύει απαραίτητα και αιτιότητα. Μερικές φορές η αιτιότητα είναι σαφής. Αν το ύψος και το βάρος συσχετίζονται, είναι σαφές ότι το επιπλέον ύψος προκαλεί το επιπλέον βάρος. Η αύξηση του βάρους είναι γνωστό ότι δεν οδηγεί σε αύξηση του ύψους. Επίσης η σχέση μεταξύ φύλου και συναισθηματικής κατανόησης δείχνει ότι οι γυναίκες τείνουν να επιδεικνύουν μεγαλύτερη συναισθηματική κατανόηση από τους άνδρες. Αν ένας άνδρας επιδείξει μεγαλύτερη συναισθηματική κατανόηση αυτό μάλλον δεν θα αλλάξει το φύλο του. Ακόμη μια φορά, η κατεύθυνση της αιτιότητας είναι ξεκάθαρη: το φύλο επηρεάζει την συναισθηματική κατανόηση και όχι το αντίστροφο.
Υπάρχουν άλλα πλαίσια όπου η κατεύθυνση της αιτιότητας είναι μεν πιθανή αλλά χρήζει περαιτέρω εξέτασης. Για παράδειγμα ο βαθμός αυτοπεποίθησης ότι κάποιος έχει την ικανότητα να κάνει κάτι συσχετίζεται σημαντικά με τη σχετική βοήθεια που θα παρέχει. Θα σκεφτόμασταν γενικά ότι η αυτοπεποίθηση θα επηρεάσει το μέγεθος της παρεχόμενη βοήθειας, αλλά κάποιος θα μπορούσε να ισχυριστεί ότι εκείνος που βοηθάει περισσότερο ενισχύει την αυτοπεποίθησή του σαν αποτέλεσμα των πράξεών του. Η πρώτη απάντηση φαίνεται πιο ορθή αλλά και οι δύο μπορεί να είναι εν μέρει έγκυρες.
Τρίτον, μερικές φορές είναι δύσκολο να έχεις την παραμικρή ιδέα σχετικά με το τι προκαλεί τι. Η συναισθηματική σταθερότητα και η ανησυχία σχετίζονται σημαντικά (οι συναισθηματικά πιο σταθεροί άνθρωποι είναι λιγότερο ανήσυχοι). Είναι η μεγαλύτερη συναισθηματική σταθερότητα που προκαλεί τη λιγότερη ανησυχία ή είναι η περισσότερη ανησυχία που προκαλεί τη μικρότερη συναισθηματική σταθερότητα; Η απάντηση βεβαίως είναι ναι και στα δύο. Το ένα επηρεάζει το άλλο.
Τέλος υπάρχει το θέμα της τρίτης μεταβλητής. Έχει αποδειχθεί αξιόπιστα ότι οι πωλήσεις παγωτού και οι ανθρωποκτονίες στη Νέα Υόρκη σχετίζονται θετικά. Το να τρώει κανείς παγωτό τον μετατρέπει σε δολοφόνο; Μια δολοφονία δημιουργεί όρεξη για παγωτό; Η απάντηση είναι ούτε το ένα ούτε το άλλο. Τόσο οι πωλήσεις παγωτών όσο και οι δολοφονίες συσχετίζονται με τη ζέστη, Όταν ο καιρός είναι ζεστός γίνονται περισσότερες δολοφονίες και πωλείται περισσότερο παγωτό. Το ίδιο πράγμα συμβαίνει και με τα αξιόπιστα ευρήματα που λένε ότι σε πολλές πόλεις ο αριθμός των εκκλησιών συνδέεται θετικά με τον αριθμό των μπαρ. Όχι, το να πηγαίνει κανείς στην εκκλησία δεν του προκαλεί την επιθυμία να πιει, ούτε όποιος πίνει πολύ θέλει στη συνέχεια να επισκεφτεί μια εκκλησία. Υπάρχει και πάλι μια τρίτη μεταβλητή: ο πληθυσμός. Οι μεγαλύτερες πόλεις έχουν περισσότερα μπαρ και περισσότερες εκκλησίες ενώ οι μικρότερες έχουν λιγότερα μπαρ και λιγότερες εκκλησίες.
Μερική Συσχέτιση
Αυτό το θέμα το αναφέρουμε επειδή η μερική συσχέτιση περιλαμβάνεται σαν επιλογή στο πλαίσιο της εντολής Correlate αλλά δεν θα μπούμε σε λεπτομέρειες. Μερική συσχέτιση είναι η διαδικασία εύρεσης της συσχέτισης μεταξύ δύο μεταβλητών αφού η επιρροή άλλων μεταβλητών έχει ελεγχθεί. Αν, για παράδειγμα, υπολογίζαμε συσχέτιση ανάμεσα στο GPA και στον τελικό βαθμό μιας τάξης, θα μπορούσαμε να συμπεριλάβουμε το έτος σαν συμμεταβλητή. Θα περιμέναμε ότι οι τεταρτοετείς θα είχαν καλύτερους βαθμούς από τους πρωτοετείς. Υπολογίζοντας τη μερική συσχέτιση, που «εκτοπίζει» την επιρροή του έτους, εξαιρούμε μαθηματικά την επιρροή των ετών φοίτησης στη συσχέτιση μεταξύ του GPA και του συνολικού βαθμού. Με την επιλογή της μερικής συσχέτισης μπορείτε να συμπεριλάβετε περισσότερες από μία μεταβλητές ως συμμεταβλητή αν υπάρχει λόγος να κάνετε κάτι τέτοιο.
Το αρχείο που χρησιμοποιούμε για να παρουσιάσουμε την εντολή Correlate είναι το παράδειγμα που έχουμε ήδη περιγράψει. Το αρχείο καλείται grades. sav κι έχει αριθμό παρατηρήσεων Ν = 105. Αυτή η ανάλυση υπολογίζει συσχετίσεις μεταξύ πέντε μεταβλητών του αρχείου: φύλο (sex), προηγούμενος μέσος όρος (GPA), πρώτο και πέμπτο πρόχειρο διαγώνισμα (quiz1, quiz5), και τελική εξέταση (final).
ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ
Συσχετίσεις
Από το μενού Analyze επιλέγετε την εντολή Correlate και στη συνέχεια την υποεντολή Bivariate. Αφού κάνετε κλικ στην επιλογή Bivariate (=διμεταβλητή), ανοίγει ένα καινούριο παράθυρο (Οθόνη 23, παρακάτω) που ορίζει έναν αριθμό επιλογών που είναι διαθέσιμες στη διαδικασία της συσχέτισης. Πρώτον, το πλαίσιο στ’ αριστερά περιέχει όλες τις αριθμητικές μεταβλητές του αρχείου (προσέξτε την απουσία των firstname, lastnam, - και οι δύο είναι μη αριθμητικές). Η μετακίνηση των μεταβλητών από τη λίστα στο πλαίσιο Variable(s) είναι παρόμοια με τις διαδικασίες που ακολουθείται πάντα σε όλες τις αναλύσεις. Κάνετε κλικ στην επιθυμητή μεταβλητή της λίστας, κάνετε κλικ στο (4) και η μεταβλητή επικολλάται στο πλαίσιο Variable(s). Η διαδικασία επαναλαμβάνεται για κάθε μεταβλητή που σας ενδιαφέρει. Επίσης, αν υπάρχει μια σειρά διαδοχικών μεταβλητών στη λίστα, μπορείτε να «κάνετε κλικ και να σύρετε» από την πρώτη μέχρι την τελευταία επιθυμητή μεταβλητή για να τις επιλέξετε όλες. Στη συνέχεια μ’ ένα κλικ στο (4) θα επικολληθούν όλες τις σημειωμένες μεταβλητές στο ενεργό πλαίσιο.
Οθόνη 23:
Το Παράθυρο Bivariate Correlations
Στο επόμενο πλαίσιο που ονομάζεται Correlation Coefficients (=Συντελεστές Συσχέτισης) ο Pearson r είναι η προεπιλογή. Αν τα δεδομένα σας δεν ακολουθούν την κανονική κατανομή τότε επιλέξτε Spearman. Μπορείτε να διαλέξετε και τις δυο επιλογές και να δείτε πώς διαμορφώνονται οι τιμές.
Κάτω από τον τίτλο Test of Significance (=έλεγχος σημαντικότητας), είναι προεπιλεγμένο το Two-tailed. Κάντε κλικ στο One-tailed αν έχετε σαφή γνώση της κατεύθυνσης (θετική ή αρνητική) των συσχετίσεών σας.
Η επιλογή Flag significant correlations (=σημείωση των σημαντικών συσχετίσεων) είναι εξ αρχής σημειωμένη και τοποθετεί έναν αστερίσκο (*) ή έναν διπλό αστερίσκο (**) δίπλα στις συσχετίσεις που επιτυγχάνουν ένα συγκεκριμένο επίπεδο σημαντικότητας (συνήθως 0,05 και 0,01). Άσχετα με το αν σημειώνονται οι σημαντικές τιμές ή όχι, θα συμπεριλαμβάνονται η συσχέτιση, η σημαντικότητα με ακρίβεια τριών δεκαδικών και ο αριθμός των παρατηρήσεων που εμπλέκονται σε κάθε συσχέτιση.
Για τις αναλύσεις που παρουσιάζονται σ’ αυτό το κεφάλαιο θα μείνουμε στη συσχέτιση Pearson, τον έλεγχο σημαντικότητας Two-tailed και θα διατηρήσουμε ενεργή την επιλογή Flag significant correlations. Αν θέλετε διαφορετικές επιλογές, απλώς κάντε κλικ στην αντίστοιχη διαδικασία για να επιλέξετε ή να αποεπιλέξετε πριν κάνετε κλικ στο τελικό ΟΚ.
Επιπλέον διαδικασίες είναι διαθέσιμες αν κάνετε κλικ στο πλήκτρο Options στην κάτω δεξιά γωνία της Οθόνης 23. Αυτό το παράθυρο (Οθόνη 24, παρακάτω) σας επιτρέπει να επιλέξετε πρόσθετα στατιστικά στοιχεία και να ασχοληθείτε με τα κενά στα δεδομένα σας (missing values) με δύο διαφορετικούς τρόπους. Οι μέσοι και οι τυπικές αποκλίσεις μπορούν να συμπεριληφθούν κάνοντας κλικ στην κατάλληλη εντολή (Means and standard deviations) καθώς και οι αποκλίσεις και συνδιακυμάνσεις μεταξύ των γινομένων (Cross-product deviations and covariances).
Οθόνη 24:
Το Παράθυρο Bivariate Correlations: Options
Η εντολή Exclude cases pairwise (=εξαίρεση παρατηρήσεων κατά ζεύγη) σημαίνει ότι για μια συγκεκριμένη συσχέτιση στη μήτρα, αν μια παρατήρηση έχει ένα ή δύο κενά στα δεδομένα που αφορούν αυτή τη σύγκριση, τότε η επίδραση αυτής της παρατήρησης δεν θα συμπεριληφθεί στη συγκεκριμένη συσχέτιση. Έτσι, συσχετίσεις μέσα σε μια μήτρα μπορεί να έχουν διαφορετικό αριθμό παρατηρήσεων που καθορίζουν κάθε συσχέτιση. Η εντολή Exclude cases listwise (=εξαιρέστε περιπτώσεις κατά λίστα) σημαίνει ότι αν μια παρατήρηση έχει οποιοδήποτε κενό στα δεδομένα της όλα τα δεδομένα αυτής θα εξαιρεθούν από το σύνολο των αναλύσεων. Τα κενά στα δεδομένα είναι ένα ακανθώδες πρόβλημα στην ανάλυση δεδομένων και θα πρέπει να αντιμετωπιστούν πριν μπείτε στο στάδιο των αναλύσεων.
ΑΠΟΤΕΛΕΣΜΑΤΑ
Συσχετίσεις
Ακολουθούν τα αποτελέσματα της συσχέτισης των μεταβλητών sex, gpa, quiz1, quiz5 και final.
Προσέξτε πρώτα απ’ όλα τη δομή των αποτελεσμάτων. Η πρώτη γραμμή κάθε κελιού προσδιορίζει τις συσχετίσεις μεταξύ των μεταβλητών με ακρίβεια τριών δεκαδικών ψηφίων. Η δεύτερη γραμμή δείχνει τη σημαντικότητα κάθε αντίστοιχης συσχέτισης. Η τρίτη γραμμή καταγράφει τον αριθμό των παρατηρήσεων που εμπλέκονται σε κάθε συσχέτιση. Μόνον αν υπάρχουν κενά στα δεδομένα είναι δυνατό ο αριθμός των παρατηρήσεων που εμπλέκονται σε μία συσχέτιση να διαφέρει από τον αντίστοιχο αριθμό άλλων συσχετίσεων. Οι σημειώσεις κάτω από τον πίνακα ορίζουν τη σημασία των αστερίσκων και δείχνουν αν τα επίπεδα σημαντικότητας είναι one-tailed ή two-tailed.
Η διαγώνιος που σχηματίζεται από «1» δείχνει απλώς ότι κάθε μεταβλητή είναι τέλεια συσχετισμένη με τον εαυτό της. Από τη στιγμή που η διαδικασία υπολογισμού των συσχετίσεων είναι η ίδια ανεξάρτητα από το ποια μεταβλητή ορίζεται πρώτη, ο μισός πίνακας πάνω από τη διαγώνιο των «1» έχει τις ίδιες τιμές με τον υπόλοιπο μισό κάτω από τη διαγώνιο. Προσέξτε την ισχυρή θετική συσχέτιση ανάμεσα στις μεταβλητές final και quiz5 (r = 0.475, p < 0.001). Όπως περιγράφηκε στην εισαγωγή αυτού του κεφαλαίου, οι τιμές αυτές υποδηλώνουν μια ισχυρή θετική σχέση ανάμεσα στο βαθμό του πέμπτου πρόχειρου διαγωνίσματος και στο βαθμό της τελικής εξέτασης. Εκείνοι που πέτυχαν τους υψηλότερους βαθμούς στο πρόχειρο διαγώνισμα είχαν την τάση να επιτυγχάνουν υψηλότερο βαθμό και στην τελική εξέταση.

3.3 Η Διαδικασία του Ελέγχου T (T TEST)
Ο έλεγχος t  είναι μια διαδικασία που χρησιμοποιείται για τη σύγκριση δειγματικών μέσων προκειμένου να δούμε αν υπάρχουν αρκετά στοιχεία για να συμπεράνουμε ότι οι μέσοι των αντίστοιχων πληθυσμιακών κατανομών επίσης διαφέρουν. Πιο συγκεκριμένα, για να γίνει κάποιος έλεγχος t σε ανεξάρτητα δείγματα, λαμβάνονται δείγματα από δύο πληθυσμούς (ένα δείγμα απ’ τον κάθε πληθυσμό). Τα δύο δείγματα μετρώνται με βάση κάποια μεταβλητή που μας ενδιαφέρει. Ένας έλεγχος t  θα καθορίσει αν οι μέσοι των κατανομών των δύο δειγμάτων διαφέρουν σημαντικά ο ένας από τον άλλο. Οι έλεγχοι t μπορούν να χρησιμοποιηθούν για να διερευνηθούν θέματα όπως: Έχει η θεραπεία Α μεγαλύτερα ποσοστά ανάρρωσης από τη θεραπεία Β; Έχει μια συγκεκριμένη διαφημιστική τεχνική καλύτερα αποτελέσματα στις πωλήσεις από μια άλλη; Οι γυναίκες ή οι άνδρες έχουν μεγαλύτερη βαθμολογία σε μια μέτρηση της τάσης για συναισθηματική κατανόηση; Αποφέρει μια προπονητική μέθοδος καλύτερους χρόνους σε αγώνες ταχύτητας από μια άλλη; Η λέξη κλειδί είναι το δύο: Οι έλεγχοι t συγκρίνουν πάντα δύο διαφορετικούς μέσους ή τιμές.
Σ’ αυτό το κεφάλαιο που αφορά τους ελέγχους t, το εγχειρίδιο SPSS for Windows Base System User’s Guide αφιερώνει πολλές σελίδες μιλώντας για μηδενικές υποθέσεις, πληθυσμούς, τυχαία δείγματα, κανονικές κατανομές, και μια σειρά ερευνητικών ζητημάτων. Όλα τα σχόλιά του είναι σχετικά και μεγάλης σημασίας για τη διεξαγωγή σημαντικής έρευνας. Όμως, η συζήτηση αυτών των θεμάτων ξεφεύγει απ’ το σκοπό των σημειώσεων αυτών. Το θέμα αυτού του κεφαλαίου είναι οι έλεγχοι t: τι κάνουν, πώς αποκτάμε πρόσβαση σ’ αυτούς μέσα απ’ το SPSS, και πώς θα πρέπει να ερμηνεύουμε τα αποτελέσματά τους.
ΕΛΕΓΧΟΙ Τ ΣΕ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ
Το SPSS παρέχει τρεις διαφορετικούς τύπους ελέγχων t. Ο πρώτος τύπος, ο έλεγχος t σε ανεξάρτητα δείγματα, συγκρίνει τους μέσους δύο διαφορετικών δειγμάτων. Τα δύο δείγματα έχουν κάποια κοινή μεταβλητή που μας ενδιαφέρει, αλλά δεν υπάρχει επικάλυψη στη συμμετοχή σε κάποιο απ’ αυτά. Τέτοια παραδείγματα είναι: η διαφορά ανάμεσα σε άνδρες και γυναίκες στη βαθμολογία ενός διαγωνίσματος, η διαφορά απόδοσης στα push-ups Ευρωπαίων και Αμερικάνων ή η διαφορά στην αντιλαμβανόμενη ικανοποίηση από τη ζωή μεταξύ παντρεμένων και άγαμων. Προσέξτε και πάλι ότι δεν υπάρχει καμία επικάλυψη στις συμμετοχές μεταξύ των δύο ομάδων.
ΕΛΕΓΧΟΙ Τ ΣΕ ΖΕΥΓΗ ΔΕΙΓΜΑΤΩΝ
Ο δεύτερος τύπος ελέγχου t, ο έλεγχος t σε ζεύγη δειγμάτων, βασίζεται συνήθως σε ομάδες ατόμων που έχουν εμπειρία και από τις δύο συνθήκες μιας μεταβλητής. Τέτοια παραδείγματα είναι: οι βαθμοί των μαθητών στο πρώτο πρόχειρο διαγώνισμα και οι βαθμοί των ίδιων μαθητών στο δεύτερο πρόχειρο διαγώνισμα· ο βαθμός κατάθλιψης κάποιων αφού ακολούθησαν τη θεραπεία Α σε σύγκριση με το βαθμό κατάθλιψης των ίδιων αφού ακολούθησαν τη θεραπεία Β, ένα σύνολο βαθμολογίας κάποιων μαθητών σε τεστ SAT σε σχέση με τη βαθμολογία των ίδιων μαθητών στο τεστ GRΕ πολλά χρόνια αργότερα, τα ποσοστά μαθητών του δημοτικού σε τεστ απόδοσης μετά την παρακολούθηση ενός χρόνου σε κάποιο σχολείο Α σε σχέση με τα ποσοστά σε αντίστοιχο τεστ μετά την παρακολούθηση ενός χρόνο σε κάποιο σχολείο Β. Προσέξτε εδώ ότι η ίδια ομάδα έχει εμπειρία και από τα δύο επίπεδα της μεταβλητής.
ΕΛΕΓΧΟΙ Τ ΣΕ ΕΝΑ ΔΕΙΓΜΑ
Ο τρίτος τύπος ελέγχου t είναι ο έλεγχος t σε ένα δείγμα. Είναι σχεδιασμένος να ελέγχει αν ο μέσος μιας κατανομής διαφέρει σημαντικά από κάποια παρούσα τιμή. Ένα παράδειγμα: Έχει ένα μάθημα που προσφέρεται σε τελειόφοιτους σαν αποτέλεσμα βαθμό στο τεστ GRE μεγαλύτερο ή ίσο του 1200; Διέφερε σημαντικά η απόδοση μια συγκεκριμένης τάξης από το στόχο του καθηγητή που ήταν ένας μέσος όρος της τάξης του 82%; Κατά τη διάρκεια της προηγούμενης αγωνιστικής περιόδου, ο μέσος χρόνος της καλύτερης επίδοσης των αθλητών της χώρας ήταν 18 λεπτά. Ο προπονητής έθεσε ένα στόχο 17 λεπτών για την τρέχουσα αγωνιστική περίοδο. Διέφεραν οι χρόνοι των αθλητών σημαντικά από το στόχο των 17 λεπτών που έθεσε ο προπονητής; Σ’ αυτή τη διαδικασία ο μέσος του δείγματος συγκρίνεται με μία συγκεκριμένη τιμή.
ΕΛΕΓΧΟΙ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ
Όταν χρησιμοποιείτε τους ελέγχους t για να αποφασίσετε αν δύο κατανομές διαφέρουν σημαντικά μεταξύ τους, ο έλεγχος που μετράει την πιθανότητα που σχετίζεται με τη διαφορά ανάμεσα στις δύο ομάδες μπορεί να είναι έλεγχος σημαντικότητας one-tailed ή two-tailed. Ο έλεγχος two-tailed εξετάζει αν ο μέσος μιας κατανομής διαφέρει σημαντικά από το μέσο της άλλης κατανομής ή όχι, ανεξάρτητα από την κατεύθυνση (θετική ή αρνητική) της διαφοράς. Ο έλεγχος one-tailed μετράει μόνον αν η δεύτερη κατανομή διαφέρει προς μια συγκεκριμένη κατεύθυνση από την πρώτη. Για παράδειγμα, σε ένα ινστιτούτο αδυνατίσματος, ενδιαφέρον υπάρχει μόνον όσον αφορά το μέγεθος της απώλειας βάρους. Οποιαδήποτε ποσότητα βάρους προστίθεται θεωρείται αποτυχία. Παρομοίως, για μια διαφημιστική καμπάνια το ενδιαφέρον εστιάζεται στην αύξηση των πωλήσεων.
Συνήθως το πλαίσιο της έρευνας θα αποσαφηνίσει ποιος τύπος ελέγχου είναι ο κατάλληλος. Η μόνη υπολογιστική διαφορά ανάμεσα στους δύο είναι ότι η τιμή p της μιας είναι δύο φορές όσο η τιμή p της άλλης. Αν το αποτέλεσμα του SPSS αποφέρει μια τιμή σημαντικότητας two-tailed (αυτή είναι η προεπιλογή), απλώς διαιρέστε αυτό το νούμερο με το 2 για να σας δώσει την πιθανότητα του ελέγχου one-tailed.
Για την παρουσίαση αυτών των εντολών χρησιμοποιούμε ακόμα μια φορά το αρχείο grades.sav με Ν = 105. Οι μεταβλητές που μας ενδιαφέρουν γι’ αυτό το κεφάλαιο είναι: φύλο (sex), total (σύνολο βαθμών στην τάξη), year (πρώτο, δεύτερο, τρίτο, ή τέταρτο έτος στο κολέγιο), τα πρόχειρα διαγωνίσματα απ’ το quiz1 ως το quiz5, και percent (το τελικό ποσοστό της τάξης).

ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ
Υπολογισμός Ελέγχων t
ΕΛΕΓΧΟΣ T ΣΕ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ
Από το μενού Analyze επιλέξτε την εντολή Compare Means και στη συνέχεια την υποεντολή Independent-Samples T Test. Σ’ αυτό το σημείο ανοίγει ένα νέο παράθυρο (Οθόνη 25, παρακάτω) που σας επιτρέπει να κάνετε ελέγχους σε ανεξάρτητα δείγματα. Προσέξτε τη δομή της οθόνης. Στα αριστερά υπάρχει η λίστα με τις μεταβλητές· στα δεξιά υπάρχει ένα πλαίσιο για να δείχνει τις μεταβλητές ελέγχου (Test Variable(s)). Οι μεταβλητές ελέγχου είναι οι συνεχείς μεταβλητές (όπως το σύνολο των βαθμών, ο τελικός βαθμός, ή άλλες), για τις οποίες θέλουμε να κάνουμε συγκρίσεις μεταξύ δύο ανεξάρτητων ομάδων. Σ’ αυτό το πλαίσιο μπορούν να τοποθετηθούν μία ή περισσότερες μεταβλητές. Παρακάτω υπάρχει το πλαίσιο Grouping Variable (=Μεταβλητή Ομαδοποίησης) όπου δηλώνεται η μοναδική μεταβλητή που καθορίζει τις δύο ομάδες. Αυτή η μεταβλητή είναι συνήθως διχοτομική που σημαίνει ότι υπάρχουν ακριβώς δύο επίπεδα (όπως το φύλο ή ο βαθμός που προάγει ή δεν προάγει). Είναι δυνατόν πάντως να χρησιμοποιήσετε μια μεταβλητή με περισσότερα από ένα επίπεδα (όπως η εθνικότητα –5 επίπεδα, ή ο βαθμός –5 επίπεδα) ορίζοντας πώς ακριβώς θέλετε να χωρίσετε τη μεταβλητή σε δύο ακριβώς ομάδες. Για παράδειγμα, για τον βαθμό μπορείτε να συγκρίνετε τα Α και τα Β (σαν μια ομάδα) με τα C, τα D, και τα F (σαν άλλη ομάδα). Ακόμα και μια συνεχής μεταβλητή θα μπορούσε να συμπεριληφθεί εδώ αν ορίσετε τον αριθμό ο οποίος θα χωρίζει τις παρατηρήσεις σε δύο ομάδες.
Οθόνη 25:
Το Παράθυρο Independent-Samples T Test
Μόλις ορίσετε τη μεταβλητή ομαδοποίησης, κάνετε κλικ στο πλήκτρο Define Groups (=ορισμός ομάδων). Ακόμη και για μια μεταβλητή που έχει ακριβώς δύο επίπεδα είναι απαραίτητο να ορίσετε τα δύο επίπεδα της μεταβλητής ομαδοποίησης. Σ’ αυτό το σημείο ανοίγει ένα νέο παράθυρο (Οθόνη 26, παρακάτω) που δίπλα στο Group 1 (=Ομάδα 1) σας επιτρέπει να ορίσετε τον μοναδικό αριθμό που ορίζει το πρώτο επίπεδο της μεταβλητής (π.χ. γυναίκα =10), και στη συνέχεια, δίπλα στο Group 2 (=Ομάδα 2), το δεύτερο επίπεδο της μεταβλητής (π.χ. άνδρας=2). Η επιλογή Cut point (=σημείο διαχωρισμού) σας επιτρέπει να επιλέξετε ένα μοναδικό σημείο διαχωρισμού για μια μεταβλητή που έχει περισσότερα από δύο επίπεδα.
Οθόνη 26:
Το Παράθυρο Define Groups
Η μεταβλητή year έχει τέσσερα επίπεδα και η χρήση της επιλογής Cut point είναι απαραίτητη για να διαχωρίσει τη μεταβλητή σε δύο ακριβώς ομάδες. Ο αριθμός που επιλέγεται (3 σ’ αυτή την περίπτωση) διαχωρίζει την ομάδα στην υποομάδα που λαμβάνει τιμές μεγαλύτερες ή ίσες με την τιμή διαχωρισμού (3 και 4) και την υποομάδα που λαμβάνει τιμές μικρότερες από την τιμή διαχωρισμού (1 και 2).
ΕΛΕΓΧΟΣ t ΣΕ ΖΕΥΓΗ ΔΕΙΓΜΑΤΩΝ
Από το μενού Analyze επιλέξτε την εντολή Compare Means και στη συνέχεια την υποεντολή Paired-Samples T Test.
Η διαδικασία για τους ελέγχους t σε ζεύγη δειγμάτων είναι στην πραγματικότητα απλούστερη από αυτήν για τα ανεξάρτητα δείγματα. Εμπλέκεται ένα μόνον παράθυρο και δεν χρειάζεται να ορίσετε επίπεδα μιας συγκεκριμένης μεταβλητής. Μόλις κάνετε κλικ στην επιλογή Paired-Samples T Test εμφανίζεται μια νέα οθόνη (Οθόνη 27, παρακάτω). Στα αριστερά υπάρχει τώρα η γνωστή μας λίστα με τα ονόματα των μεταβλητών και από τη στιγμή που θα συγκρίνετε όλες τις παρατηρήσεις για δύο διαφορετικές μεταβλητές (quiz1 και quiz2 στο πρώτο παράδειγμα) πρέπει να προσδιορίσετε και τις δύο αυτές μεταβλητές πριν κάνετε κλικ στο 4 στη μέση της οθόνης. Μπορείτε να επιλέξετε όσα ζευγάρια μεταβλητών θέλετε για να τα επικολλήσετε στο πλαίσιο Paired Variables πριν κάνετε την ανάλυση. Δεν υπάρχουν πάντως αυτόματες λειτουργίες ή επιλογές click & drag (κάνετε κλικ και σύρετε) αν θέλετε να κάνετε πολλές συγκρίσεις. Πρέπει να τις επικολλήσετε, ένα ζευγάρι τη φορά, στο πλαίσιο Paired Variables.

Οθόνη 27:
Το παράθυρο Paired-Samples T Test
Αν θέλετε να κάνετε υπολογισμούς για αρκετούς ελέγχους t στο ίδιο πλαίσιο, θα επικολλήσετε όλα τα επιθυμητά ζεύγη μεταβλητών στο πλαίσιο Paired Variables. Στα βήματα που ακολουθούν, οι βαθμοί στο quiz1 συγκρίνονται με τους βαθμούς καθενός από τα άλλα 4 πρόχειρα διαγωνίσματα (quiz1 έως quiz5).
ΕΛΕΓΧΟΣ t ΣΕ ΕΝΑ ΔΕΙΓΜΑ
Από το μενού Analyze επιλέξτε την εντολή Compare Means και στη συνέχεια την υποεντολή One-Sample T Test.
Συχνά θέλουμε να συγκρίνουμε το μέσο μιας κατανομής με κάποια αντικειμενική σταθερά. Με το αρχείο grades.sav, ο εισηγητής μπορεί να έχει διδάξει σε μια τάξη πολλές φορές και να έχει καθορίσει ποιος πιστεύει ότι είναι ένας αποδεκτός μέσος όρος για μια επιτυχημένη τάξη. Αν η επιθυμητή τιμή για το τελικό ποσοστό (percent) είναι 85, μπορεί να θέλει να συγκρίνει το ποσοστό της τάξης με τη σταθερά. Διαφέρει σημαντικά η πραγματικότητα από αυτό που εκείνος θεωρεί αποδεκτή απόδοση της τάξης;

Οθόνη 28:
Το Παράθυρο One-Sample T Test
Μόλις κάνετε κλικ στην επιλογή One-Sample T Test, εμφανίζεται η οθόνη που επιτρέπει τη διεξαγωγή ελέγχων σε ένα δείγμα (Οθόνη 28, παραπάνω). Η πολύ απλή αυτή διαδικασία απαιτεί να επικολλήσετε μεταβλητές από τη λίστα των μεταβλητών στα αριστερά στο πλαίσιο Test Variable(s), να πληκτρολογήσετε την επιθυμητή τιμή στο πλαίσιο δίπλα στην ετικέτα Test Value και στη συνέχεια να κάνετε κλικ στο ΟΚ. Η διαδικασία αυτή θα συγκρίνει κάθε επιλεγμένη μεταβλητή με την προκαθορισμένη τιμή. Σιγουρευτείτε επομένως, αν επιλέξετε πολλές μεταβλητές, ότι θέλετε να τις συγκρίνετε όλες με τον ίδιο αριθμό. Διαφορετικά, κάντε περισσότερες αναλύσεις.
ΑΠΟΤΕΛΕΣΜΑΤΑ
Έλεγχος t σε Ανεξάρτητα Δείγματα, σε Ζεύγη Δειγμάτων και σε Ένα Δείγμα
Σ’ αυτή την ενότητα παρουσιάζουμε τους τρεις τύπους ελέγχων t ξεχωριστά, τον καθένα κάτω απ’ το δικό του τίτλο. Μια μικρή περιγραφή των ευρημάτων ακολουθεί κάθε ενότητα των αποτελεσμάτων ενώ οι ορισμοί των όρων (και για τις τρεις ενότητες) κλείνουν το κεφάλαιο. Η μορφή των αποτελεσμάτων είναι ελαφρώς διαφορετική (τέτοια που να εξοικονομεί χώρο) από αυτή που παρουσιάζει το SPSS.
ΕΛΕΓΧΟΙ  t  ΣΕ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ:
Ακολουθούν τα αποτελέσματα από τον έλεγχο για το αν υπάρχει διαφορά στο συνολικό βαθμό (total) μεταξύ ανδρών και γυναικών.

Αυτή η ανάλυση ελέγχου t σε ανεξάρτητα δείγματα δείχνει ότι οι 64 γυναίκες έχουν μέσο όρο βαθμολογίας στην τάξη 102,03, οι 41 άνδρες έχουν μέσο όρο βαθμολογίας στην τάξη 98,29 και οι μέσοι δεν διαφέρουν σημαντικά σε επίπεδο p<0,05 (p=0,224). Ο έλεγχος Levene για την Ισότητα των Διακυμάνσεων (Levene’s test for Equality of Variances) δείχνει ότι οι διακυμάνσεις για τους άνδρες και οι διακυμάνσεις για τις γυναίκες δεν διαφέρουν σημαντικά μεταξύ τους (p=0,158). Αυτό το αποτέλεσμα σας επιτρέπει να χρησιμοποιήσετε τον πιο ισχυρό έλεγχο t, αυτόν των ίσων διακυμάνσεων (equal-variance t test). Αν ο έλεγχος Levene δεν δείξει σημαντικές διαφορές, τότε πρέπει να χρησιμοποιήσετε έλεγχο άνισων διακυμάνσεων (unequal-variance t test). Οι ορισμοί για τους υπόλοιπους όρους βρίσκονται σε επόμενη ενότητα αυτού του κεφαλαίου.
ΕΛΕΓΧΟΙ t ΣΕ ΖΕΥΓΗ ΔΕΙΓΜΑΤΩΝ
Ακολουθούν τα αποτελέσματα από τη σύγκριση των κατανομών των μεταβλητών quiz1 και quiz2.
Η ανάλυση του ελέγχου t σε ζεύγη δειγμάτων δείχνει ότι για τους 105 φοιτητές, ο μέσος βαθμός στο δεύτερο πρόχειρο διαγώνισμα (Μ=7,98) είναι σημαντικά μεγαλύτερος σε επίπεδο p<0,01 (σημείωση: p=0,005) από το μέσο βαθμό στο πρώτο διαγώνισμα (Μ=7,47). Αυτά τα αποτελέσματα δείχνουν επίσης ότι υπάρχει σημαντική συσχέτιση ανάμεσα σ’ αυτές τις δύο μεταβλητές (r=0,673, p<0,001) υποδηλώνοντας ότι αυτοί που έχουν υψηλό βαθμό σε κάποιο από τα πρόχειρα διαγωνίσματα τείνουν να έχουν υψηλό βαθμό και στο άλλο. Οι ορισμοί των πρόσθετων όρων παρατίθενται στο τέλος του κεφαλαίου.
ΕΛΕΓΧΟΙ t ΣΕ ΕΝΑ ΔΕΙΓΜΑ
Ακολουθούν τα αποτελέσματα από τον έλεγχο για το αν υπάρχει σημαντική διαφορά μεταξύ των τιμών της μεταβλητής percent και της τιμής 85.


Αυτή η ανάλυση ελέγχου t σε ένα δείγμα δείχνει ότι το μέσο ποσοστό για την τάξη των 105 μαθητών (Μ =80,38) ήταν σημαντικά χαμηλότερο σε επίπεδο
p < 0,001 από το στόχο του εισηγητή (τιμή ελέγχου [=test value]), το 85%. Η Μέση Διαφορά (Mean Difference) είναι απλώς ο πραγματικός μέσος (80,83) μείον την τιμή ελέγχου (85,0).
ΟΡΙΣΜΟΙ ΟΡΩΝ
Όρος
Ορισμός/ Περιγραφή
STD ERROR (=ΤΥΠΙΚΟ ΣΦΑΛΜΑ)
Η τυπική απόκλιση διαιρεμένη με την τετραγωνική ρίζα του Ν. Αυτό είναι ένα μέτρο σταθερότητας ή δειγματοληπτικού σφάλματος των μέσων του δείγματος.
F-VALUE (ΤΙΜΗ F)
Αυτή η τιμή χρησιμοποιείται για να καθορίσει αν οι διακυμάνσεις των δύο κατανομών διαφέρουν σημαντικά μεταξύ τους. Ονομάζεται έλεγχος ετεροσκεδαστικότητας, μια εκπληκτική λέξη για να εντυπωσιάσετε τους φίλους σας!
P= (για το Levene’s test)
Αν οι διακυμάνσεις δεν διαφέρουν σημαντικά, τότε η εκτίμηση ίσων διακυμάνσεων μπορεί να χρησιμοποιηθεί αντί της εκτίμησης άνισων διακυμάνσεων. Η τιμή p, εδώ το 0.158, δείχνει ότι οι δύο διακυμάνσεις δεν διαφέρουν σημαντικά· έτσι μπορεί να χρησιμοποιηθεί η ισχυρότερη στατιστικά εκτίμηση ίσων διακυμάνσεων.
t-VALUES (TIMEΣ t)

Βασίζεται είτε στην εξίσωση της εκτίμησης ίσων διακυμάνσεων είτε στην εξίσωση εκτίμησης άνισων διακυμάνσεων. Θεωρητικά και οι δύο τύποι συγκρίνουν τις διακυμάνσεις του μέσου εντός της ομάδας με τις διακυμάνσεις του μέσου μεταξύ των ομάδων. Η ελαφρώς υψηλότερη (σε απόλυτες τιμές) εκτίμηση ίσων διακυμάνσεων μπορεί να χρησιμοποιηθεί εδώ γιατί οι διακυμάνσεις δεν διαφέρουν σημαντικά. Η πραγματική τιμή t είναι η διαφορά των μέσων προς το τυπικό σφάλμα.
df (βαθμοί ελευθερίας)
Για την εκτίμηση ίσων διακυμάνσεων, ο αριθμός των παρατηρήσεων μείον τον αριθμό των ομάδων (105 – 2 = 103). Οι κλασματικοί βαθμοί ελευθερίας (72.42) για την εκτίμηση άνισης διακύμανσης είναι μια τιμή που προκύπτει από συγκεκριμένο τύπο. Για τους ελέγχους σε  ζεύγη δειγμάτων και σε ένα δείγμα, η τιμή είναι ο αριθμός των παρατηρήσεων μείον 1 (105 – 1 = 104).
2-TAIL SIG (=ΣΗΜΑΝΤΙΚΟΤΗΤΑ ΔΙΠΛΗΣ ΚΑΤΕΥΘΥΝΣΗΣ)
(σχετίζεται με τις τιμές t) Η πιθανότητα ότι η διαφορά των μέσων μπορεί να προέκυψε τυχαία.
MEAN DIFFERENCE (ΜΕΣΗ ΔΙΑΦΟΡΑ)
Η διαφορά μεταξύ δύο μέσων.
STD. DEVIATION (=ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ)
Αυτή είναι η τυπική απόκλιση της διαφοράς και χρησιμοποιείται για να υπολογιστεί η τιμή t για τον έλεγχο t σε ζεύγη. Για κάθε παρατήρηση σ’ ένα έλεγχο t σε ζεύγη, υπάρχει μια διαφορά ανάμεσα στις τιμές δύο διαγωνισμάτων (φυσικά μερικές φορές και 0). Αυτό το συγκεκριμένο στατιστικό μέτρο είναι η τυπική απόκλιση της κατανομής με τους βαθμούς των διαφορών μεταξύ των μέσων.
CORRELATION (=ΣΥΣΧΕΤΙΣΗ)
Μετρά την έκταση στην οποία μια μεταβλητή διαφοροποιείται συστηματικά από κάποια άλλη. Το στατιστικό μέγεθος που παρουσιάζεται εδώ είναι η συσχέτιση Pearson που αντιπροσωπεύεται από ένα r.
2-TAIL SIG (of the correlation) (ΣΗΜΑΝΤΙΚΟΤΗΤΑ ΔΙΠΛΗΣ ΚΑΤΕΥΘΥΝΣΗΣ [της συσχέτισης])
Η πιθανότητα ότι ένα τέτοιο αποτέλεσμα οφείλεται σε τυχαίους παράγοντες. Στους ελέγχους σε ζεύγη δειγμάτων, ένα r = 0.67 και p < 0.001 δείχνει μια ουσιώδη και σημαντική συσχέτιση ανάμεσα στις μεταβλητές quiz1 και quiz2.
95% CI (CONFIDENCE INTERVAL) (=95% ΕΠΙΠΕΔΟ ΕΜΠΙΣΤΟΣΥΝΗΣ)
Στους ελέγχους t το επίπεδο εμπιστοσύνης αφορά την τιμή της  διαφοράς μεταξύ των μέσων. Αν είχε ληφθεί μεγαλύτερος αριθμός δειγμάτων από τον πληθυσμό, το 95% των διαφορών μεταξύ των μέσων θα ανήκαν στο διάστημα μεταξύ της ανώτερης και κατώτερης τιμής που υποδεικνύονται.
Κεφάλαιο 4: Μονόδρομη Ανάλυση Διακύμανσης (One-Way ANOVA)
Η μονόδρομη ανάλυση διακύμανσης εκτελείται μέσω της εντολής One-Way ANOVA του SPSS. Ενώ η ανάλυση αυτή θα μπορούσε να επιτευχθεί και χρησιμοποιώντας την εντολή General Linear Models, στην εντολή One-Way ANOVA υπάρχουν συγκεκριμένες επιλογές που δεν είναι διαθέσιμες αλλού, συμπεριλαμβανομένων των μετέπειτα ελέγχων, όπως οι Tukey και Scheffé, και των σχεδιασμένων συγκρίσεων διαφορετικών ομάδων ή συνθέσεων ομάδων.
ΕΙΣΑΓΩΓΗ ΣΤΗ ΜΟΝΟΔΡΟΜΗ ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ
Η ανάλυση διακύμανσης είναι μια διαδικασία που χρησιμοποιείται για να συγκρίνουμε μέσους δειγμάτων και να δούμε αν υπάρχουν επαρκή στοιχεία για να συμπεράνουμε ότι οι μέσοι των αντίστοιχων πληθυσμιακών κατανομών επίσης διαφέρουν. Η μονόδρομη ανάλυση διακύμανσης εξηγείται ευκολότερα αν τη συγκρίνουμε με τους ελέγχους t. Ενώ οι έλεγχοι t συγκρίνουν μόνο δύο κατανομές, η ανάλυση διακύμανσης μπορεί να συγκρίνει πολλές. Αν, για παράδειγμα, ένα δείγμα φοιτητών συμμετέχει σε ένα διαγώνισμα με άριστα το 10 και θέλουμε να δούμε αν οι άνδρες ή οι γυναίκες πέτυχαν μεγαλύτερο σκορ, θα ήταν κατάλληλος ο έλεγχος t. Υπάρχει η κατανομή των σκορ που πέτυχαν οι γυναίκες και η κατανομή των σκορ που πέτυχαν οι άνδρες κι ο έλεγχος t θα μας έλεγε αν οι μέσοι των δύο αυτών κατανομών διαφέρουν σημαντικά μεταξύ τους. Αν όμως θέλετε να δείτε κατά πόσο τα σκορ των πέντε διαφορετικής εθνικότητας ομάδων διαφέρουν σημαντικά μεταξύ τους για το ίδιο διαγώνισμα, θα έπρεπε να κάνετε μονόδρομη ανάλυση παλινδρόμησης. Αν τρέχαμε έναν τέτοιο έλεγχο, η μονόδρομη ανάλυση παλινδρόμησης θα μπορούσε να μας πει αν υπάρχουν σημαντικές διαφορές σε κάποια από τις συγκρίσεις μεταξύ των πέντε ομάδων του δείγματός μας. Περαιτέρω έλεγχοι (όπως ο έλεγχος Scheffé, ο οποίος θα περιγραφεί σ’ αυτό το κεφάλαιο) είναι απαραίτητοι για να καθορίσουμε μεταξύ ποιων ομάδων υπάρχουν οι σημαντικές διαφορές.
Η προηγούμενη παράγραφος περιγράφει με συντομία την ανάλυση διακύμανσης. Τι σημαίνει το «μονόδρομη»; Χρησιμοποιώντας την εντολή One-Way ANOVA, μπορείτε να έχετε ακριβώς μία εξαρτημένη μεταβλητή (συνεχή πάντα) και ακριβώς μία ανεξάρτητη μεταβλητή (μη συνεχή πάντα). Η ανεξάρτητη μεταβλητή που παρουσιάζεται παραπάνω (εθνικότητα) είναι μία μεταβλητή αλλά έχει πολλά επίπεδα. Στο παράδειγμά μας έχει πέντε: Ιθαγενής, Ασιάτης, Μαύρος, Λευκός, και Ισπανόφωνος. Τα Μοντέλα Ανάλυσης Διακύμανσης (ANOVA Models) μπορούν να έχουν επίσης το πολύ μία εξαρτημένη μεταβλητή αλλά μπορούν να έχουν δύο ή περισσότερες ανεξάρτητες μεταβλητές. Στην MANOVA, την πολυμεταβλητή ανάλυση διακύμανσης, στην οποία δεν θα αναφερθούμε, μπορούν να υπάρχουν πολλές εξαρτημένες και πολλές ανεξάρτητες μεταβλητές.
Η επεξήγηση που ακολουθεί δίνει μια θεωρητική αίσθηση για το τι προσπαθεί να πετύχει η μονόδρομη ανάλυση διακύμανσης. Τα μέσα σκορ του διαγωνίσματος για κάθε μία από τις εθνικότητες συγκρίνονται μεταξύ τους: Ιθαγενείς με Ασιάτες, Ιθαγενείς με Μαύρους, Ιθαγενείς με Λευκούς, Ιθαγενείς με Ισπανόφωνους, Ασιάτες με Μαύρους, Ασιάτες με Λευκούς, Ασιάτες με Ισπανόφωνους, Μαύροι με Λευκούς, Μαύροι με Ισπανόφωνους και Λευκοί με Ισπανόφωνους. Η Μονόδρομη ανάλυση διακύμανσης θα δώσει κάποια τιμή σημαντικότητας που θα δηλώνει αν υπάρχουν σημαντικές διαφορές στις συγκρίσεις που έγιναν. Αυτή η τιμή σημαντικότητας δεν προσδιορίζει πού βρίσκεται η διαφορά ή ποιες είναι οι διαφορές, αλλά ο έλεγχος Scheffé μπορεί να εντοπίσει ποιες ομάδες διαφέρουν σημαντικά μεταξύ τους. Να γνωρίζετε ότι υπάρχουν κι άλλοι έλεγχοι εκτός από τον Scheffé που μπορούν να εντοπίσουν διαφορές μέσα σε ζεύγη∙ ο Tukey (HSD), ο LSD, και ο Bonferroni είναι επίσης δημοφιλείς έλεγχοι διμεταβλητών συγκρίσεων.
Το αρχείο που χρησιμοποιούμε για να παρουσιάζουμε την Μονόδρομη ανάλυση διακύμανσης είναι αυτό του γνωστού μας παραδείγματος. Το αρχείο ονομάζεται grades.sav κι έχει αριθμό παρατηρήσεων Ν = 105. Με την ανάλυση αυτή, αντιπαραβάλλουμε τους βαθμούς στο quiz4 (η εξαρτημένη μεταβλητή) με τα πέντε επίπεδα της εθνικότητας, ethnic (η ανεξάρτητη μεταβλητή) –Ιθαγενής, Ασιάτης, Μαύρος, Λευκός, και Ισπανόφωνος.
ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ
Μονόδρομη Ανάλυση Διακύμανσης
Από το μενού Analyze επιλέγετε την εντολή Compare Means και στη συνέχεια την υποεντολή One-Way ANOVA. Η αρχική οθόνη που εμφανίζεται αφού κάνετε κλικ στην εντολή One-Way ANOVA δίνει μια σαφή ιδέα για τη δομή της εντολής (Οθόνη 29). Πολλές φορές στη διεξαγωγή της ανάλυσης διακύμανσης θα χρησιμοποιηθούν και οι τρεις επιλογές (Options, Post Hoc, και Contrasts). Προσέξτε πρώτα τη γνωστή λίστα με τις μεταβλητές στα αριστερά. Στη συνέχεια προσέξτε το μεγάλο πλαίσιο προς το επάνω μέρος της οθόνης (με τίτλο Dependent List [=Λίστα Εξαρτημένων]). Σ’ αυτό το πλαίσιο θα τοποθετηθεί μία μοναδική συνεχής μεταβλητή (η quiz4 σ’ αυτό το παράδειγμα) ή πολλές συνεχείς μεταβλητές. Το SPSS θα εκτυπώσει ξεχωριστά αποτελέσματα της ανάλυσης διακύμανσης για κάθε εξαρτημένη μεταβλητή που συμπεριλήφθηκε. Παρακάτω βρίσκεται το πλαίσιο Factor (=παράγοντας). Εδώ θα τοποθετηθεί μία μοναδική ποιοτική μεταβλητή (η ethnic στο παράδειγμά μας). Αυτή η ανάλυση θα συγκρίνει τα σκορ των διαγωνισμάτων για κάθε μία από τις εθνικότητες. Υπάρχουν φυσικά πέντε εθνικότητες κάτω από τη μεταβλητή ethnic, αλλά επειδή υπάρχουν μόνον 5 παρατηρήσεις στην κατηγορία Ιθαγενής, θα συμπεριλάβουμε μόνον τις υπόλοιπες τέσσερις.
Οθόνη 29:
Το Παράθυρο One-Way ANOVA
Παρότι η προηγούμενη ανάλυση θα σας πει αν υπάρχει σημαντική διαφορά στις συγκρίσεις που έγιναν, δεν σας λέει πολλά παραπάνω. Δεν ξέρετε τις τιμές του μέσου για κάθε ομάδα, δεν έχετε καμία πληροφορία για την ψυχομετρική εγκυρότητα των μεταβλητών σας, και δεν είναι δυνατόν να πείτε ποιες ομάδες διαφέρουν από ποιες. Η πρώτη παράλειψη επιλύεται αν κάνετε κλικ στο πλήκτρο Options. Η Οθόνη 30 ανοίγει και σας δίνει δύο σημαντικές δυνατότητες. Την επιλογή Descriptives (=περιγραφικά) που δίνει για κάθε επίπεδο το μέσο, την τυπική απόκλιση, τα τυπικά σφάλματα, τα όρια εμπιστοσύνης στο 95%, το ελάχιστο και το μέγιστο. Την επιλογή Homogeneity-of-variance (=ομογένεια της διακύμανσης) που επίσης δίνει σημαντικές ψυχομετρικές πληροφορίες για την καταλληλότητα των μεταβλητών που θέλετε να συμμετέχουν στην ανάλυση. Η εντολή Means plot (=γράφημα μέσων), αν επιλεγεί, θα παράγει ένα γραμμογράφημα που θα απεικονίζει το μέσο για κάθε κατηγορία (κάθε εθνικότητα σ’ αυτή την περίπτωση) γραφικά.
Οθόνη 30:
Το Παράθυρο One-Way ANOVA: Options
Ένα δεύτερο σημαντικό θέμα εξετάζει τις pairwise συγκρίσεις—δηλαδή συγκρίσεις κάθε πιθανού ζεύγους μη συνεχών μεταβλητών. Για παράδειγμα στις συγκρίσεις μας για την εθνικότητα, ενδιαφερόμαστε για το αν μια ομάδα έχει σημαντικά υψηλότερο σκορ από κάποια άλλη. Το σκορ των Λευκών σε σχέση με το σκορ των Ασιατών, των Μαύρων σε σχέση με των Ισπανόφωνων, και ούτω καθ’ εξής. Ο τίτλος του παραθύρου (Οθόνη 31, παρακάτω) είναι Post Hoc Multiple Comparisons (=Πολλαπλές Post Hoc Συγκρίσεις). «Post Hoc» σημαίνει μετά το γεγονός. «Πολλαπλές Συγκρίσεις» σημαίνει ότι στις συγκρίσεις περιλαμβάνονται όλα τα πιθανά ζευγάρια παραγόντων. Υπάρχουν 14 επιλογές αν υποτεθούν ίσες διακυμάνσεις για τα επίπεδα μιας μεταβλητής και άλλες 4 αν δεν υποτεθούν ίσες διακυμάνσεις. Ο αριθμός των επιλογών για έλεγχο προκαλεί κάτι παραπάνω από ζάλη. Η εντολή LSD (=ελάχιστα σημαντική διαφορά) αφορά τον πιο χαλαρό από τους ελέγχους (αυτό σημαίνει ότι έχετε τις περισσότερες πιθανότητες να βρείτε σημαντικές διαφορές στις συγκρίσεις) επειδή πρόκειται απλώς για μια σειρά από ελέγχους t. Οι Scheffé και Bonferroni είναι πιθανώς οι πιο συντηρητικοί της ομάδας. O Tukey (HBS—γνήσια σημαντική διαφορά) είναι μια ακόμη δημοφιλής επιλογή.
Οθόνη 31:
Το Παράθυρο One-Way ANOVA: Post Hoc Multiple Comparisons
Η τελική επιλογή στην αρχική οθόνη αφορά τις Αντιπαραβολές (Contrasts). Μόλις κάνετε κλικ σ’ αυτό το πλήκτρο, εμφανίζεται η Οθόνη 32 (παρακάτω). Αυτή η διαδικασία σας επιτρέπει να συγκρίνετε ένα επίπεδο μιας μη συνεχούς μεταβλητής με μια σύνθεση των άλλων (π.χ. Λευκοί με μη Λευκούς) ή μια σύνθεση με μια άλλη σύνθεση (π.χ. μια ομάδα από Λευκούς και Ισπανόφωνους με μια ομάδα από Μαύρους και Ασιάτες). Μόλις διαμορφωθούν οι ομάδες, η εντολή Contrasts υπολογίζει έναν έλεγχο t ανάμεσα στις δυο ομάδες. Σ’ αυτή τη διαδικασία τα επίπεδα μιας μεταβλητής κωδικοποιούνται με βάση την ετικέτα (label) της τιμής τους. Η παρούσα κωδικοποίηση είναι Ασιάτες = 2, μαύροι = 3, Λευκοί = 4, και Ισπανόφωνοι = 5. Στα πλαίσια των συντελεστών (coefficients) πρέπει να καταχωρίσετε αριθμούς που αντιπαραβάλλουν τους θετικούς αριθμούς μιας ομάδας με τους αρνητικούς αριθμούς μιας άλλη. Είναι απαραίτητο οι συντελεστές αυτοί να έχουν πάντα άθροισμα μηδέν. Για παράδειγμα, μια σύγκριση Ισπανόφωνων-Ασιατών θα μπορούσε να κωδικοποιηθεί ως (-1 0 0 1). Μια αντιπαραβολή Λευκών–Μη Λευκών (1 1 -3 1) και τα επίπεδα 2 και 3 σε αντιπαραβολή με τις ομάδες 4 και 5 (-1 -1 1 1 ). Προσέξτε ότι κάθε μία απ’ αυτές τις σειρές έχει άθροισμα μηδέν. Η σύγκριση που παρουσιάζεται στην παρακάτω οθόνη αντιπαραβάλει τους Ισπανόφωνους (την 5η ομάδα) με τους μη Ισπανόφωνους (ομάδες 1, 2, 3, και 4).
Οθόνη 32:
Το Παράθυρο One-Way ANOVA: Contrasts
Η διαδικασία απαιτεί να πληκτρολογήσετε στο πλαίσιο των Coefficients (=συντελεστές) τον αριθμό που αντιπροσωπεύει το πρώτο επίπεδο της ποιοτικής μεταβλητής, να κάνετε κλικ στο Add (=προσθήκη), στη συνέχεια να πληκτρολογήσετε τον αριθμό που αντιπροσωπεύει το δεύτερο επίπεδο της μεταβλητής και να κάνετε κλικ στο πλήκτρο Add και ούτω καθ’ εξής μέχρι να έχουν οριστεί όλα τα επίπεδα της μεταβλητής. Στη συνέχεια, αν θέλετε άλλη μια αντιπαραβολή, κάντε κλικ στο πλήκτρο Next στα δεξιά του Contrast 1 of 1 (=Αντιπαραβολή 1 από 1)  και επαναλάβετε τη διαδικασία.
ΑΠΟΤΕΛΕΣΜΑΤΑ
Μονόδρομη Ανάλυση Διακύμανσης
Ακολουθούν τα αποτελέσματα από τη σύγκριση των βαθμών στο τέταρτο πρόχειρο διαγώνισμα (quiz4) μεταξύ 1) Λευκών και Ασιατών με Ισπανόφωνους και Μαύρους και 2) Μη Ισπανόφωνων με Ισπανόφωνους, αφού έχουμε θέσει εκτός ανάλυσης τους Ιθαγενείς.
Το ερμηνευτικό στοιχείο που παρουσιάζει ενδιαφέρον στον αρχικό πίνακα της ANOVA είναι ότι, με βάση μια πιθανότητα p = 0.085, υπάρχει μια διαφορά (ή διαφορές) οριακά σημαντική στις συγκρίσεις των βαθμών του quiz4 ανάμεσα στις τέσσερις διαφορετικές εθνικότητες. Ακολουθούν οι ορισμοί των όρων του πίνακα ANOVA.

Όρος
Ορισμός/ Περιγραφή
WITHIN-GROUPS SUM OF SQUARES (=ΑΘΡΟΙΣΜΑ ΤΕΤΡΑΓΩΝΩΝ ΕΝΤΟΣ ΟΜΑΔΩΝ)
Το άθροισμα των τετραγώνων των αποκλίσεων μεταξύ του μέσου κάθε ομάδας και των τιμών που έχουν παρατηρηθεί για κάθε έναν συμμετέχοντα που ανήκει σε αυτή την ομάδα.
BETWEEN-GROUPS SUM OF SQUARES (=ΑΘΡΟΙΜΑ ΤΕΤΡΑΓΩΝΩΝ ΜΕΤΑΞΥ ΟΜΑΔΩΝ)
Το άθροισμα των τετραγώνων των αποκλίσεων μεταξύ του γενικού μέσου και του μέσου κάθε ομάδας πολλαπλασιασμένο με τον αριθμό των συμμετεχόντων σε κάθε ομάδα.
BETWEEN-GROUPS DF (=ΒΑΘΜΟΙ ΕΛΕΥΘΕΡΙΑΣ ΜΕΤΑΞΥ ΟΜΑΔΩΝ)
Αριθμός των ομάδων μείον ένα.
WITHIN-GROUPS DF (=ΒΑΘΜΟΙ ΕΛΕΥΘΕΡΙΑΣ ΕΝΤΟΣ ΟΜΑΔΩΝ)
Το άθροισμα των παρατηρήσεων μείον τον αριθμό των ομάδων, μείον ένα.
MEAN SQUARE (=ΜΕΣΟΣ ΤΕΤΡΑΓΩΝΩΝ)
Το άθροισμα των τετραγώνων διαιρεμένο με τους βαθμούς ελευθερίας.
F RATIO (=ΛΟΓΟΣ F)
Το τετράγωνο του μέσου μεταξύ των ομάδων διαιρεμένο με το τετράγωνο του μέσου εντός των ομάδων.
SIGNIFICANCE (=ΣΗΜΑΝΤΙΚΟΤΗΤΑ)
Η πιθανότητα η τιμή της παρατήρησης να προέκυψε τυχαία. Το αποτέλεσμα εδώ δείχνει ότι υπάρχει/ουν οριακά σημαντική/ές διαφορά/ές ανάμεσα στους μέσους των τεσσάρων ομάδων, όπως σημειώνεται από την τιμή πιθανότητας 0,085.


Όρος
Ορισμός/ Περιγραφή
N
Αριθμός παρατηρήσεων σε κάθε επίπεδο της μεταβλητής ethnic.
MEAN (=ΜΕΣΟΣ)
Μέσος βαθμός για κάθε ομάδα
STΚΑΙARD DEVIATION (ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ)
Το τυπικό μέτρο διακύμανσης γύρω από το μέσο
STΚΑΙARD ERROER
Η τυπική απόκλιση διαιρεμένη με την τετραγωνική ρίζα του Ν
95% CI (CONFIDENCE INTERVAL) FOR MEAN (=95% ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΤΟ ΜΕΣΟ)
Με δεδομένο ένα μεγάλο αριθμό δειγμάτων μέσα από έναν πληθυσμό, το 95% των μέσων αυτών των δειγμάτων θα βρίσκονται ανάμεσα στην κατώτερη και την ανώτερη τιμή. Αυτές οι τιμές βασίζονται στην κατανομή t και είναι περίπου ίσοι με το μέσο ± 2 x το τυπικό σφάλμα.
MINIMUM/ MAXIMUM (ΕΛΑΧΙΣΤΟ/ ΜΕΓΙΣΤΟ)
Η μικρότερη και μεγαλύτερη τιμή που παρατηρήθηκαν γι’ αυτή την ομάδα.
Έλεγχοι Post Hoc:
Η τιμή του μέσου (μέσος βαθμός για το quiz4) για κάθε μία από τις τέσσερις ομάδες είναι καταχωρημένη στον προηγούμενο πίνακα. Οι αστερίσκοι (*) υποδηλώνουν ότι υπάρχουν δύο ζεύγη ομάδων, των οποίων οι μέσοι διαφέρουν σημαντικά (σε επίπεδο p < 0,05) μεταξύ τους: Σύμφωνα με αυτά τα υποθετικά δεδομένα, οι Ασιάτες (M = 8,35) και οι Λευκοί (Μ = 8,04) είχαν σημαντικά μεγαλύτερους βαθμούς στο quiz4 από τους Ισπανόφωνους (Μ=6,27). Προσέξτε τις σχετικές τιμές σημαντικότητας 0,015 και 0,021. Το γεγονός ότι τα συνολικά αποτελέσματα της ANOVA έδειξαν μόνον οριακή σημαντικότητα (p = 0,085) και ότι οι συγκρίσεις κατά ζεύγη έδωσαν δύο διαφορές που είναι στατιστικά σημαντικές οφείλεται στο ότι η συνολική ANOVA συγκρίνει όλες τις τιμές ταυτόχρονα (κι επομένως εξασθενεί η στατιστική ισχύς) ενώ η διαδικασία LSD είναι απλώς μια σειρά ανεξάρτητων ελέγχων t.
Ο έλεγχος Levene’s για την ομοιογένεια της διακύμανσης με τιμή σημαντικότητας 0,002 υποδηλώνει ότι οι διακυμάνσεις για τους βαθμούς του quiz4 για κάθε μία από τις εθνικότητες όντως διαφέρουν σημαντικά. Προσέξτε ότι αυτές οι τιμές ποικίλουν από μία μικρή διακύμανση για τους Ασιάτες της τάξης του 1,532 (=2,34), σε μια πολύ ευρύτερη για τους Ισπανόφωνους ή 3,322
(=11,02). Οι περισσότεροι ερευνητές αν έβλεπαν ένα τέτοιο αποτέλεσμα, θα έλεγχαν τις κατανομές ως προς τα μέτρα της κανονικότητας (ασυμμετρία και κύρτωση), και αν έβρισκαν κάτι ασυνήθιστο πιθανότατα θα αγνοούσαν αυτά τα αποτελέσματα και θα αποδέχονταν την ανάλυση ANOVA ως έγκυρη. Αυτά τα μέτρα ομογένειας της διακύμανσης δρουν περισσότερο ως προειδοποίηση παρά ως κριτήριο ακαταλληλότητας. Πάντως στη μήτρα των συντελεστών αντιπαραβολής (Contrast Coefficients) παρακάτω, θα χρησιμοποιήσετε την ελαφρά λιγότερο ισχυρή εκτίμηση που βασίζεται στην υπόθεση άνισων διακυμάνσεων.

Ο πρώτος πίνακας απλώς ξαναδείχνει τις αντιπαραβολές που αναφέρθηκαν νωρίτερα. Έγιναν δύο είδη συγκρίσεων t: Κάτω από την εκτίμηση ισοδύναμης διακύμανσης, και οι δύο αντιπαραβολές είναι σημαντικές: ανάμεσα σε Ασιάτες-Λευκούς και Ισπανόφωνους-Μαύρους, (p=0,022) ανάμεσα σε Ισπανόφωνους και μη Ισπανόφωνους (p=0,016). Για την εκτίμηση της άνισης διακύμανσης πάντως καμία από τις αντιπαραβολές δεν πετυχαίνει σημαντικότητα. Από τη στιγμή που οι διακυμάνσεις όντως διαφέρουν σημαντικά, θα έπρεπε να δεχτούμε την εκτίμηση άνισης διακύμανσης ως έγκυρη, πράγμα που έχει ως αποτέλεσμα μη σημαντικές διαφορές. Παρακάτω ορίζονται οι όροι αυτού του τμήματος της ανάλυσης.
Όρος
Ορισμός/ Περιγραφή
VALUE (=ΤΙΜΗ)
Παρουσιάζει μικρό ενδιαφέρον επειδή είναι σταθμισμένος αριθμός.
STΚΑΙARD ERROR (=ΤΥΠΙΚΟ ΣΦΑΛΜΑ)
Η τυπική απόκλιση διαιρεμένη με την τετραγωνική ρίζα του N.
T-VALUES (=ΤΙΜΕΣ Τ)
Για κάθε μία εκτίμηση ίσης ή άνισης διακύμανσης, το t καθορίζεται από την ΤΙΜΗ διαιρεμένη  με το τυπικό σφάλμα.
STΚΑΙARD ERROR (=ΤΥΠΙΚΟ ΣΦΑΛΜΑ)
Η τυπική απόκλιση διαιρεμένη με την τετραγωνική ρίζα του N.
DF (DEGREES OF FREEDOM) (=ΒΑΘΜΟΙ ΕΛΕΥΘΕΡΙΑΣ)
Ο αριθμός των παρατηρήσεων μείον τον αριθμό των ομάδων για την εκτίμηση ίσων διακυμάνσεων. Είναι ένας ελάχιστα γνωστός τύπος που υπολογίζει την τιμή των κλασματικών βαθμών ελευθερίας για την εκτίμηση άνισης διακύμανσης.
T PROBABILITY (ΠΙΘΑΝΟΤΗΤΑ Τ)
Η πιθανότητα αυτές οι τιμές να προέκυψαν τυχαία. Τα αποτελέσματα δείχνουν ότι, για τους βαθμούς στο quiz4, για τις εκτιμήσεις άνισης διακύμανσης, καμία αντιπαραβολή δεν επιτυγχάνει τη σημαντικότητα.


ΠΑΡΑΡΤΗΜΑ

Αρχεία Δεδομένων για την παρουσίαση των αναλύσεων
Ι. GRADES.SAV
Το Grades.sav είναι το αρχείο δεδομένων που θα χρησιμοποιήσουμε για την παρουσίαση των περισσότερων στατιστικών αναλύσεων και ελέγχων που διδάσκονται στο συγκεκριμένο μάθημα. Το αρχείο αυτό περιέχει ακατέργαστα δεδομένα για τον υπολογισμό των βαθμών σε μια συγκεκριμένη τάξη. Το παράδειγμα αναφέρεται σε ένα μοναδικό αρχείο κάποιου καθηγητή, ο οποίος διδάσκει σε τρία τμήματα μιας τάξης με περίπου 35 φοιτητές σε κάθε τμήμα. Από αριστερά προς τα δεξιά, οι μεταβλητές που χρησιμοποιούνται σε αυτό το αρχείο δεδομένων είναι:
Μεταβλητή
Περιγραφή
ID
Εξαψήφιος αριθμός που αποτελεί την ταυτότητα του φοιτητή.
LASTNAME
Το επώνυμο του φοιτητή.
FIRSTNAM
Το μικρό όνομα του φοιτητή.
SEX
Το φύλο του φοιτητή: 1=γυναίκα, 2 = άνδρας
ETHNIC
Η εθνικότητα του φοιτητή: 1=Ιθαγενής, 2=Ασιάτης, 3 = Μαύρος, 4=Λευκός, 5=Ισπανόφωνος
YEAR
Έτος στη σχολή: 1=Frosh (1ο έτος), 2=Soph (2ο έτος), 3=Junior (3ο έτος), 4=Senior (4ο έτος)
LOWUP
Φοιτητής πάνω ή κάτω από το μέσο όρο: 1=Κάτω, 2=Πάνω
SECTION
Τμήμα της τάξης (1 έως 3).
GPA
Μέσος όρος στην αρχή του μαθήματος.
ETRCRED
Αν ο φοιτητής έχει επιπλέον βαθμούς από εργασίες  ή όχι: 1=Όχι, 2=Ναι
REVIEW
Αν ο φοιτητής έχει παρακολουθήσει επαναληπτικά μαθήματα ή όχι: 1=Όχι, 2=Ναι
QUIZ1 έως
QUIZ5
Βαθμοί σε 5 πρόχειρα διαγωνίσματα (το καθένα με άριστα το 10) κατά τη διάρκεια του εξαμήνου.
FINAL
Τελική εξέταση με άριστα το 75.
Το anxiety.sav είναι το αρχείο δεδομένων που θα χρησιμοποιήσουμε για την παρουσίαση της απλής παλινδρόμησης.
Το αρχείο περιλαμβάνει υποθετικά δεδομένα με αριθμό παρατηρήσεων Ν = 73 σχετικά με τη σχέση του μεγέθους ανησυχίας/ άγχους πριν από κάποια εξέταση και την απόδοση στην εξέταση αυτή. Περιλαμβάνει δύο μεταβλητές:
exam: Η βαθμολογία στην εξέταση με άριστα το 100.
anxiety: ένα μέτρο του άγχους πριν από την εξέταση, το οποίο μετράται σε μια 10βάθμια κλίμακα, από χαμηλό (0) ως υψηλό (10).

Το anxiety.sav είναι το αρχείο δεδομένων που θα χρησιμοποιήσουμε για την παρουσίαση της πολλαπλής παλινδρόμησης.
Το αρχείο περιλαμβάνει πραγματικά δεδομένα με αριθμό παρατηρήσεων Ν = 81 και δημιουργήθηκε για να παρουσιάσει τη σχέση ανάμεσα σε διάφορες μεταβλητές και το χρόνο που δαπανάται για την παροχή βοήθειας σ’ ένα φίλο. Παρότι υπάρχουν κι άλλες μεταβλητές στο αρχείο, αυτές που χρησιμοποιούνται για την παρουσίαση των διαδικασιών παλινδρόμησης είναι οι εξής:
  • zhelp: οι τιμές z (τυποποιημένη κανονική κατανομή) του χρόνου, ο οποίος δαπανήθηκε για την ανταπόκριση στην ανάγκη του φίλου, που μετράται σε μια κλίμακα από -3 έως +3.
  • sympathy: η συμπάθεια, την οποία αισθάνθηκε ο παρέχων τη βοήθεια απέναντι στην ανάγκη του φίλου και μετράται σε μια κλίμακα από  λίγη(1) έως πολλή(7).
  • anger: ο θυμός, τον οποίο αισθάνθηκε ο παρέχων τη βοήθεια απέναντι στην ανάγκη του φίλου· χρησιμοποιείται η ίδια επταβάθμια κλίμακα.
  • efficacy: η άποψη εκείνου που παρέχει τη βοήθεια σχετικά με την επάρκειά του να παρέχει βοήθειας (self efficacy)· χρησιμοποιείται η ίδια κλίμακα.
  • severity: Η σοβαρότητα του προβλήματος που αντιμετωπίζει ο φίλος, όπως εκλαμβάνεται απ’ αυτόν που παρέχει τη βοήθεια· χρησιμοποιείται η ίδια κλίμακα.
  • empatened: Η τάση συναισθηματικής κατανόησης εκείνου που παρέχει τη βοήθεια, όπως αυτή μετράται από κάποιο τεστ προσωπικότητας.

ΙV. HELPING2.SAV
Ένα αρχείο με πραγματικά δεδομένα (Ν = 517) που αφορούν παρόμοια θέματα με αυτά του αρχείου helping1.sav. Παρότι το αρχείο είναι μεγάλο (τόσο σε αριθμό παρατηρήσεων όσο και σε αριθμό μεταβλητών), χρησιμοποιούνται μόνο τα 15 από τα μέτρα της αυτοαξιολόγηση[1] των δυνατοτήτων κάποιου (self-efficacy) και οι 14 ερωτήσεις σχετικά με τη συναισθηματική κατανόηση για να παρουσιάσουν την ανάλυση παραγόντων (Κεφάλαιο 7). Τα ονόματα των μεταβλητών που χρησιμοποιούνται στην ανάλυση είναι, μεταξύ άλλων:
  • effic έως effic15: οι 15 ερωτήσεις σχετικά με την αυτοαξιολόγηση που χρησιμοποιούνται στην παρουσίαση της ανάλυσης παραγόντων.
  • empathy1 έως empathy14: Οι 14 ερωτήσεις σχετικά με την τάση για  συναισθηματική κατανόηση που χρησιμοποιούνται στην παρουσίαση της ανάλυσης αξιοπιστίας.

ΑΣΚΗΣΕΙΣ

ΑΣΚΗΣΗ 1
Η παρακάτω λίστα είναι οι τιμές πώλησης διαφόρων προϊόντων χωρίς το Φ.Π.Α.
135, 200, 125, 100, 140, 225, 310, 100, 350, 95, 142, 180, 175, 160, 270, 285, 340, 320, 130, 140.
Α)  Να γίνει ταξινόμηση
Β)  Να δημιουργηθεί μια νέα μεταβλητή η οποία θα είναι η τελική τιμή του προϊόντος μαζί με το Φ.Π.Α. (Φ.Π.Α. 19%)
Γ)  Να βρεθεί το ποσοστό των προϊόντων που η τιμή τους είναι μεγαλύτερη ή ίση του 120 και μικρότερη ή ίση του 270.
ΑΣΚΗΣΗ 2
Για την παρακάτω λίστα αριθμών, να υπολογίσετε το μέσο, τη διάμεσο τιμή, το εύρος και την τυπική απόκλιση του δείγματος.
68
53
55
63
80
51
62
79
65
50
60
74



ΑΣΚΗΣΗ 3
Ο πίνακας που ακολουθεί παρουσιάζει το βάρος 40 αθλητών.
ΒΑΡΟΣ
ΣΥΧΝΟΤΗΤΑ
64
3
65
5
66
8
67
11
68
7
69
3
70
2
71
1
Α)  Να υπολογίσετε το μέσο, τη διάμεσο, την επικρατούσα τιμή, την τυπική απόκλιση και το εύρος του δείγματος.
Β)  Να βρείτε το ποσοστό των παρατηρήσεων που είναι μικρότερες ή ίσες του 66.
Γ)  Να βρείτε την τιμή για την οποία ισχύει ότι το 40% των παρατηρήσεων είναι μικρότερο από αυτήν.
ΑΣΚΗΣΗ 4
Η βαθμολογία 50 φοιτητών στο μάθημα της Στατιστικής ήταν:
2
3
9
7
2
4
1
7
6
5
9
4
6
7
3
2
5
7
8
8
10
9
2
5
4
4
7
6
5
8
4
7
6
5
2
7
8
2
9
9
3
2
5
7
8
1
10
2
6
5
Α)  Να κατασκευάσετε τον πίνακα συχνοτήτων και σχετικών αθροιστικών συχνοτήτων
Β)  Αν η σχολή θέλει να δώσει υποτροφία στους φοιτητές με βαθμολογία μεγαλύτερη ή ίση του 8, πόσοι φοιτητές θα πάρουν υποτροφία;
Γ)   Μεταξύ ποιών βαθμών κυμαίνεται η βαθμολογία του 30% των καλύτερων φοιτητών του τμήματος;
Δ)  Να χρησιμοποιήσετε κατάλληλα διαγράμματα για την παρουσίαση των δεδομένων.
ΑΣΚΗΣΗ 5
Σε ένα σχολείο η Β΄ Λυκείου  αποτελείται από 18 αγόρια και 12 κορίτσια. Στο σχολείο έγινε ένα ψυχολογικό πείραμα για την αντίληψη των αριθμητικών πράξεων. Τα αποτελέσματα παρουσιάζονται στον παρακάτω πίνακα.

ΦΥΛΟ
ΒΑΘΜΟΣ
ΦΥΛΟ
ΒΑΘΜΟΣ
1
2,00
1
9,00
1
5,00
1
4,00
1
1,00
1
3,00
1
8,00
2
8,00
1
8,00
2
2,00
1
2,00
2
3,00
1
10,00
2
1,00
1
8,00
2
6,00
1
2,00
2
9,00
1
9,00
2
2,00
1
3,00
2
4,00
1
5,00
2
8,00
1
6,00
2
8,00
1
8,00
2
7,00
1
8,00
2
1,00
Να αναλύσετε τα παραπάνω δεδομένα.
ΑΣΚΗΣΗ 6
Κατά την δοκιμή ενός νέου εμβολίου για την καταπολέμηση μιας ασθένειας εμβολιάστηκαν 60 μαθητές από τους 150 ενός σχολείου. Από αυτούς προσβλήθηκαν από τη νόσο 20 μαθητές από αυτούς που είχαν εμβολιασθεί και 50 από αυτούς που δεν είχαν εμβολιασθεί. Πιστεύετε ότι το εμβόλιο είχε ευεργετική επίδραση;
ΑΣΚΗΣΗ 7
Σε μια έρευνα ερωτήθηκαν 544 οικογένειες για την επιλογή του σχολείου των παιδιών τους την οικογενειακή κατάσταση και το επάγγελμα του πατέρα. Τα στοιχεία δίδονται στο αρχείο ΣΧΟΛΕΙΟ του EXCEL. Να γίνει η εισαγωγή των στοιχείων αυτών στο SPSS και στη συνέχεια να πινακοποιηθούν να γίνουν πίνακες συχνοτήτων και κατάλληλα διαγράμματα.
ΑΣΚΗΣΗ 8
Σε παλαιότερο σύστημα εισαγωγής στο Πανεπιστήμιο υπήρχε η δυνατότητα να διατηρήσει κάποιος υποψήφιος την βαθμολογία του σε ένα μάθημα στις επόμενες γενικές εξετάσεις. Ας υποθέσουμε ότι η εισαγωγή 10 υποψηφίων κρίνεται από τη βαθμολογία τους σε ένα μάθημα (σε όλα τα υπόλοιπα είχαν τις ίδιες βαθμολογίες) και ότι από αυτούς θα εισαχθούν 4 υποψήφιοι. Κάποιοι από αυτούς είχαν διατηρήσει την βαθμολογία τους από τις προηγούμενες γενικές εξετάσεις και κάποιοι έδιναν για πρώτη φορά.
Έστω ότι η βαθμολογία όλων των υποψηφίων στο συγκεκριμένο μάθημα είχε μέση τιμή 12 και τυπική απόκλιση 2 στις προηγούμενες γενικές εξετάσεις και στις τελευταίες αντίστοιχα μέση τιμή 6 και τυπική απόκλιση 3.
 Ο παρακάτω πίνακας παρουσιάζει τις βαθμολογίες των υποψηφίων και αν είχαν διατηρήσει την βαθμολογία τους ή όχι.
ΥΠΟΨΗΦΙΟΣ
ΒΑΘΜΟΣ
ΔΙΑΤΗΡΗΣΗ
ΒΑΘΜΟΛΟΓΙΑΣ
1
11
ΝΑΙ
2
15
ΝΑΙ
3
12
ΝΑΙ
4
9
ΝΑΙ
5
10
ΝΑΙ
6
10
ΟΧΙ
7
6
ΟΧΙ
8
9
ΟΧΙ
9
5
ΟΧΙ
10
8
ΟΧΙ
Α)   Ποιοι από τους υποψηφίους θα εισαχθούν στο Πανεπιστήμιο;
Β)   Πιστεύετε ότι είναι σωστή η εισαγωγή αυτών των υποψηφίων;
Γ)    Υπάρχει άλλη δυνατότητα επιλογής;
ΑΣΚΗΣΗ 9
Ένας επενδυτής είχε επενδύσει σε 20 μετοχές, οι οποίες είχαν τις παρακάτω εκατοστιαίες μεταβολές στη διάρκεια ενός έτους .
 2,0,-5, -10, 14,  50, 5, -3, 4, 4, -18,6,-2, 20,10,0,20,-5, 18,-20
Α)   Να βρεθούν ο μέσος, η διάμεσος, η τυπική απόκλιση, το εύρος, το ενδοτεταρτημοριακό εύρος.
Β)   Να βρεθούν οι τυποποιημένες τιμές.
Γ)    Να γίνει θηκόγραμμα.
ΑΣΚΗΣΗ 10
Δίδονται οι παρακάτω λίστες αριθμών
ΛΙΣΤΑ 1
ΛΙΣΤΑ2
108,00
102,00
227,00
222,00
100,00
102,00
231,00
239,00
102,00
114,00
204,00
203,00
113,00
106,00
210,00
236,00
98,00
106,00
203,00
231,00
101,00
97,00
211,00
234,00
98,00
103,00
235,00
232,00
106,00
103,00
232,00

100,00

222,00

114,00

222,00

Α)   Να υπολογίσετε το μέσο, τη διάμεσο, την επικρατούσα τιμή, την τυπική απόκλιση και το εύρος του δείγματος
Β)   Να υπολογίσετε τους συντελεστές κύρτωσης και ασυμμετρίας
Γ)    Ποια από τις δύο λίστες δεδομένων παρουσιάζει μεγαλύτερη ομοιογένεια;
Δ)   Να σχολιασθούν τα αποτελέσματα.
ΑΣΚΗΣΗ 11
Η παρακάτω λίστα δεδομένων παρουσιάζει το ύψος και το βάρος 22 ατόμων.
ΒΑΡΟΣ
ΥΨΟΣ
ΒΑΡΟΣ
ΥΨΟΣ
70,00
168,00
65,00
144,00
75,00
157,00
82,00
167,00
59,00
168,00
64,00
150,00
80,00
170,00
69,00
156,00
60,00
155,00
89,00
178,00
76,00
169,00
100,00
160,00
70,00
157,00
74,00
178,00
50,00
165,00
86,00
180,00
75,00
156,00
85,00
160,00
77,00
162,00
91,00
173,00
69,00
166,00
79,00
167,00
74,00
167,00
82,00
173,00
80,00
177,00
77,00
170,00
74,00
164,00
80,00
167,00
Α)   Υπάρχει γραμμική συσχέτιση μεταξύ του ύψους και του βάρους;
Β)   Να γίνει κατάλληλο διάγραμμα.

ΒΙΒΛΙΟΓΡΑΦΙΑ

Alreck, P. & Settle R. (1995), Survey Research a Handbook, USA, IRWIN
Burns, R. (2000), Introduction to Research Methods, London, Sage Publications
Cochran W. (1977). Sampling Techniques. John Wiley & Sons, New York
Green, S., Salkind, N., Akey, T. (2000) Using SPSS for Windows. Analyzing and Understanding Data, Second Edition. Practice Hall, USA.
Groves R. M., Dillman D.A., Eltinge J.L.and Little R.J. (2002). Survey Nonresponse.  John Wiley & Sons, New York
Kish L. (1965). Survey Sampling. John Wiley & Sons (edition 1995), New York
McNeill, P. (1990), Research methods (2nd ed.), London, Routledge
Sarndal C., Swensson B.,  Wretman J. and  Wretman J.H. Model Assisted Survey Sampling, Springer Series in Statistics
Αποστολάκης Ι. et al (2003), Στατιστική Επεξεργασία Δεδομένων στην Υγεία, Αθήνα, Παπαζήση
Γναδέλλης, Χ. (2003), Εφαρμοσμένη Στατιστική, Αθήνα, Εκδόσεις Παπαζήση
Darren, G.& Paul, M. (2002), SPSS for Windows Step by Step: A Simple Guide and Reference 11.0 Update, USA, Allyn & Bacon




[1] Στο εξής, η συγκεκριμένη μεταβλητή, για συντομία, θα αναφέρεται με τον όρο «αυτοαξιολόγηση»