six sigma statistics

29
Ενημερωτικό Υλικό Πάρις Μαυροκέφαλος Φυσικός Ιατρικής-Ακτινοφυσικός Τμήμα Ιατρικής Φυσικής ΓΝΑ Ευαγγελισμός Στατιστική και Six Sigma Αρχές Πιθανοτήτων και Στατιστικής

Upload: public-health

Post on 13-Nov-2014

1.192 views

Category:

Documents


6 download

DESCRIPTION

Η αναβάθμιση των λειτουργιών (οργάνωση και λειτουργία) νοσοκομειακών μοναδων περνά μεσα από εφαρμογή μεθόδων Six Sigma

TRANSCRIPT

Page 1: Six Sigma Statistics

Ενημερωτικό Υλικό

Πάρις Μαυροκέφαλος Φυσικός Ιατρικής-Ακτινοφυσικός Τμήμα Ιατρικής Φυσικής ΓΝΑ Ευαγγελισμός

Στατιστική και Six Sigma Αρχές Πιθανοτήτων και Στατιστικής

Page 2: Six Sigma Statistics

2

Table of Contents Αρχές Six Sigma ........................................................................................................................................ 3

1. ΜΕΤΑΒΛΗΤΕΣ - ΠΟΙΟΤΙΚΕΣ ΚΑΙ ΠΟΣΟΤΙΚΕΣ ................................................................................ 3 1.1 Ποιοτικά στοιχεία (κατηγορικές μεταβλητές ή ιδιότητες)................................................................... 3 1.2 Ποσοτικά δεδομένα ............................................................................................................................. 4

2. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ................................................................................................................. 5 2.1 Δεδομένα δείγματος vs Δεδομένα Πληθυσμού ................................................................................... 5 2.2 Παράμετροι και Στατιστικά ................................................................................................................. 5 2.3 Περιγραφικά Στατιστικά Location (κεντρικές μετρήσεις τάσης) ........................................................ 6 2.4 Στατιστική Διασποράς (μετρήσεις μεταβλητότητας) .......................................................................... 6

3. ΚΑΤΑΝΟΜΕΣ ΣΥΧΝΟΤΗΤΩΝ.............................................................................................................. 7 3.1 Μετρήσεις Συχνότητας ........................................................................................................................ 8 3.2 Ιστογράμματα ...................................................................................................................................... 8 3.3 Ιστόγραμμα Discrete............................................................................................................................ 9 3.4 Ιστόγραμμα Συνεχών τιμών ................................................................................................................. 9

4. ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΛΑΘΟΣ ................................................................................................................ 11 4.1 Ιδιότητες πιθανοτήτων ....................................................................................................................... 11 4.2 Λάθη Τύπου I και Τύπου II ............................................................................................................... 12 4.3 Τιμές π και στατιστική σημαντικότητα.............................................................................................. 14

5. ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ.................................................................................................................... 15 5.1 Ιδιότητες μιας κανονικής διανομής.................................................................................................... 15 5.2 Εκτίμηση πιθανοτήτων με τη χρήση της Κανονικής κατανομής ...................................................... 15 5.3 Υπολογισμός ατελειών ανά εκατομμύριο από Κανονική κατανομή ................................................. 16

6. ΓΡΑΜΜΙΚΗ ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ.................................................................................... 19 6.1 Εξίσωση Γενικής Παλινδρόμησης ..................................................................................................... 19 6.2 Εξίσωση Απλής Παλινδρόμησης ....................................................................................................... 19 6.3 Συσχέτιση........................................................................................................................................... 20 6.4 Χρησιμοποίηση Scatter Plots για να παρουσιαστούν οι γραμμικές σχέσεις ................................... 20 6.5 Πολλαπλή γραμμική παλινδρόμηση .................................................................................................. 21

7. ΤΕΧΝΙΚΕΣ ΚΑΙ ΜΕΘΟΔΟΙ .................................................................................................................. 22 7.1 Define, Measure, Analyze, Improve, Control (DMAIC)................................................................... 22 7.2. Ανάλυση Δεδομένων ........................................................................................................................ 23 7.3 .Γραφικά Και ANOVA ...................................................................................................................... 25 7.4 Διαγράμματα Ποιοτικού Ελέγχου...................................................................................................... 26 7.5 Διαγράμματα Σκέδασης και Ανάλυση Συσχετίσεων ......................................................................... 27

Page 3: Six Sigma Statistics

3

Αρχές Six Sigma Όσο μεγαλύτερου επίπεδου είναι η αφοσίωση στις διαδικασίες Six Sigma τόσο καλύτερα αποτελέσματα υπάρχουν. Ένα υπεύθυνος πρέπει να είναι σε θέση να εξηγήσει τα κέρδη από τη εφαρμογή της Six Sigma,. Η 6σ είναι μια επιχειρησιακή στρατηγική που βασίζεται στο κέρδος. Αυτή η στρατηγική πρωτοβουλία βελτιώνει την ποιότητα των αποφάσεων έχει επιπτώσεις σε κάθε διαδικασία του οργανισμού: οικονομική, λειτουργική και κλινική. Όσο τα προγράμματα 6σ βελτιώνουν τα κέρδη, αυξάνουν το μερίδιο αγοράς, μειώνουν τις δαπάνες παραγωγής, ενισχύουν την παραγωγικότητα, δημιουργούν σχεδόν τέλειες διαδικασίες, προϊόντα, και υπηρεσίες. Η επιτυχία μετασχηματίζει τον Νοσοκομειακό πολιτισμό. Η ικανοποίηση των χρηστών των υπηρεσιών του συστήματος, οι πληροφορίες ποιότητας, η ταχύτητα, και οι αδύνατες οργανωτικές δομές εκτιμούνται ιδιαίτερα. Αυτό που έχει αξία μετρείται και διορθώνεται άμα απαιτείται. Οι μετρήσεις γίνονται και καταγράφονται κατά έναν πειθαρχημένο τρόπο. Οι μετρήσεις Six Sigma αναλύονται αυστηρά. Η υπολογιστική ισχύς και κατάλληλο λογισμικό ελαχιστοποιούν, και σε πολλές περιπτώσεις αποβάλλουν, τις ανησυχητικές και προβληματικές υπηρεσίες και εισάγουν καινοτομίες στη χρήση της ποσοτικής ανάλυσης. Ο προσωπικός υπολογιστής ελευθερώνει τους υπαλλήλους, τους ερευνητές , και τους υπεύθυνους των προγράμματος από πολλές ευθύνες. Έξι ερωτήσεις σίγμα μετακινούν τους νοσοκομειακούς πολιτισμούς από το άνετο περιβάλλον τους σε ένα πιο αποδοτικό μέλλον. Η ανάλυση ανταμείβει σοβαρά όταν χρησιμοποιείται στις σημαντικές βελτιώσεις.. Η επιτυχία, , εξαρτάται από τις αλληλεπιδράσεις όλων των ακόλουθων μεταβλητών

1. ΜΕΤΑΒΛΗΤΕΣ - ΠΟΙΟΤΙΚΕΣ ΚΑΙ ΠΟΣΟΤΙΚΕΣ Μια μεταβλητή είναι οποιαδήποτε μετρημένο χαρακτηριστικό ή ιδιότητα που είναι διαφορετική για διαφορετικά αντικείμενα. Παραδείγματος χάριν, εάν το μήκος 30 γραφείων μετρηθεί, τότε μπορούμε να θεωρήσουμε το μήκος σαν μια μεταβλητή. Βασικές απαραίτητες γνώσεις – • Κατανόηση της διαφοράς μεταξύ μιας ποιοτικής (κατηγορικής) μεταβλητής και μιας ποσοτικής μεταβλητής. • Κατανόηση των διάφορων τύπων των ποιοτικών (κατηγορικών) μεταβλητών: Nominal, Ordinal, and Binary. • Κατανόηση της διαφοράς μεταξύ discrete και συνεχούς ποσοτικής μεταβλητής.

1.1 Ποιοτικά στοιχεία (κατηγορικές μεταβλητές ή ιδιότητες) Τα ποιοτικά δεδομένα περιλαμβάνουν τα μη αριθμητικά στοιχεία σε ομάδες ή κατηγορίες. Τα ποιοτικά δεδομένα επίσης αναφέρονται ως κατηγορικά δεδομένα. Το ποιοτικό χαρακτηριστικό ή ομάδα ταξινόμησης ενός στοιχείου είναι μια ιδιότητα. Μερικά παραδείγματα των ποιοτικών στοιχείων είναι: • Η επέμβαση έγινε έγκαιρα. • Κατηγορική μεταβλητή: Αποτέλεσμα Επέμβασης • Ιδιότητες: Έγκαιρη, Όχι Έγκαιρη

Page 4: Six Sigma Statistics

4

• Τα αποτελέσματα της έρευνας περιλαμβάνουν: ∆ιαφωνώ -Αδιαφορώ-Συμφωνώ. • Κατηγορική μεταβλητή: Απάντηση Έρευνας • Ιδιότητες: ∆ιαφωνώ -Αδιαφορώ-Συμφωνώ. • Η εργαστηριακή απάντηση περιλαμβάνει φυσιολογικές, μεγάλες και μικρές τιμές. • Κατηγορική μεταβλητή: Αποτέλεσμα εξέτασης • Ιδιότητες: φυσιολογικές, μεγάλες και μικρές τιμές. Στις κατηγορικές μεταβλητές ορίζονται συνήθως οι ιδιότητες με τη χρησιμοποίηση μιας Nominal, Ordinal, ή Binary κλίμακας • Οι μεταβλητές Nominal είναι κατηγορικές μεταβλητές που έχουν τρία ή περισσότερα πιθανά επίπεδα χωρίς φυσική διάταξη. Η περιοχή του Νοσοκομείου θα θεωρείτο ονομαστική μεταβλητή. Πάλι, σε μια κλίμακα Nominal, καμία ποσοτική πληροφορία δεν μεταβιβάζεται και καμία διάταξη των στοιχείων δεν είναι υπονοείται. Αλλά παραδείγματα κλιμάκων Nominal περιλαμβάνουν τη Επεμβατική κατάσταση, τη δυνατότητα εξετάσεως, και την Νοσοκομειακή λειτουργία. • Οι μεταβλητές Ordinal είναι κατηγορικές μεταβλητές που έχουν τρία ή περισσότερο πιθανά επίπεδα με φυσική διάταξη, όπως πλήρη ικανοποίηση, ικανοποίηση, μη ικανοποίηση. Τα στοιχεία Ordinal, οι ποιοτικοί αναλυτές τα μετατρέπουν συχνά σε μια ποσοτική κλίμακα. Παραδείγματος χάριν, μια έρευνα μπορεί να ορίσει μια κλίμακα από 1-5 για να καλύψει τη σειρά από πλήρη μέχρι καθόλου ικανοποίηση. Κατά τη μετατροπή μια Ordinal κατηγορική μεταβλητή σε μια ποσοτική κλίμακα, ένας αναλυτής ποιότητας πρέπει να προσέξει κατά την ερμηνεία της διαφοράς μεταξύ των τιμών. Παραδείγματος χάριν, η διαφορά μεταξύ των απαντήσεων ικανοποίηση (1) και μη ικανοποίηση (2) μπορεί να μην είναι ίση με τη διαφορά μεταξύ μη ικανοποίησης (2) και αδιαφορίας (3) • Οι μεταβλητές είναι κατηγορικές μεταβλητές που έχουν δύο πιθανά επίπεδα (π.χ., ναι/όχι). Οι δυαδικές μεταβλητές είναι ο πιο κοινός τύπος κατηγορικών μεταβλητών επειδή είναι οι ευκολότερες να μετατραπούν σε μια ποσοτική κλίμακα. Οι μεταβλητές Binary συνήθως ορίζονται σαν 0 (π.χ., ελαττωματικός) ή 1 (π.χ., μη ελαττωματικός). Αυτή η χρήση των τιμών 0/1 επιτρέπει στα πειράματα να χρησιμοποιηθούν αναλογίες ή μετρήσεις για την ανάλυση στοιχείων. Κατά γενικό κανόνα, σα επιθυμητή έκβαση ορίζεται το 1

1.2 Ποσοτικά δεδομένα Ποσοτικά δεδομένα; αποτέλεσμα μετρήσεων ή την αριθμητικών υπολογισμών. Αυτές οι μετρήσεις παράγουν discrete ή συνεχείς μεταβλητές. Οι μεταβλητές discrete διαφέρουν μεταξύ τους μόνο κατά ακέραιες μονάδες όπως ο αριθμός ασθενών σε μια κλινική (μεταβλητή: μέγεθος κλινικής). Οι συνεχείς μεταβλητές διαφέρουν σε βαθμό και τάξη μεγέθους, και περιορίζονται μόνο από την ακρίβεια του συστήματος μέτρησης. Μερικά παραδείγματα περιλαμβάνουν το πλάτος ενός διαγνωστικού μηχανήματος, το χρόνο ολοκλήρωσης μια εξέτασης, ή την τιμή μιας εξέτασης (μεταβλητές: μήκος, χρόνος, και τιμή εξέτασης). Στην περίπτωση της μέτρησης του πλάτους ενός μηχανήματος, η μέτρηση θα μπορούσε να είναι 1,64

Page 5: Six Sigma Statistics

5

μ, ή 1.641 μ, ή 1.6409, ή 1.64087.. Εδώ, η παρατηρηθείσα μέτρηση περιορίζεται μόνο από την ακρίβεια του οργάνου μέτρησης Μερικά πρόσθετα παραδείγματα συνεχών ποσοτικών μετρήσεων είναι: • Ο χρόνος ραντεβού εξέτασης είναι 4 ημέρες. • Η διάμετρος της φυγοκέντρου είναι 83,1 χιλ. Στη μετατροπή μιας κατηγορικής μεταβλητής σε ποσοτική η μεταβλητή αντιμετωπίζεται συνήθως ως μεταβλητή discrete. Παραδείγματος χάριν, μια κλίμακα εκτίμησης από 1 έως 5 ή μια δυαδική κλίμακα 0 ή 1 θα αναλυόταν ως μεταβλητή discrete. Στον υπολογισμό ενός στατιστικού μεγέθους για μια μεταβλητή discrete όπως η μέση απάντηση μιας έρευνας, η στατιστική (π.χ., ο μέσος όρος) θεωρείται συνεχής. Έτσι, ο μέσος όρος για μια σειρά 5-σημείων μπορεί να είναι 3,72 ακόμα κι αν αυτή η ιδιαίτερη τιμή δεν είναι δυνατό να ληφθεί. Για λόγους ανάλυσης, οι μεταβλητές discrete συχνά προσεγγίζονται με τη χρησιμοποίηση συνεχών κατανομών. Παραδείγματος χάριν, υποθέστε τα αποτελέσματα ελέγχου απαντήσεων είναι discrete και εκτείνονται από 0 έως 100 βαθμούς. Εδώ, ας υποθέσουμε ότι η κατανομή των αποτελεσμάτων του ελέγχου ακολουθεί μια κανονική κατανομή (συνεχή) προκειμένου να υπολογιστεί η πιθανότητα οι απαντωντες να επιτύχουν τιμές μεγαλύτερες από 70, Γενικά, οι αναλυτές προσπαθούν να μετατρέψουν όλα τα στοιχεία σε μια περίπου συνεχή, αριθμητική κλίμακα για τη διατύπωση συμπερασμάτων ή εκτιμήσεων.

2. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Οι περιγραφικές στατιστικές χρησιμοποιούνται για να συνοψίσουν τα χαρακτηριστικά ενός συνόλου στοιχείων. Βασικές απαραίτητες γνώσεις • Κατανόηση της διαφοράς μεταξύ δείγματος και πληθυσμού. • Κατανόηση της διαφοράς μεταξύ παραμέτρου και στατιστικής. • Υπολογισμός της μέσης τιμής, median, σταθερής απόκλισης, variance και του εύρους ενός συνόλου στοιχείων δειγμάτων

2.1 Δεδομένα δείγματος vs Δεδομένα Πληθυσμού Ένα σύνολο στοιχείων ενός πληθυσμού περιλαμβάνει όλα τα στοιχεία του συνόλου, όπως το BMI κάθε ασθενή ενδοκρινολογικής κλινικής, ή το GFR ασθενών Νεφρολογικής κλινικής που ένα εργαστήρι μπορεί να δώσει. Εάν οι επιθυμητές πληροφορίες είναι διαθέσιμες για όλα τα στοιχεία του πληθυσμού, έχουμε μια ιατρική απογραφή. Στην πράξη, έχουμε σπάνια ένα πλήρες σύνολο στοιχείων. Συλλέγουμε συνήθως τα στοιχεία από δείγματα, όπως ασθενών που έχουν νοσηλευτεί σε συγκεκριμένη κλινική.

2.2 Παράμετροι και Στατιστικά Οι αριθμοί που χρησιμοποιούνται για να περιγράψουν ένα σύνολο στοιχείων δειγμάτων καλούνται στατιστικά. Ένα στατιστικό μπορεί να χρησιμοποιηθεί για να υπολογίσει μια παράμετρο ενός πληθυσμού όπως ο μέσος όρος ενός συνόλου στοιχείων (m ή Χ) και παρέχει μια εκτίμηση της μέσης τιμής του πληθυσμού μ.

Page 6: Six Sigma Statistics

Η διαφορά μεταξύ ενός στατιστικού και μιας παραμέτρου είναι πολύ σημαντική να καταλάβουμε επειδή στην ανάλυση στατιστικών στοιχείων αντλούμε συχνά συμπεράσματα για έναν πληθυσμό βασιζόμενοι σε στατιστικά δειγμάτων. ∆εδομένου ότι σπάνια γνωρίζουμε κάθε παρατήρηση σε έναν πληθυσμό, οποιαδήποτε συμπεράσματα ή εκτιμήσεις που γίνονται βασιζόμενοι στις στατιστικές δειγμάτων υπόκεινται σε λάθη. Εντούτοις, συνήθως δεχόμαστε κάποιο περιθώριο του λάθους και δεν αναλαμβάνουμε το κόστος κάθε παρατήρησης.

2.3 Περιγραφικά Στατιστικά Location (κεντρικές μετρήσεις τάσης) Mean (επίσης γνωστός σαν μέσος όρος) είναι ένα μέτρο του κέντρου μιας κατανομής

Το X επίσης αναφέρεται σαν Mean Η μέση τιμή ενός δείγματος παρίσταται από το γράμμα Χ . Το γράμμα μ χρησιμοποιείται για να αντιπροσωπεύσει το μέσο όρο ενός πληθυσμού. Οι όροι, m) η x) , αντιπροσωπεύουν τις εκτιμήσεις ενός πληθυσμού. Παράδειγμα: υποθέστε ότι πέντε ασθενείς κάνουν μια εξέταση και τα αποτελέσματά τους είναι 70 ..68, 71.69 και 98, Mean = (70+68+71+69+98)/5 = 75.2 Σημείωση: ο μέσος όρος μπορεί να επηρεαστεί σημαντικά από τις ακραίες τιμές. Εάν αποκλείσαμε τον ασθενή εκείνο ο οποίος είχε πάρει αποτέλεσμα 98, ο μέσος όρος θα άλλαζε σε 69.5. Median (διάμεσος): επίσης γνωστή σαν 50στο εκατοστημόριο, είναι η μέση παρατήρηση σε ένα σύνολο στοιχείων. Για να καθορίσουμε τη διάμεσο, ταξινομούμε το σύνολο των στοιχείων και επιλέγουμε έπειτα τη μεσαία (middle) τιμή. Εάν το σύνολο των στοιχείων περιέχει μονό αριθμό παρατηρήσεων, τότε η τιμή της διάμεσου είναι η παρατήρηση αριθμός [ ν + 1 ]/2. Εάν το σύνολο στοιχείων περιέχει έναν ζυγό αριθμό παρατηρήσεων, η τιμή της διάμεσου μέση αξία υπολογίζεται από την μέση τιμή των παρατηρήσεων N/2 και [N/2 + 1]. Στο ανωτέρω παράδειγμα, το στοιχείο ταξινομήθηκαν ως εξής : 68 ..69 ..70 ..71, και 98. Εδώ, η διάμεσος είναι 70. Εάν συμπεριλαμβανόταν ακόμα ένας άλλος ασθενής με ένα αποτέλεσμα εξετάσεως 60, η νέα διάμεσος τιμή είναι 69,5 (69 + 70/2). Η διάμεσος χρησιμοποιείται συνήθως όταν τα δεδομένα περιέχουν μεγάλες ακραίες τιμές (outliers) ή είναι μετατοπισμένα προς την μια πλευρά λοξή (skewed) π.χ., όταν μια από τις πλευρές καμπύλης με σχήμα καμπάνας είναι σημαντικά μακρύτερη από την άλλη. Στο ανωτέρω παράδειγμα των αποτελεσμάτων εξετάσεως ασθενών η διάμεσος παρέχει μια καλύτερη αντιπροσώπευση του κέντρου της κατανομής δεδομένου ότι η απάντηση με τιμή 98 αντιστοιχεί σε μεγάλη ακραία αξία.

2.4 Στατιστική Διασποράς (μετρήσεις μεταβλητότητας) Η σταθερή απόκλιση (StDev) μετρά τη διασπορά των μεμονωμένων παρατηρήσεων από το μέσο όρο. Σε ένα δειγματοληπτικό σύνολο στοιχείων, η σταθερή απόκλιση αναφέρεται επίσης ως σταθερή απόκλιση δείγματος ή μέση τετραγωνική τιμή sRMS και μπορεί να υπολογιστεί με τη χρησιμοποίηση του ακόλουθου τύπου 6

Page 7: Six Sigma Statistics

i

Σημείωση: για να υπολογίσουμε τη σταθερή απόκλιση ενός πληθυσμού, χρησιμοποιούμε τη μέση τιμή του πληθυσμού και διαιρούμε με το n αντί n-1. Στην πράξη, η σταθερή απόκλιση ενός πληθυσμού χρησιμοποιείται σπάνια επειδή ο αληθινός πληθυσμός σημαίνει ότι είναι συνήθως άγνωστος. Η χρήση της σταθερής απόκλισης δείγματος είναι ιδιαίτερα σημαντική για τα μικρότερα μεγέθη δειγμάτων. Εντούτοις, καθώς το μέγεθος δειγμάτων γίνεται μεγαλύτερο (n > 100), η διαφορά μεταξύ της διαίρεσης με το n και n-1 μπορεί να γίνει αμελητέα. Η χαρακτηριστική παράσταση που χρησιμοποιείται για να αντιπροσωπεύσει τη σταθερή απόκλιση δειγμάτων είναι το s. Το ελληνικό γράμμα σ χρησιμοποιείται για να αντιπροσωπεύσει τη σταθερή απόκλιση του πληθυσμού. Οι όροι, s ή s , αντιπροσωπεύουν την εκτίμηση της σταθερής απόκλισης πληθυσμών. Στο παράδειγμα με τα πέντε αποτελέσματα ελέγχου ασθενών (70 ..68 ..71 ..69 και 98), η σταθερή απόκλιση του δείγματος είναι 12.79. όπως με τη μέση τιμή η σταθερή απόκλιση μπορεί να επηρεαστεί πολύ από τις ακραίες τιμές. Εάν αποκλείουμε τον ασθενή εκείνο που έδωσε απάντηση 98, η σταθερή απόκλιση δειγμάτων θα μειωνόταν κατά 1,3! Η Variance χρησιμοποιείται μερικές φορές για να αντιπροσωπεύσει τη διασπορά. Η είναι απλά η σταθερή απόκλιση τετραγωνισμένη. Η Variance αντιπροσωπεύει τη μέση τετραγωνισμένη απόκλιση από το μέσο όρο

Επάνω παράδειγμα: Variance = (12,79)2 = 163.72 Σημείωση: η Variance χρησιμοποιείται συχνά λόγω της προσθετικής της ιδιότητας. Εάν διάφοροι ανεξάρτητοι παράγοντες συμβάλλουν στη γενική variance, τότε η συνολική διαφορά μπορεί να προσδιοριστεί με την προσθήκη variance μεμονωμένων παραγόντων (με την υπόθεση ανεξάρτητων παραγόντων). Σημείωση: δεν προσθέτουμε τις σταθερές αποκλίσεις! Εύρος τιμών (Range) είναι ένα άλλο μέτρο μέτρησης της διασποράς. Το εύρος τιμών είναι απλά η μέγιστη τιμή σε ένα σύνολο δεδομένων μείον η ελάχιστη. Στο ανωτέρω παράδειγμα, το εύρος τιμών των δεδομένων (70 ..68 ..71 ..69 και 98) είναι (98 - 68 = 30). Σημείωση: το εύρος τιμών προτιμάται ενίοτε από τη σταθερή απόκλιση για να παρουσιάσει τη διασπορά στα μικρά σύνολα στοιχείων (π.χ., # δείγματος < 10)

3. ΚΑΤΑΝΟΜΕΣ ΣΥΧΝΟΤΗΤΩΝ Η συχνότητα χρησιμοποιείται για να περιγράψει τον αριθμό εμφανίσεως ή ενός εύρους τιμών σε ένα σύνολο δεδομένων. Οι αθροιστικές συχνότητες χρησιμοποιούνται για να περιγράψουν τον αριθμό παρατηρήσεων λιγότερο από, ή μεγαλύτερος από μια συγκεκριμένη τιμή. Βασικές απαραίτητες γνώσεις – • Κατανόηση της διαφοράς μεταξύ απόλυτων, σχετικών και αθροιστικών συχνοτήτων.

7

Page 8: Six Sigma Statistics

8

• ∆ημιουργία ενός πίνακα συχνοτήτων. • ∆ημιουργία ενός ιστογράμματος.

3.1 Μετρήσεις Συχνότητας Η απόλυτη συχνότητα είναι ο αριθμός εμφάνισης μιας τιμής ή σειράς τιμών σε ένα σύνολο στοιχείων. Η σχετική συχνότητα βρίσκεται με τη διαίρεση της απόλυτης συχνότητας με το συνολικό αριθμό παρατηρήσεων (n). Η αθροιστική συχνότητα είναι τα διαδοχικά αθροίσματα των απόλυτων συχνοτήτων. Η αθροιστική σχετική συχνότητα είναι το διαδοχικό άθροισμα των αθροιστικών συχνοτήτων που διαιρείται με το συνολικό αριθμό παρατηρήσεων. Για να δειχθούν οι διαφορές μεταξύ αυτών των όρων, ας θεωρήσουμε ότι τα αποτελέσματα της ρίψης ενός ζαριού χωρίζουν σε τετράγωνα. Οι πιθανοί συνδυασμοί και τα αθροίσματα τους παρουσιάζονται στον ακόλουθο πίνακα συχνότητας. Τέσσερις μετρήσεις συχνότητας παρουσιάζονται: απόλυτη συχνότητα, αθροιστική συχνότητα, σχετική συχνότητα, και αθροιστική σχετική συχνότητα. Frequency Table Συνδυασμός Άθροισμα Απόλυτος

Συχνότητα Αθροιστική Συχνότητα

Σχετική Συχνότητα

Αθροιστική Σχετική Συχνότητα

(1,1) 2 1 1 0.03 0.03 (1,2) (2,1) 3 2 3 0.06 0.08 (1,3) (3,1) (2,2) 4 3 6 0.08 0.17 (1,4) (4,1) (2,3) (3,2) 5 4 10 0.11 0.28 (1,5) (5,1) (2,4) (4,2) (3,3) 6 5 15 0.14 0.42 (1,6) (6,1) (2,5) (5,2) (3,4) (4,3) 7 6 21 0.17 0.58 (2,6) (6,2) (3,5) (5,3) (4,4) 8 5 26 0.14 0.72 (3,6) (6,3) (4,5) (5,4) 9 4 30 0.11 0.83 (4,6) (6,4) (5,5) 10 3 33 0.08 0.92 (5,6) (6,5) 11 2 35 0.06 0.97 (6,6) 12 1 36 0.03 1.00 Total 36

3.2 Ιστογράμματα Τα ιστογράμματα επίσης χρησιμοποιούνται για να παρουσιάσουν γραφικά μια κατανομή. Μερικές συνηθισμένες μορφές είναι σε σχήμα καμπάνας (δηλ., κανονική), εκθετικές ή επεκταμένες (skewed). Οι επεκταμένες διανομές είναι παρόμοιες με τις κανονικές διανομές μόνο που η μια πλευρά της είναι σημαντικά μεγαλύτερη από άλλη. Παραδείγματος χάριν, μια κατανομή επεκταμένη προς τα δεξιά έχει ένα βασικό σχήμα καμπάνας με μια μακρύτερη πλευρά στα δεξιά (από τα αριστερά). Τα σχήματα κατωτέρω παρουσιάζουν κάθε μια από αυτές τις μορφές.

Page 9: Six Sigma Statistics

Normal

Freq

uenc

y

1514131211

3,0

2,5

2,0

1,5

1,0

0,5

0,0

Histogram of Normal

Skewd Left

Freq

uenc

y

201816141210

6

5

4

3

2

1

0

Histogram of Skewd Left

Exponential

Freq

uenc

y

14131211109

7

6

5

4

3

2

1

0

Histogram of Exponential

Μερικές μορφές ιστογραμμάτων Σε ένα ιστόγραμμα, κάθε στήλη αντιπροσωπεύει την απόλυτη συχνότητα ή τη σχετική συχνότητα για έναν συγκείμενο συνδυασμό ή περιστατικά ενός συνόλου δεδομένων μιας μεταβλητής. Τα ιστογράμματα μπορούν να χρησιμοποιηθούν τόσο για discrete όσο και για συνεχείς μεταβλητές.

3.3 Ιστόγραμμα Discrete Παράδειγμα: Πιθανοί συνδυασμοί των αθροισμάτων ενός ζεύγους ζαριών Ιστόγραμμα

Áèñï éóì á Ôéì ù í

Freq

uenc

y

121110987654321

6

5

4

3

2

1

0

Histogram of Áèñï éóì á Ôéì ù í

3.4 Ιστόγραμμα Συνεχών τιμών Για να δείξουμε ένα ιστόγραμμα συνεχών δεδομένων, ας υποθέσουμε ότι λαμβάνουμε το ακόλουθο σύνολο δεδομένων με τη μέτρηση της διαμέτρου 100 ακτινογραφικών φιλμ. Κατ' αρχάς, τακτοποιήστε τα στοιχεία στις σειρές συχνότητας ή κελιά ίσου πλάτους. Η επιλογή του αριθμού και του πλάτους των κελιών (φάσματα συχνότητας) εξαρτάται από τον αναλυτή. Για τα συνεχή στοιχεία, μια γενική εμπειρική μέθοδος είναι να τεθεί ο αριθμός των κελιών ίσος με την

9

Page 10: Six Sigma Statistics

10

τετραγωνική ρίζα του αριθμού των δειγμάτων (στρογγυλοποιημένος στον κοντινότερο ακέραιο στον αριθμό). Για να πάρουμε το πλάτος των κελιών, ας διαιρέσουμε το εύρος του συνόλου των στοιχείων με τον αριθμό των κελιών (στρογγυλοποιημένος στην επιθυμητή ακρίβεια των στοιχείων μέτρησης). Αυτό το παράδειγμα έχει 100 δείγματα και μια σειρά 02, 3. Κατά συνέπεια, ένας αναλυτής να δημιουργήσει 10 κελιά (= sqrt(100)) του πλάτους 0,2 χιλ. (0 2,3/10 = 0,2). Σε αυτό το παράδειγμα, η τιμή 253,4 επιλέχτηκε ως αφετηρία επειδή σχετικά λίγες τιμές ευρίσκονται κάτω από αυτήν

253,60 253,40 253,90 254,50 253,70253,60 254,00 253,50 253,60 253,70254,00 254,10 254,10 253,50 253,80253,90 253,90 253,70 254,40 254,20254,00 253,60 253,70 253,90 253,90254,00 253,80 253,30 253,60 254,30254,20 254,10 254,10 253,70 254,00254,70 254,10 253,20 254,60 254,00253,90 254,20 254,10 254,20 253,50254,20 254,10 254,20 254,10 254,60254,00 254,00 254,30 253,60 254,10254,40 254,60 254,10 253,70 253,60253,80 255,00 253,80 254,00 254,00254,00 253,90 253,60 253,60 254,40253,80 253,80 253,90 254,00 253,50254,10 253,40 253,90 254,00 253,40255,50 254,30 254,20 254,10 253,90254,00 253,60 254,20 254,10 254,50254,50 253,90 254,00 253,60 254,10253,50 254,30 254,00 253,80 253,80

Εύρος Κελιού Απόλυτη

Συχνότητα Αθροιστική Συχνότητα

<= 253,4 3 3 253,4 < X <= 253,6 13 16 253,6 < X <= 253,8 14 30 253,8 < X <= 254,0 24 54 254,0 < X <= 254,2 27 81 254,2 < X <= 254,4 6 87 254,4 < X <= 254,6 9 96 254,6 < X <= 254,8 2 98 254,8 < X <= 255,0 1 99 X > 255,0 1 100

Page 11: Six Sigma Statistics

Histogram

0

5

10

15

20

25

30

253,34 253,6 253,8 154 254,2 254,4 254,6 254,8 255 more

Bin

Freq

uenc

y

Frequency

Ερμηνεία ενός ιστογράμματος συνεχών δεδομένων–οι απόλυτες συχνότητες σε ένα ιστόγραμμα συνεχών δεδομένων αντιπροσωπεύουν τον αριθμό παρατηρήσεων που εμπίπτουν σε κάποιο εύρος. Στη γραφική παράσταση ποιο πάνω, η πρώτη στήλη (ονομάζεται 253,4) αντιπροσωπεύουν τον αριθμό παρατηρήσεων μικρότερο ή ίσο από 253,4. Η δεύτερη στήλη (ονομάζεται 253,6) αντιπροσωπεύει τον αριθμό των παρατηρήσεων μεγαλύτερων από 253,4 και μικρότερο ή ίσο από 253, 6. Η τρίτη στήλη είναι ο αριθμός παρατηρήσεων μεγαλύτερων από 253,6 και λιγότερο ή ίσο προς 253, 8.

4. ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΛΑΘΟΣ Η πιθανότητα περιγράφει τoν βαθμό με τον οποίο εκτιμούμε ότι ένα γεγονός θα εμφανιστεί. Ένα γεγονός μπορεί να αντιπροσωπεύσει ένα αποτέλεσμα, μια έκβαση όπως η πιθανότητα να εμφανιστεί το τέσσερα όταν ρίχνουμε ένα ζάρι, ή θα μπορούσε να αντιπροσωπεύσει μια πρόταση ή μια απόφαση από μια ανάλυση, όπως δύο διαφορετικά αποτελέσματα εργαστηριακών εξετάσεων. Σε αυτήν την περίπτωση, η πιθανότητα χρησιμοποιείται για να μας δώσει την εμπιστοσύνη ή τον κίνδυνο από το αποτέλεσμα ή το συγκεκριμένο συμπέρασμα. Βασικές απαραίτητες γνώσεις • Κατανόηση της διαφοράς μεταξύ της a priori πιθανότητας και εμπειρικής πιθανότητας. • Κατανόηση των βασικών εννοιών και κανόνων πιθανότητας. • Κατανόηση των λαθών τύπου Ι και τύπου ΙΙ.

4.1 Ιδιότητες πιθανοτήτων Η πιθανότητα περιγράφει την εμφάνιση ενός γεγονότος. Οι πιθανότητες εκφράζονται ως τιμές μεταξύ 0 και 1 όπου 0 είναι η μηδενική πιθανότητα και 1 είναι βεβαιότητα. Κατά την αξιολόγηση των πιθανοτήτων, το γεγονός μπορεί να είναι είτε επιθυμητό είτε όχι. Παραδείγματος χάριν, μπορεί να ενδιαφερόμαστε για την πιθανότητα ένα μέρος τιμών, μετρούμενο τυχαία, να ευρίσκεται μέσα στα όρια κάποιων προδιαγραφών. Μέθοδοι που χρησιμοποιούνται στον υπολογισμό της πιθανότητας

11

Page 12: Six Sigma Statistics

12

• A Priori πιθανότητα –μπορεί να δημιουργούνται πριν την συλλογή των στοιχείων. (Συχνά χρησιμοποιείται όταν τα στοιχεία είναι discrete και τα πιθανά αποτελέσματα είναι πεπερασμένα, όπως στα τυχερά παιχνίδια.) • Η εμπειρική πιθανότητα – υπολογίζεται από ένα σύνολο στοιχείων του δείγματος. (Συχνά χρησιμοποιείται στις βιομηχανικές και πειραματικές καταστάσεις όπου τα δεδομένα είναι συνεχή και την υπάρχουσα φύση των γεγονότων είναι άγνωστη.) Η α priori πιθανότητα μπορεί να ληφθεί εάν όλες τα πιθανά γεγονότα και αποτελέσματα μπορούν να απαριθμηθούν ή να περιγραφούν από μαθηματική άποψη. Η a priori πιθανότητα μπορεί να προσδιοριστεί με τη χρησιμοποίηση του ακόλουθου τύπου: P = E / N Όπου: P = πιθανότητα E = αριθμός περιπτώσεων στο οποίο ένα επιθυμητό γεγονός εμφανίζεται N = συνολικός αριθμός πιθανών περιπτώσεων. Στο παράδειγμα των ζαριών σε προηγούμενο τμήμα, η πιθανότητα κάποιος να φέρει επτά στα ζαριά είναι P = 6 / 36 = 0.17 (Note: (1,6) (6,1) (2,5) (5,2) (3,4) (4,3). είναι έξι από τριάντα - έξι πιθανούς συνδυασμούς των οποίων το άθροισμα είναι ίσο με επτά.) Ομοίως, η πιθανότητα κάποιος να φέρει επτά ή λιγότερο με τη χρησιμοποίηση ενός ζευγαριού ζαριών είναι: P = 21 /36 =0.58 Empirical Probability– Στις περισσότερες περιπτώσεις, είτε ο αριθμός εμφανίσεων των γεγονότων είτε ο συνολικός αριθμός των πιθανών αποτελεσμάτων είναι άγνωστος. Παραδείγματος χάριν, εάν τα δεδομένα επιλέγονται από μια συνεχή κατανομή όπως η μέτρηση του ύψους των ασθενών, τόσο ο πιθανός αριθμός των περιστατικών για κάθε ύψος όσο και ο συνολικός αριθμός των πιθανών αποτελεσμάτων είναι άγνωστος. Εδώ, η πιθανότητα ενός γεγονότος, όπως η πιθανότητα ένας ασθενής να είναι πιο ψηλός από 155 εκατοστά πρέπει να δημιουργείται εμπειρικά βασιζόμενοι στη δειγματοληψία. Μια κοινή μέθοδος για τον εμπειρική εκτίμηση των πιθανοτήτων είναι η συλλογή στοιχείων του δείγματος και σύγκριση τους με στατιστικές κατανομές. Αφού υπολογισθεί η στατιστική κατανομή, η πιθανότητα εμφάνισης ενός γεγονότος μπορεί να υπολογισθεί με τη χρησιμοποίηση των εκτιμήσεων των παραμέτρων της κατανομής. Η ευρύτατα χρησιμοποιούμενη κατανομή στον υπολογισμό πιθανοτήτων είναι η κανονική κατανομή.

4.2 Λάθη Τύπου I και Τύπου II Η πιθανότητα χρησιμοποιείται συχνά για να μας δώσει το βαθμό εμπιστοσύνης ή να αξιολογήσει τον κίνδυνο κατά δημιουργία μιας απόφασης ή μιας σύστασης αποτέλεσμα στατιστικής ανάλυσης. Παραδείγματος χάριν, ένα νοσοκομείο μπορεί να αποφασίσει να ελέγχει όλες τις εργαστηριακές-αιματολογικές εξετάσεις του εάν παρουσιάζουν ατέλειες παίρνοντας ένα τυχαίο δείγμα δέκα ολοκληρωμένων απαντήσεων. Ή, μπορούν να αποφασίσουν να επανεξετάσουν την απόδοση και τη λειτουργία ενός διαγνωστικού ακτινολογικού μηχανήματος έπειτα από μια δειγματοληψία των απαντήσεων σε διάφορες ακτινολογικές συσκευές ελέγχοντας τυχόν διάφορες από το μέσο όρο.

Page 13: Six Sigma Statistics

13

Κατά την εκτέλεση μιας στατιστικής ανάλυσης, ένας πειραματιζόμενος με κάποια διαδικασία πρέπει να αρχίσει με κάποια αξίωση ή μια στατιστική υπόθεση. Αυτή η αξίωση ή υπόθεση είναι αυτό που υποθέτει ότι είναι αληθινό. Κατά την αξιολόγηση της αξίωσης, τέσσερις πιθανά αποτελέσματα ή συμπεράσματα μπορεί να εξαχθούν: α. Συμπέρασμα ότι η αξίωση είναι αληθινή, όταν αυτή είναι πραγματικά αληθινή β. Συμπέρασμα ότι η αξίωση είναι ψεύτική, όταν αυτή είναι πραγματικά αληθινή. γ. Συμπέρασμα ότι η αξίωση είναι αληθινή, όταν αυτή είναι πραγματικά ψεύτικη. ∆. Συμπέρασμα ότι η αξίωση είναι ψεύτική, όταν αυτή είναι πραγματικά ψεύτικη. Από τα ανωτέρω αποτελέσματα, δύο από αυτά ( β και γ) είναι λανθασμένη. Αυτά τα λάθη αναφέρονται ως λάθη τύπου Ι (άλφα) ή τύπου ΙΙ (τα βήτα) • Το λάθος τύπου Ι (άλφα λάθος) – εμφανίζεται όταν συμπεραίνει κάποιος ότι κάτι δεν είναι αληθινό (π.χ., για παράδειγμα διαφορετικό) όταν στην πραγματικότητα είναι αληθινό (αλήθεια = μη διαφορετικός). Παραδείγματος χάριν, ένας λάθος τύπου Ι μπορεί να εμφανιστεί εάν τα ιδιαίτερα στοιχεία που επιλέχτηκαν δεν είναι αντιπροσωπευτικά της κατανομής ( πχ δεν μετρήθηκαν σωστά). Εδώ, μια ανάλυση μπορεί να απαιτηθεί για να ρυθμιστούν οι παράμετροι τάσης σε μηχανήματα πυρηνικής ιατρικής (γ-κάμερα) για να διορθωθεί κάποιο πρόβλημα απεικόνισης όταν στην πραγματικότητα η γ-κάμερα λειτουργεί καλά . • Το λάθος τύπου ΙΙ (κίνδυνος βήτα) – εμφανίζεται όταν συμπεραίνει κάποιος ότι κάτι είναι αληθινό (π.χ., για παράδειγμα μη διαφορετικό) όταν στην πραγματικότητα είναι ψεύτικο (δηλ., διαφορετικό). Ένας κλινικός έλεγχος ασθενών προσφέρει μια καλή αναλογία για τη σύγκριση των λαθών τύπων Ι και ΙΙ. Σε ένα κλινικό έλεγχο ασθενών, τέσσερις πιθανά αποτελέσματα μπορούν να εμφανιστούν: ένα υγιής μπορεί να διαγνωστεί υγιής, ένας υγιής μπορεί να διαγνωστεί ασθενής, ένα ασθενής μπορεί να διαγνωστεί υγιής, και ένας ασθενής μπορεί να διαγνωστεί ασθενής. Αυτά τα αποτελέσματα και οι σχετικοί στατιστικοί όροι τους παρουσιάζονται κατωτέρω.

Αληθές

(Υγιής) (Αληθές η μη διαφορετικό)

(Ασθενής) (Ψευδές η διαφορετικό different)

(Υγιής) (Αληθές η μη διαφορετικό)

Σωστό συμπέρασμα (1 – α)

Λάθος Type II (beta risk– β)

Υπόθεση ή συμπέρασμα

(Ασθενής) (Ψευδές η διαφορετικό different)

Λάθος Type I (alpha – α)

Σωστό συμπέρασμα (1 – β = Ισχύς)

Page 14: Six Sigma Statistics

14

Η πιθανότητα να κάνουμε λάθος τύπου Ι ελέγχεται με την καθιέρωση ενός κατώτατου ορίου πιθανότητας γνωστού ως λάθος άλφα. Μερικά χαρακτηριστικά επίπεδα άλφα είναι 0,05 ή 0,01. Εδώ, η εμπιστοσύνη στη λήψη σωστής απόφασης είναι 1–άλφα. Για αυτές τις τιμές άλφα, μπορούμε να θελήσουμε να είμαστε 95% ή 99% σίγουροι στην απόφασή μας. Με άλλα λόγια, μπορούμε να θελήσουμε να είμαστε τουλάχιστον 95% βέβαιοι ότι εάν δεχόμαστε μια αξίωση σαν αληθινή, ότι είναι πράγματι αληθινή. Η πιθανότητα της να κάνουμε ένα λάθος τύπου ΙΙ ελέγχεται συνήθως από την επιλογή ενός κατάλληλου μεγέθους δείγματος. Γενικά, όσο μεγαλύτερο το μέγεθος του δείγματος, τόσο μεγαλύτερη είναι η δυνατότητα να ανιχνευθεί μια διαφορά. Κατά συνέπεια, το αυξανόμενο μέγεθος δείγματος οδηγεί σε μεγαλύτερη δύναμη στη λήψη μιας σωστής απόφασης. Η πιθανότητα εύρεσης μιας διαφοράς (π.χ., για παράδειγμα διαφορετική) όταν υπάρχει πραγματικά μια διαφορά είναι γνωστή ως στατιστική δύναμη (1β). Με άλλα λόγια, μπορούμε να θελήσουμε να έχουμε μια ισχύ τουλάχιστον 90% ότι όταν προτείνουμε μια αξίωση σαν ψεύτικη, ότι είναι πράγματι ψεύτικη. Αναλογία ∆ιάγνωσης ασθένειας Όπως με κλινικό έλεγχο ασθενών, η προθυμία να γίνει αποδεκτός ο κίνδυνος (άλφα λάθος) εξαρτάται ιδιαίτερα από τη σημασία του αποτελέσματος έκβασης. Παραδείγματος χάριν, στο σύστημα υγείας, μια μεγαλύτερη ανησυχία υπάρχει για λάθη τύπου Ι στις σοβαρές παθήσεις. Το σύστημα υγείας θα αποφάσιζε θετικά ( ασθενής) πάνω στην κατάσταση της υγείας ενώ στην πραγματικότητα αυτός είναι υγιής. Για να μειώσει τα λάθη τύπου Ι το σε σοβαρές παθήσεις απαιτεί μεγάλη ομοφωνία στις διαγνωστικές αποφάσεις των θεράποντων ιατρών. Αντίθετα, μια αναθεώρηση των απαιτήσεων επιδόματος αναπηρίας από μια επιτροπή εμπειρογνωμόνων μπορεί να απαιτεί μια απλή πλειοψηφία. Εδώ, το σύστημα υγείας είναι πρόθυμο να δεχτεί το μεγαλύτερο κίνδυνο λάθους τύπου Ι.

4.3 Τιμές π και στατιστική σημαντικότητα Κατά διεξαγωγή μιας στατιστικής ανάλυσης, η τιμή p χρησιμοποιείται για να αντιπροσωπεύσει την πιθανότητα ότι δεν υπάρχει καμία διαφορά (παραδείγματος χάριν, δύο μηχανές δεν παράγουν στατιστικώς διαφορετικά αποτελέσματα). Μια κοινή μέθοδος για τον προσδιορισμό μιας στατιστικής σύγκρισης είναι η διεξαγωγή συμπεράσματος ότι υπάρχει διαφορά εάν η τιμή p είναι μικρότερη από το επίπεδο λάθους άλφα. Παραδείγματος χάριν, ας υποθέσουμε ότι προσδιορίζεται σε μια σύγκριση δύο διαγνωστικών μηχανημάτων ότι η πιθανότητα τα δύο μέσα δεν είναι διαφορετικά είναι 0,24 Εάν υποθέσει κανείς άλφα = 0,05, θα καταλήγατε στο συμπέρασμα ότι τα δύο μηχανήματα δεν είναι διαφορετικά. Εντούτοις, εάν η τιμή p είναι 0,003, θα καταλήγατε στο συμπέρασμα ότι τα μηχανήματα είναι διαφορετικά. Σε αυτό το παράδειγμα, είστε 99,7% βέβαια ότι παίρνετε τη σωστή απόφαση.

Page 15: Six Sigma Statistics

5. ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Η κανονική κατανομή, οπτικά μοιάζει με μια ομαλή, συμμετρική, σε σχήμα καμπάνας καμπύλη, αντιπροσωπεύει δε συνήθως τη μορφή τυχαία μετρημένων στοιχείων. Χρησιμοποιείται για να περιγράψει μια μεγάλη ποικιλία καταστάσεων όπως τα αποτελέσματα έλεγχου νοημοσύνης, ογκομετρικές μετρήσεις, λάθη μέτρησης in-vitro απαντήσεων, κ.λπ.... Στην πραγματικότητα, η αποτυχία να βρεθεί μια κανονική κατανομή κατά το μελέτη μιας συνεχούς διαδικασίας συχνά μας λέει ότι κάποιος παράγοντας ασκεί ένα ασυνήθιστη επιρροή στις διαδικασίες (υπάρχει η ειδική αιτία μεταβλητότητας και διασποράς). Βασικές απαραίτητες γνώσεις • Κατανόηση μερικών κοινών ιδιοτήτων της κανονικής διανομής και της τυποποιημένης κανονικής κατανομής. • Υπολογισμός της πιθανότητας τα παρατηρούμενα στοιχεία ενός γεγονότος να ακολουθούν μια κανονική κατανομή.

5.1 Ιδιότητες μιας κανονικής διανομής Το σχήμα παρουσιάζει πιο κάτω μια κανονική κατανομή. Σε μια κανονική κατανομή, μέση, μεσαία, και mode όλες συμπίπτουν. Επιπλέον, ο αριθμός σταθερών αποκλίσεων για το μέσο όρο μπορεί να αντιπροσωπευθεί από πιθανότητες. Παραδείγματος χάριν, εάν τα στοιχεία κατανέμονται κανονικά, τότε το 99,73% των τιμών θα πρέπει να πέφτουν μεταξύ +/- 3σ.

5.2 Εκτίμηση πιθανοτήτων με τη χρήση της Κανονικής κατανομής Εάν τα δεδομένα κατανέμονται κανονικά (εύλογα ή υποτίθεται ότι ειναι κανονικά), οι πιθανότητες ενός γεγονότος μπορούν να παραχθούν εμπειρικά βασισμένο στις εκτιμήσεις παραμέτρων. Για να χρησιμοποιήσουν την κανονική κατανομή, οι τιμές μετατρέπονται αρχικά σε τυποποιημένα αποτελέσματα Z . Για να τυποποιήσει κανείς τα στοιχεία, χρησιμοποιεί τον ακόλουθο μετασχηματισμό: Z = (X – μ) / σ Τα αποτελέσματα Z μετασχηματίζουν τα δεδομένα στην τυποποιημένη αθροιστική κανονική κατανομή της οποίας μέσος όρος είναι 0, και η variance (σ2) είναι 1 Τα αποτελέσματα Z. παρέχουν μια χαρτογράφηση μιας κατανομής κάποιας μεταβλητής σε μια τυποποιημένη κλίμακα.

15

Page 16: Six Sigma Statistics

16

Αυτές οι χαρτογραφήσεις απεικονίζουν τη διαφορά από την άποψη του αριθμού των σταθερών αποκλίσεων από το μέσο όρο. Εάν ο μέσος όρος μιας διαδικασίας είναι 4 χιλ. και η σταθερή απόκλιση είναι 1, τότε μια παρατηρηθείσα τιμή 1 θα μπορούσε επίσης να αντιπροσωπευθεί σαν -3 σταθερές αποκλίσεις από το μέσο όρο. Για αυτό το παράδειγμα, Z=-3 είναι ισοδύναμο με μια πραγματική παρατήρηση ίση με 1 (όπου Z=–3* σταθερές αποκλίσεις από το μέσο όρο). Με την τυποποίηση των στοιχείων, η πιθανότητα ενός γεγονότος μπορεί να ληφθεί με τη χρησιμοποίηση των αποτελεσμάτων Z. Παραδείγματος χάριν, ας υποθέσουμε ότι θέλουμε να υπολογίσουμε την πιθανότητα μια τιμή να πέσει μεταξύ 4 και 16 δεδομένου μια μέση τιμή = 10 και μια σταθερή απόκλιση = 2. Pr (4 < X < 16) = Pr (X < 16) – Pr (X < 4) Z (X = 4) = (4 – 10) / 2 = -3.0 Z (X = 16) = (16 – 10) / 2 = 3.0 Pr (Z< -3.0) = 0.00135 (Από πίνακα Standardized Normal Curve) Pr (Z< 3.0) = 0.99865 (ή 1 – 0.00135) (Από πίνακα Standardized Normal Curve) Pr (Z < 3) – Pr (Z < -3) = 0.99865 – 0.00135 = 0.9973 Έτσι το 99.73% των τιμών πέφτει μεταξύ +/- 3σ.

5.3 Υπολογισμός ατελειών ανά εκατομμύριο από Κανονική κατανομή Εάν τα στοιχεία κατανέμονται κανονικά, μπορούμε να υπολογίσουμε τα ποσοστά ατελειών ανά εκατομμύριο, χρησιμοποιώντας την τυποποιημένη κανονική καμπύλη. Η ακόλουθη διαδικασία παρέχει μια διαδικασία σε διαδοχικά βήματα για τον υπολογισμό των ποσοστών των ατελειών ανά εκατομμύριο με την υπόθεση ότι τα στοιχεία ακολουθούν μια κανονική κατανομή και ότι η διαδικασία έχει bilateral tolerance. Βήμα 1: Λήψη των απαραίτητων πληροφοριών των δεδομένων εισόδου. • Προδιαγραφές: Target, Upper Specification Limit (USL), και Lower Specification Limit (LSL). • Συνοπτική στατιστική από το σύνολο των δεδομένων: Η εκτίμηση της μέσης τιμής του δείγματος και της Σταθερής απόκλισης. Παράδειγμα: Ας υποθέσουμε ότι προσπαθούμε να υπολογίσουμε αμαύρωση ακτινογραφικών φιλμ των οποίων προδιαγραφή των διαμέτρων τους είναι 25.4 +/- 0.05. Παίρνετε δείγμα 100 φιλμ και παίρνετε Μέση τιμή =25.41 και Σταθερή απόκλιση δείγματος = 0.02. Target = 25.4; USL = 25.45; LSL = 25.35; Mean = 25.41; Std Dev = 0.02 Βημα 2: ∆είξτε γραφικά τα USL, LSL, Target, Mean, and Std Deviation Συμβουλή: προσδιορίστε εάν ο μέσος όρος είναι πιο κοντά στο USL ή στο LSL επειδή οι ατέλειες ανά εκατομμύριο θα πρέπει να είναι μεγαλύτερες στην πλευρά που είναι η πιο κοντά στο μέσο όρο. Παράδειγμα: γραφική παράσταση του ανωτέρω προβλήματος.

Page 17: Six Sigma Statistics

Dimensions

Freq

uenc

y

40302010

3,0

2,5

2,0

1,5

1,0

0,5

0,0

Mean 25,41StDev 9,714N 14

Normal Film Graph

Target=25,4

USL=25,45LSL=25,35

Βήμα 3: Υπολογίστε την πιθανότητα μιας ατέλειας πάνω από το USL και κάτω από LSL..

Dimensions

Freq

uenc

y

40302010

3,0

2,5

2,0

1,5

1,0

0,5

0,0

Mean 25,41StDev 9,714N 14

Normal Film Graph

p[Z>Zo]p[Z<Zo]

Βήμα 3a. Υπολογισμός Pr (Defect > USL). Για να λάβουμε την πιθανότητα ότι ένα μέρος θα είναι μεγαλύτερο από το USL, πρέπει να υπολογίσουμε τη z-value για το USL (Zusl) και να βρούμε τη πιθανότητα σε έναν πίνακα Κανονικών πιθανοτήτων. Σημείωση: μπορούμε επίσης να χρησιμοποιήσουμε στατιστικό λογισμικό για να πάρουμε αυτήν την πιθανότητα Υπολογίσιμος Zusl = (USL – Mean) / std deviation Από το Zusl, μπορούμε να υπολογίσουμε τη Pr (Defect > USL). Pr (Defect > USL) = 1 – Pr(Z<Zusl). Οι πίνακες κανονικών πιθανοτήτων παρουσιάζονται σαν πιθανότητες από το μείον άπειρον μέχρι το Z. Ετσι, για υπολογισμό ατελειών μεγαλύτερων από USL, πρέπει να ορίσουμε το Pr (Defect > USL) = 1 – Pr (Z < Zusl). Το Pr(Z < Zusl) is λαμβάνεται εάν κοιτάξουμε την τιμή για το Zusl σε ένα πίνακα Κανονικών πιθανοτήτων. Παράδειγμα: Target = 25.4; USL = 25.45; LSL = 25.35; Mean = 25.41; Std Dev = 0.02 Zusl = (25.45 – 25.41) / 0.02 = 2.00 Pr (Z < Zusl) = 0.97725 (από Πίνακα όπου Zusl = 2.0) Pr (Defect > USL) = 1 – Pr (Z < Zusl) = 1 – 0.97725 = 0.02275 3b. Υπολογισμος Pr(Defect < LSL). Για να λάβουμε την πιθανότητα ένα μέρος να είναι μικρότερο από το LSL, πρέπει να υπολογίσουμε τη z-value για το LSL (Zlsl) και να βρούμε τη πιθανότητα από ένα πίνακα Κανονικών πιθανοτήτων. Σημείωση: μπορούμε επίσης να χρησιμοποιήσουμε μια λογισμικό στατιστικής για να πάρουμε αυτήν την πιθανότητα. Υπολογισμός Zlsl = (LSL – Mean) / std deviation Από το Zlsl, μπορούμε να προσδιορίσουμε το Pr (Defect < LSL). Pr (Defect < LSL) = Pr(Z< Zlsl).

17

Page 18: Six Sigma Statistics

18

Οι πίνακες κανονικών πιθανοτήτων παρουσιάζονται ως πιθανότητα από το το μείον άπειρο μέχρι το Z. Κατά συνέπεια, για να υπολογίσει κανείς τις ατέλειες μικρότερες από LSL, πρέπει να έχουμε το Pr (Defect < LSL) = Pr (Z< Zlsl). Το Pr(Z < Zlsl) λαμβάνεται με να ανατρέξει κανείς την τιμή του Zlsl σε έναν πίνακα κανονικών πιθανοτήτων. Παράδειγμα: Target = 25.4; USL = 25.45; LSL = 25.35; Mean = 25.41; Std Dev = 0.02 Zlsl = (25.35 – 25.41) / 0.02 = -3.00 Pr (Z < Zlsl) = 0.00135 (από Πίνακα όπου Z = -3.0) Pr (Defect < LSL) = 0.00135 Βήμα 4: Υπολογισμός της πιθανότητας μιας ατέλειας. Pr (Defect) = Pr (Defect > USL) + Pr (Defect < LSL) Παράδειγμα: Pr (Defect) = 0.02275 + 0.00135 = 0.02410 Βήμα 5: Υπολογισμός του πραγματικού DPM Πραγματικό DPM = Pr (Defect) * 1,000,000 Παράδειγμα: Πραγματικό DPM = 0.02410 * 1M = 24,100 DPM Υπολογισμός πιθανού DPM: Μπορούμε να θελήσουμε να υπολογίσουμε το πιθανό DPM, το οποίο αντιπροσωπεύει το DPM που θα μπορούσε να επιτευχθεί εάν η μέση τιμή της διαδικασίας μετατοπιστεί προς την τιμή στόχος και η σταθερή απόκλιση δεν αλλάξει. Για να υπολογιστεί το πιθανό DPM, θα πρέπει να επαναληφτούν τα πιο πάνω βήματα αλλά θα πρέπει να αντικατασταθούν οι τιμές των στόχων για το μέσο όρο. Σημείωση: Η Pr (Defect < LSL) πρέπει να είναι ίση με τη Pr(Defect > USL) εάν η τιμή του στόχου σας είναι στο κέντρο μεταξύ USL και LSL Επίσης, το πιθανό DPM σας πρέπει να είναι λιγότερο από το πραγματικό DPM σας εάν το η τωρινή σας μέση τιμή δεν είναι ίση με την τιμή του στόχου σας. Παράδειγμα: Zusl = (25.45 – 25.4) / 0.02 = 2.5 (από πίνακα 0.99379) Pr (Defect > USL) = 1- 0.99379 = 0.00621 Zlsl = (25.35 – 25.4) / 0.02 = -2.5 (από πίνακα 0.00621) Pr (Defect < LSL) = 0.00621 Pr (Defect) = 0.00621 + 0.00621 = 0.01242 DPM = 0.01242 * 1 M = 12,420 DPM ΣΧΟΛΙΟ: Για αυτό το παράδειγμα, μετατόπιση τη μέσης τιμής προς την τιμη στόχου (λαμβάνοντας υπόψη την ίδια σταθερή απόκλιση) θα μπορούσε ενδεχομένως να μειώσει το DPM κατα περίπου το μισό (24.100 έως 12,420).

Page 19: Six Sigma Statistics

6. ΓΡΑΜΜΙΚΗ ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Η Παλινδρόμηση χρησιμοποιείται για να περιγράψει τις σχέσεις μεταξύ μεταβλητών. Βασικές απαραίτητες γνώσεις • Υπολογισμός της κλίσης και της τομής Υ με τη χρησιμοποίηση απλής γραμμικής παλινδρόμησης. • Υπολογισμός και ερμηνεία του απλού συντελεστή συσχετίσεως. • Κατανόηση της διαφοράς μεταξύ απλής γραμμικής παλινδρόμησης και πολλαπλής γραμμικής παλινδρόμησης.

6.1 Εξίσωση Γενικής Παλινδρόμησης The general equation is Η εξίσωση παλινδρόμησης χρησιμοποιείται για να περιγράψει τη σχέση μεταξύ των μεταβλητών απάντησης και πρόβλεψης. Η γενική εξίσωση είναι: Y = βo + β1X1 + β2 X2 + ... β n Xn

Y – αντιπροσωπεύει τη μεταβλητή απάντησης. βo–αντιπροσωπεύει τη τομή Y (η τιμή της απάντησης όταν η μεταβλητή πρόβλεψης είναι (σ) = 0) β(1..n) - is the slope or rate of change of each predictor variable. X(1..n) - is the value of each predictor variable.

6.2 Εξίσωση Απλής Παλινδρόμησης Η απλή γραμμική παλινδρόμηση εξετάζει τη γραμμική σχέση μεταξύ δύο μεταβλητών: μια απάντηση και μια πρόβλεψη. Εάν οι δύο μεταβλητές συσχετίζονται, η εξίσωση παλινδρόμησης μπορεί να χρησιμοποιηθεί για να προβλέψει μια τιμή απάντησης δεδομένης μιας τιμής πρόβλεψης με τυχαία πιθανότητα. Η απλή εξίσωση γραμμικής συσχέτισης είναι: Y =βo + β1X1

Η πιο κοινή μέθοδος που χρησιμοποιείται για να καθοριστεί η γραμμή που ταιριάζει "καλύτερα" τα δεδομένα είναι η παλινδρόμησης ελάχιστων τετραγώνων, η οποία ελαχιστοποιεί τα τετράγωνα των αποκλίσεων μεταξύ μεμονωμένων παρατηρήσεων και της γραμμής παλινδρόμησης. Οι εξισώσεις που χρησιμοποιούνται για να υπολογίσουν την κλίση (β1) και την Υ-τομή (βο) είναι:

Simple Linear Regression Example Suppose you conduct an experiment to examine the relationships between bicycle tire pressure, tire width, and the coefficient of rolling friction. From experiments, you obtain the following: Coefficient of Rolling Friction for Bicycle Tires Pressure (PSI) Width=1.25" Width= 2" 19

Page 20: Six Sigma Statistics

20 0.0100 0.0107 25 0.0095 0.0100 30 0.0088 0.0093 35 0.0081 0.0086 40 0.0074 0.0079 45 0.0067 0.0073 50 0.0060 0.0071 55 0.0058 0.0068 60 0.0056 0.0066 65 0.0054 0.0063 70 0.0052 0.0061 75 0.0050 0.0058 Given these data, estimate the slope and Y-intercept for both variables. Using excel, the following results may be obtained. Width=1.25" Width= 2" slope -0.0001 -0.0001 intercept 0.0115 0.0118

6.3 Συσχέτιση Ο συντελεστής συσχέτισης Pearson μετρά το βαθμό με τον οποίο δύο συνεχείς μεταβλητές συσχετίζονται γραμμικά. Παραδείγματος χάριν, μπορεί να θέλουμε να μετρήσουμε τη συσχέτιση μεταξύ της αμαύρωσης του φιλμ και της σωματιδιακής πυκνότητας του ακτινογραφικού υλικού στο ανωτέρω παράδειγμα. Η απλή συσχέτιση μπορεί να μετρηθεί με τη χρησιμοποίηση της ακόλουθης εξίσωσης:

Ο συντελεστής συσχέτισης, R, αποτελείται από μια τιμή μεταξύ –1 και 1. Τέλεια συσχέτιση (είτε –1 είτε 1) εμφανίζεται όταν αφορά ακριβώς κάθε παρατήρηση σε ένα δείγμα πέφτει ακριβώς πάνω στην γραμμή προβλέψεως (δηλ., κανένα λάθος). Ισχυρή θετική συσχέτιση (η τιμή πλησιάζει το 1) υπάρχει όταν αυξάνονται ή μειώνονται και οι δύο μεταβλητές ταυτόχρονα. Μια τιμή συσχέτισης R, που είναι μεγαλύτερη από 0,7, δείχνει συνήθως μια ισχυρή θετική σχέση. Ισχυρή αρνητική συσχέτιση (η τιμή πλησιάζει το –1) υπάρχει όταν μια μεταβλητή αυξάνεται ενώ η άλλη μεταβλητή μειώνεται. Μια τιμή συσχέτισης, R, που είναι μικρότερη από -0,7, δείχνει χαρακτηριστικά μια ισχυρή αρνητική σχέση

6.4 Χρησιμοποίηση Scatter Plots για να παρουσιαστούν οι γραμμικές σχέσεις Ένα scatter plot είναι ένα αποτελεσματικό εργαλείο εύρεσης της δύναμης (ισχυρή–αδύνατη συσχέτιση) και της κατεύθυνσης (θετικής και αρνητικής). Τα σχήματα παρουσιάζουν κατωτέρω διάφορα παραδείγματα με τους διαφορετικούς συντελεστές συσχέτισης

20

Page 21: Six Sigma Statistics

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Τελεια Θετικη Συσχετιση

0

2

4

6

8

10

12

0 2 4 6 8 10

Τελεια Αρνητικη Συσχετιση

12

21

0

2

4

6

8

10

12

14

0 2 4 6 8 10

Απλη Θετικη Συσχετιση12

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12

Απλη Αρνητικη Συσχετιση

Σημείωση: Εάν δύο μεταβλητές κατανέμονται κανονικά χωρίς συσχέτιση (δηλ.,R=0),το προκύπτων γράφημα θα μοιάσει με έναν κύκλο Ερμηνεία των συντελεστών συσχέτισης Κατά συναγωγή συμπερασμάτων βασιζόμενων στους συντελεστές συσχέτισης, διάφορα σημαντικοί παράμετροι θα πρέπει να εξεταστούν: • Οι συντελεστές συσχέτισης μετρούν μόνο τις γραμμικές σχέσεις. Μια σημαντική μη γραμμική σχέση μπορεί να υπάρξει ακόμα κι αν ο συντελεστής συσχετισμού είναι 0, • Η συσχέτιση ∆ΕΝ δείχνει Πάντα το αίτιο και το αιτιατό. ∆εν πρέπει να καταλήξει κανείς στο συμπέρασμα ότι οι αλλαγές σε μια μεταβλητή προκαλούν αλλαγές στην άλλη. Καταλλήλως ελεγχόμενα πειράματα απαιτούνται για να ελέγξουν εάν μια σχέση συσχετισμού δείχνει την αιτιολογία. • Ένας συντελεστής συσχέτισης είναι πολύ ευαίσθητος στις ακραίες τιμές. Μια ενιαία τιμή που είναι πολύ διαφορετική από άλλες σε ένα σύνολο στοιχείων μπορεί να αλλάξει την τιμή ενός συντελεστή κατά πολύ. Στο παράδειγμα κατωτέρω, ο συσχετισμός είναι 0,9, αλλά το scatter plot προτείνει την ύπαρξη ακραίων τιμών (outlier) για να εξηγήσει τη σχέση με τη μεταβλητή πρόβλεψης. Εάν αφαιρέσατε τη τιμή για το, η συσχέτιση μεταξύ αυτών των δύο μεταβλητών θα μειωνόταν σε 0,1 για ένα μικρότερο εύρος Χ.

6.5 Πολλαπλή γραμμική παλινδρόμηση Η πολλαπλή γραμμική οπισθοδρόμηση εξετάζει τις γραμμικές σχέσεις μεταξύ μιας συνεχούς απάντησης και δύο ή περισσότερων μεταβλητών προβλέψεως. Εάν οι μεταβλητές απάντησης και πρόβλεψης συσχετίζονται, τότε η εξίσωση παλινδρόμησης μπορεί να χρησιμοποιηθεί για να προβλέψει μια τιμή απάντησης των δεδομένων των τιμών πρόβλεψης αρκετά καλύτερα από μια τυχαία πιθανότητα. Κατά χρησιμοποίηση της πολλαπλής γραμμικής παλινδρόμησης, κάποιος πρέπει να προσέξει εάν ο αριθμός μεταβλητών πρόβλεψης είναι μεγάλος, ιδιαίτερα σε σχέση με το μέγεθος του δείγματος. Παραδείγματος χάριν, η προσπάθεια να δημιουργηθεί ένα πρότυπο πολλαπλής παλινδρόμησης με 5 μεταβλητές πρόβλεψης και μόνο 10 σημεία δεδομένων είναι πιθανό να

Page 22: Six Sigma Statistics

22

δημιουργήσει προβλήματα, ειδικά εάν οι μεταβλητές πρόβλεψης δεν είναι ανεξάρτητες η μια από την άλλη (δηλ., δεν υπάρχει καμία σχέση). Εδώ, κάποιος πρέπει να παραπέμψει σε μια πιο προηγμένη τεχνική παλινδρόμησης.

7. ΤΕΧΝΙΚΕΣ ΚΑΙ ΜΕΘΟΔΟΙ 7.1 Define, Measure, Analyze, Improve, Control (DMAIC) Οι στόχοι ικανοποίησης και αποδοτικότητας των χρηστών του συστήματος έρχονται πρώτοι και διαρκούν στο Six Sigma. ∆εδομένου ότι σημαντικές ανακαλύψεις 6σ βοηθούν τους οργανισμούς να ξεπεράσουν τους ετήσιους οικονομικούς στόχους τους, οι μακροπρόθεσμοι στόχοι αναβαθμίζονται συνεχώς για να στηρίξουν την τάση αυτή. Οι κίτρινες σειρές κορυφών – και κατώτατων σημείων βημάτων διαδικασίας - περιγράψτε τις κορυφαίες ηγετικές αρμοδιότητες. Συνεπώς, μια σε ευρεία βάση οργανωτική συμμετοχή απαιτείται για την επιτυχία σε όλα τα βήματα. Ολόκληρος ο πίνακας διαδικασίας Define, Measure, Analyze, Improve and Control (DMAIC) αναπτύχθηκε από τη Motorola. Η DMAIC αναγνωρίζεται μέχρι σήμερα σαν ένα αναπόσπαστο τμήμα της κοινωνίας ποιότητας,. Τα κυριότερα σημεία ροής διαδικασίας DMAIC περιλαμβάνουν:

• Ποσοτικοποίηση της αξίας ενός προγράμματος στον οργανισμό. Κάθε πρόγραμμα Six Sigma πρέπει να αφορά τα κρίσιμα ποιοτικά χαρακτηριστικά και να ασκήσει σημαντική οικονομική επίδραση. Η ποσοτικοποίηση της αξίας είναι τα αρχικά κριτήρια για την επιλογή ενός προγράμματος. Η αξία δικαιολογεί την ανάθεση μιας πλήρους απασχόλησης, υπεύθυνους ς 6σ στη δημιουργία της απαραίτητης σημαντικής ανακάλυψης.

• Η μέτρηση είναι ένας τρόπος επικοινωνίας. Η Six Sigma είναι κατά ένα μεγάλο μέρος η εφαρμοσμένη επιστήμη των μετρήσεων. Ξέροντας πώς να μετρήσει, πότε να μετρήσει, τι να μετρήσει, και πώς να καταγράψει τις μετρήσεις για τη μέγιστη αξία είναι ουσιαστικές δεξιότητες6σ. Οι δεξιότητες μέτρησης εξαρτώνται από τη γνώση μέτρησης.

• Τα στοιχεία πρέπει να καταγράφονται διαδοχικά καλούμενα συνήθως χρονική σειρά. Όποτε κάποιος συλλέγει στοιχεία, είτε με υπολογισμό είτε με μετρήσεις, θα πρέπει να καταγράφονται όλα τα στοιχεία σε διαδοχική σειρά.

• Μια ανάλυση Six Sigma είναι μια στατιστική ανάλυση. Επιπλέον, υπεύθυνοι 6σ χρησιμοποιούν παραδοσιακές οικονομικές αναλύσεις για να επικοινωνήσουν με τους βασικούς πελάτες. Η Six Sigma και οι οικονομικές μετρήσεις είναι πολύτιμα εργαλεία όταν πλαισιώνονται σε ένα σημαντικό πλαίσιο.

• Η σημαντική ανακάλυψη, η βελτίωση, και οι αρχές ποιοτικού ελέγχου είναι καλά τεκμηριωμένες. Η αποδεδειγμένη ιστορία βελτίωσης των κερδών στη βιομηχανία είναι αξεπέραστη.

• Το διάγραμμα ροής προγράμματος περιγράφει μια αποδοτική, οικονομική, και λεπτομερή πορεία προς βελτιώσεις Six Sigma. Αυτή η διαδικασία έχει καταδείξει επανειλημμένα την ικανότητά της για βελτίωση της παραγωγικότητας, της ποιότητας, των πληροφοριών και των σημαντικών ανακαλύψεων.

Page 23: Six Sigma Statistics

23

Μια επαναλαμβανόμενη σειρά ενεργειών και μεταβλητών είναι μια διαδικασία. Μια συλλογή διαδικασιών είναι ένα σύστημα. Ουσιαστικά τέλεια ποιότητα 6σ είναι αποτέλεσμα μιας βέλτιστης αλληλεπίδρασης όλων των μεταβλητών σε ένα δεδομένο σύστημα. Ερωτήματα στις διαδικασίες και στο σύστημα που αντιμετωπίζουμε όλοι στην εργασία μας περιλαμβάνουν, "ποιες είναι οι σημαντικότερες μεταβλητές για τον πελάτη;"" Είμαι αποδοτικός; Είμαι ι αποτελεσματικός; Χρησιμοποιώ τις καλύτερες μεθόδους για να ανταποκριθώ στις υποχρεώσεις μου; Υπάρχει καλύτερος τρόπος; Η επιστήμη της συλλογής δεδομένων έχει δύο κλειδιά με τα οποία μπορούμε να απαντήσουμε σε αυτές τις ερωτήσεις. Με συστηματική παρατήρηση των διαδικασιών και των συστημάτων, μαθαίνουμε γρηγορότερα μέσω της δοκιμής και του λάθους "Μπορούμε να δούμε πολλά, απλά με το κοίταγμα μόνο." Όταν κοιτάζουμε και μαθαίνουμε, μπορούμε να βελτιωθούμε. Μετρήσεις Six Sigma, αναλύσεις και γραφικές παραστάσεις σίγμα επιταχύνουν την εκμάθηση. Κλειδί # 1: Αναπτύξτε τους σαφείς λειτουργικούς ορισμούς. Καθορίστε ακριβώς τι σημαίνετε να μετρήσετε προτού να αρχίσετε να. Αυτό είναι μια δύσκολη επιχείρηση. Κλειδί # 2: Τακτοποιήστε τα στοιχεία σας σε στήλες και σειρές. Οι πίνακες είναι ο αποδεδειγμένα καλύτερος τρόπος για να παραταχθούν τα στοιχεία που συλλέγονται σε στήλες και σε σειρές. Τα στοιχεία μπορούν να συλλεχθούν από οποιαδήποτε διαδικασία. Στην εποχή των υπολογιστών, οι λειτουργικοί ορισμοί για σειρά ` "και στήλη `" έχουν αλλάξει. Οι σειρές καλούνται τώρα "αρχεία." Οι στήλες είναι "πεδία." Τα πεδία τομείς περιγράφουν τις λεπτομέρειες για κάθε αρχείο. Η καταγραφή κάθε αρχείου στην κατάλληλη ακολουθία της είναι εξαιρετικά σημαντική. Καταγράψτε την ακολουθία στοιχείων για κάθε ανάλυση Six Sigma Οσο περισσότερα είναι τα πεδία τόσο πλουσιότερη η κατανόησή μας μπορούν να είναι. Παραδείγματος χάριν, στο ίδιο ποσό διαστήματος ο ακόλουθος πίνακας έχει δύο φορές τα στοιχείο. Το πλούσια στοιχεία, σημαίνει ότι κάθε στήλη του τομέα έχει ένα σαφή λειτουργικό μηχανισμό, που μπορεί να παραγάγει τις πλούσιες πληροφορίες. Πολλές φορές συλλέγουμε δωδεκάδες τομέων για κάθε καταγραμμένη παρατήρηση. ∆εδομένου ότι η συλλογή δεδομένων είναι χρόνος που καταναλώνει και ακριβός, σχεδιάστε το σχέδιο συλλογής σας με την προσοχή προτού να αρχίσετε.

7.2. Ανάλυση Δεδομένων Τα δεδομένα γίνονται πληροφορίες όταν αναλύονται και γίνονται γραφικές παραστάσεις. Οι αναλυτικές γραφικές παραστάσεις είναι πολύτιμες. Η Six Sigma είναι το χρυσό διεθνές πρότυπο ανάλυσης. Αυτά πρότυπα μας επιτρέπουν να συγκρίνουμε τις διαδικασίες που διαφέρουν ως προς το σκοπό και την πολυπλοκότητα. Αν και πολλοί επαγγελματίες επιλέγουν να μην χρησιμοποιούν τις στατιστικές, οι στατιστικές αποδείξεις επηρεάζουν τα αμέριστα την επαγγελματική αξιοπιστία. Η θεωρία πιθανοτήτων, είναι η βάση της στατιστικής,. Η πιθανότητα

Page 24: Six Sigma Statistics

24

φανερώνει το τρόπο εμφάνισης μιας ασθένειας. Η Six Sigma βάζει τις πιθανότητες, με τον ίδιο τρόπο, στην απόδοση μια νοσοκομειακής μονάδας. Οι στατιστικές μέθοδοι παραδίδουν το πιο υψηλό επίπεδο στοιχείων για την παραγωγή των κρίσεων. Μια στατιστική ανάλυση είναι ο πιο σίγουρος τρόπος για να επιβεβαιώσει κανείς τι έχει παρατηρήσει λόγω της μεταβλητότητας των παραγόντων ή κάποιου συγκεκριμένου λόγου. Χωρίς ανάλυση, έχουμε μόνο τη διαίσθηση μας, τις υποθέσεις μας και τις εικασίες. Μερικές φορές οι υποθέσεις μας είναι σωστές, μερικές φορές όχι. Η Six Sigma μειώνει την εικασία. Η Στατιστική ανάλυση αυξάνει την εμπιστοσύνη στις κρίσεις που πρέπει να κάνουμε σε έναν αβέβαιο κόσμο. Εδώ είναι οι τέσσερις κανόνες για μια στατιστικά έναν έγκυρο, γραφική, ανάλυση μέσω σ6 των δεδομένων. 1.Υπολογισμός της μέσης τιμής για το σύνολο αριθμών . Ένα σύνολο αριθμών καλείται σύνολο στοιχείων. Ο μέσος όρος, , συμβολίζεται με το χαρακτήρα Χ. 2.Υπολογισμός της σταθερής απόκλισης, για το σύνολο των στοιχείων. Το σύμβολο για τη σταθερή απόκλιση καλείται σίγμα, σd. 3.Υπολογισμός των πληροφοριών πιθανοτήτων για το σύνολο στοιχείων. Οι πληροφορίες πάνω στις πιθανότητες μας λένε εάν οι διαφορές που βλέπουμε στις μετρήσεις μας οφείλονται στην τυχαίε ή όχι εμφανίσεις. Ή, η πιθανότητα θα μας πει εάν οι διαφορές που βλέπουμε οφείλονται πιθανότατα σε έναν παράγοντα ή έναν συνδυασμό μεταβλητών. 4.Γραφική παράσταση των στοιχείων με τη χρησιμοποίηση κατάλληλης αναλυτικής γραφικής παράστασης. Οι γραφικές παραστάσεις και τα διαγράμματα είναι περιγραφικά, μη αναλυτικά. Το λογισμικό Six Sigma διευκρινίζει αυτήν την εργασία δίνοντας τις κατάλληλες γραφικές παραστάσεις τη μέση τιμή, σταθερή απόκλιση, και τις πληροφορίες πιθανότητας με τους σημαντικότερους τρόπους Σαφώς, οι βασικές ικανότητες υπολογισμών με λογιστικά φύλλα (spreadsheet) είναι μια αναμενόμενη ικανότητα για τους υπεύθυνους 6σ για να παραχθούν τα καλύτερα αποτελέσματα. Η δύναμη υπολογισμού καθιστά τις πρωτοβουλίες 6σ δυνατές. ∆ώστε προτεραιότητα στις στρατηγικές εκμάθησης των προσωπικών σας αναγκών. Όταν μετατρέπουμε τις μετρήσεις μας σε ακριβείς στατιστικές εικόνες, προκύπτουν τα διάφορα προγράμματα. Αυτά τα πολύτιμα, σχέδια αποταμίευσης χρόνου και χρήματος θα παρέμεναν θαμμένα σε στήλες και τις σειρές αριθμητικών πινάκων. Η εκμάθηση για να αναγνωρίζονται αυτά τα σχέδια είναι μια αναπόφευκτη απαραίτητη ικανότητα για το σ6. Το να εκτιμήσει κανείς τις πληροφορίες που μεταβιβάζονται από αυτά τα σχέδια είναι μια από τις σημαντικότερες συνεισφορές που οι υπεύθυνοι μπορούν να έχουν σε προγράμματα Six Sigma. Για να συγκριθούν τα σύνολα στοιχείων εφευρέθηκε ένας στατιστικός τρόπος. Η μέθοδός ονομάστηκε Ανάλυση Μεταβλητότητας, η οποία μεταγλωττίστηκε αργότερα σε ANOVA. Αυτή η μέθοδος εξελίχθηκε τελικά σε συγκρίσεις συνόλου στοιχείων Six Sigma. ANOVA είναι ένας οδηγός για τον καθορισμό εάν ένα γεγονός οφειλόταν ή όχι στην τυχαία πιθανότητα της φυσικής μεταβλητότητας. Ή, αντίθετα η ίδια μέθοδος παρέχει τις οδηγίες για ένα επίπεδο 95%

Page 25: Six Sigma Statistics

εμπιστοσύνης ένας ορισμένος παράγοντας (X) ή παράγοντες (το Χ, το Υ, ή/και Z) να είναι ο πιθανότερος λόγος για το γεγονός. Ο λόγος F που αναφέρεται σύμφωνα με τον κανόνα 3 είναι οι πληροφορίες πιθανότητας που παράγονται από την ANOVA. Ένα ANOVA μπορεί να είναι, και οφείλει να είναι, χρήσιμη στην αξιολόγηση των διαφόρων μεταξύ των στοιχείων των συνόλων. Μπορεί να χρησιμοποιηθεί με οποιοδήποτε αριθμό στοιχείων συνόλων, που καταγράφεται από οποιαδήποτε διαδικασία. Τα σύνολα στοιχείων δεν χρειάζονται να είναι ίσα στο μέγεθος. Τα σύνολα στοιχείων κατάλληλα για ένα ANOVA μπορούν να είναι τόσο μικρά όπως τρεις ή τέσσερις αριθμούς, μέχρι απείρως μεγάλα σύνολα αριθμών.

7.3 .Γραφικά Και ANOVA Τα περισσότερα προγράμματα στατιστικής φροντίζουν τους πρώτους τρεις κανόνες 6σ για την ολοκλήρωση μιας ανάλυσης. ∆υστυχώς, δεν δημιουργούν σημαντικές, αναλυτικές γραφικές παραστάσεις. Όπως αναφέρεται νωρίτερα, οι περισσότερες γραφικές παραστάσεις είναι περιγραφικές, παρά αναλυτικές. Καθώς μαθαίνετε τη Six Sigma μπορείτε να θελήσετε χρησιμοποιήσετε ειδικό λογισμικό υπολογισμού ANOVA. Η ευκολία με την οποία υπολογίζεται η ANOVA και παρουσιάζει γραφικά στατιστικές διαφορές μεταξύ των συνόλων στοιχείων είναι βασική στην επιτυχία ενός. προγράμματος Six Sigma ∆εν θα είναι απαραίτητο να εξετάσετε, ή να υπολογίσετε μια εξίσωση

Κάθε I-Bar έχει ένα μαύρο τετράγωνο στο κέντρο του. Αυτό το τετράγωνο προσδιορίζει το μέσο αποτέλεσμα για κάθε ομάδα. Η κορυφή και το κατώτατο σημείο κάθε I-Bar επεκτείνονται κατά δύο σταθερές αποκλίσεις, , 2σ πάνω και κάτω από το μέσο όρο. Σκεφτείτε αυτούς σαν το ανώτερο όριο ελέγχου (UCL) και σαν το χαμηλότερο όριο ελέγχου (LCL) για το αποτέλεσμα κάθε ομάδας. Κάθε I-Bar καλύπτει το 95% του εύρους της καμπύλης για κάθε ομάδα. 25

Page 26: Six Sigma Statistics

Σημειώστε τις επικαλυπτόμενες τιμές στους κόκκινους δείκτες των κύκλων.. Αλλά, όταν βλέπουμε τα στοιχεία με τη χρησιμοποίηση της μέσης τιμής ( Χ ), η σταθερή απόκλιση (σ), οι πληροφορίες πιθανότητας που παρέχονται από το λόγο F και μια σημαντική αναλυτική γραφική παράσταση, σημάδι είναι προφανώς ότι πρόκειται για καλύτερη επίδοση.

7.4 Διαγράμματα Ποιοτικού Ελέγχου Τα διαγράμματα ποιοτικού ελέγχου έχουν χρησιμοποιηθεί από χιλιάδες οργανισμούς για αποτελέσματα ετών. Έτσι, για πολλούς οργανισμούς αυτά τα διαγράμματα Six Sigma δεν θα είναι νέα. Αυτό που είναι νέο με το Six Sigma, είναι ότι τα διαγράμματα ποιοτικού ελέγχου χρησιμοποιούνται για να αναλύσουν όλα τα είδη των διαδικασιών εκβάσεων. Λειτουργικοί, οικονομικοί, παράγοντες παραγωγικότητα, και άλλες εκτελεστικές μετρήσεις. Αν και υπάρχουν διάφορα διαφορετικά είδη διαγραμμάτων ελέγχου που μπορούν να χρησιμοποιηθούν, ο πιο γνωστός στους υπεύθυνους Six Sigma καλείται Individual X and Moving Range chart. Αυτό το διάγραμμα καλείται επίσης ένα διάγραμμα Χ, ή ατομικό διάγραμμα, επειδή σχεδιάζει τις μεμονωμένες μετρήσεις. Γραφική παράσταση διαγραμμάτων ελέγχου ένας μέσος όρος ( Χ ), μια σταθερή απόκλιση (σ), και πληροφορίες πιθανότητας ταυτόχρονα. Παραδείγματα Το διάγραμμα ελέγχου παρουσιάζει αυτόματα τη μέση τιμή της διαδικασίας ως Process Center Line (PCL). Σε αυτήν την περίπτωση, το ανώτερο όριο ελέγχου (UCL) και το χαμηλότερο όριο ελέγχου (LCL) αντιπροσωπεύουν 3 σταθερές αποκλίσεις πάνω και 3 κάτω της μέσης τιμής. Στο ένα ατομικό διάγραμμα η καμπύλη παρουσιάζεται οριζόντια. Επειδή κανένα από τα σημεία δεν τονίζεται είτε με κύκλο είτε με τετράγωνο, όλες οι μεταβλητότητες οφείλονται εδώ πιθανότατα στη φυσική, μεταβλητότητα

Εάν παρατάσσετε τα αποτελέσματα όλων των επιδόσεων σε μια στήλη και δημιουργήσετε ένα ενιαίο διάγραμμα ελέγχου, θα εξακριβώσετε τις πιο απίθανες, στατιστικώς σημαντικές ομάδες. 26

Page 27: Six Sigma Statistics

Αυτά τα σχέδια προσδιορίζονται μέσα σε κύκλους ή/ και σε ένα τετράγωνο. Το υψηλό σημείο, δηλαδή το καλύτερο αποτέλεσμα, πέφτει μακρύτερα του μέσου όρου πάνω από 3 σταθερές αποκλίσεις. Το επόμενο σημείο που ευρίσκεται σε κύκλο είναι επίσης ιδιαίτερα απίθανο. Οποιοδήποτε από τα δύο διαγράμματα ελέγχου προορίζονται για να τα εντοπίσετε με το μάτι. Εάν μπορείτε να προσδιορίσετε τον παράγοντα (X) ή το συνδυασμό παραγόντων (το Χ, το Υ, ή/και Z) σχετικός με αυτά τα υψηλά αποτελέσματα, και να τα επαναλάβει, τότε θα αυξήστε το μέσο αποτέλεσμά σας. .

Με τη χρησιμοποίηση των προηγμένων διαδικασιών, μπορείτε να προσθέσετε τίτλους, να δημιουργήσετε τα βαθμωτα όρια ελέγχου για τις χωριστές ομάδες στοιχείων, να ονομάσετε τον άξονα Χ, και να δώσετε την κατάλληλη εμφάνιση στο διάγραμμα. .

7.5 Διαγράμματα Σκέδασης και Ανάλυση Συσχετίσεων ∆ιαγράμματα διασποράς Six Sigma και ο συσχετισμός τους αναλύουν συχνά διοικητικούς μύθους Πολλές φορές ανώτεροι υπάλληλοι υποθέτουν ή/και θεωρούν ότι κάποια μέτρα μεταβάλλονται ενώ δεν είναι έτσι. Μερικές φορές υποθέτουν ή/και θεωρούν ότι τα μέτρα δεν μεταβάλλονται σε συνδυασμό με κάποια άλλα ενώ όμως συμβαίνει. Οι προβλέψεις προϋπολογισμών βασίζονται σε τέτοιες υποθέσεις. Η γνώση των παραγόντων που μεταβάλλονται ταυτόχρονα βελτιώνει την ακρίβεια πρόβλεψης. Οι καλύτερες προβλέψεις μπορούν να μειώσουν τον κίνδυνο από τις αποφάσεις. Το να είσαι σε θέση κανείς να ποσοτικοποιήσει το βαθμός συμεταβλητοτητας, αποκαλούμενος συσχετισμός, βοηθά τους υπεύθυνους να καταλάβουν εάν οι υποθέσεις είναι βάσιμες ή όχι. Η λέξη συσχετισμός δεν υπονοεί ή δεν σημαίνει, αιτιολογία. Ένας συσχετισμός απλά σημαίνει ότι δύο μετρήσεις τείνουν να μεταβάλλονται μαζί. Μια θετική, ένα προς ένα (1:1) συσχέτιση έχει έναν συντελεστή συσχέτισης + 1. Μια αρνητική συσχέτιση 1:1 έχει συντελεστή συσχέτισης –1. ∆εδομένου ότι όλα μεταβάλλονται, σπάνια βλέπουμε μια τέλεια συσχέτιση. Εάν βλέπετε ένα τέλειο συντελεστή συσχέτισης καλύτερα να αμφιβάλετε Ο παρακάτω πίνακας δείχνει το ΒΜΙ μιας ομάδας νεοπροσλαμβανόμενων υπάλληλων. Επειδή το καταγράφονται και ταξινομούνται τα στοιχεία 27

Page 28: Six Sigma Statistics

κατά ζεύγη είναι σε διαδοχική σειρά, μπορούμε να αναλύσουμε τα στοιχεία αυτά. Παρατηρήστε ότι κάθε πεδίο είναι ομοιογενές τα δε πεδία των στοιχείων δεν αναμιγνύονται μεταξύ τους

Η γραμμική σχέση μεταξύ των σημείων του συσχέτισης στον άξονα Χ( ΒΜΙ) και στον άξονα Υ(ηλικία) είναι σχεδόν στην περίπτωση αυτή σχεδόν τέλεια. Ο αριθμός συσχέτισης καλείται τιμή ρ. Με τη χρησιμοποίηση της ευθείας γραμμής για να συνδέσει τις τιμές ΒΜΙ στον άξονα Χ με τις τιμές ηλικίας στον άξονα Υ, ποια ήταν η τιμή ΒΜΙ όταν αυτός ο υπάλληλος είναι 22; Ποια θα ήταν η τιμή εάν αυτό ήταν 48; Εξετάζοντας το μέλλον, μια διαδικασία που καλείται extrapolation, θα πρόβλεπε την τιμή ΒΜΙ και την ανώτερη ηλικία; Η ηλικία ενός υπαλλήλου αναγκάζει την τιμή ΒΜΙ να αυξηθεί; ΟΧΙ. Αλλά, οι δύο μετρήσεις τείνουν να μεταβάλλονται μαζί. Όταν το ένα μεγαλώνει, μεγαλώνει και το άλλο. Αυτό είναι μια γραμμική σχέση, που περιγράφεται από την κεντρική μαύρη γραμμή. Είναι ένα εύκολο για ερμηνεία διάγραμμα. Εμπειρικά μια ισχυρή συσχέτιση ή μια σχέση έχει μια τιμή ρ εχει εύρος μεταξύ 0,85 έως 1, ή -0,85 έως –1. Σε μια μέτρια συσχέτιση, το ρ έχει εύρος από 0,75 έως 0,85 ή, -0,75 έωσ –0,85. Σε μια αδύνατη συσχέτιση, το ρ κυμαίνεται από 0,60 έως 0,74 ή –0,60 έως 0,74. Αν και μια τυχαία σχέση είναι ίση με, 0,00, οποιαδήποτε σχέση που έχει μια συσχετιση ρ που είναι κάτω από 0,59 δεν θεωρείται αξιόπιστος πρόβλεψης.

Η ακόλουθη γραφική παράσταση αλληλεπίδρασης δείχνει ότι τα άτομα που λαμβάνουν ένα υψηλό ποσό contrast δοκιμάζουν τους πιό μακροχρόνιους χρόνους φθοροσκόπησης. Άλλη μια φορά, το τετράγωνο στο κέντρο κάθε I-Beam αντιπροσωπεύει το μέσο όρο. Οι γραμμές στην κορυφή και το κατώτατο σημείο της I-Beam αντιπροσωπεύουν UCL καιLCL που τίθενται σε 2σ πάνω και κάτω από το μέσο όρο. Οι πιο σύντομοι χρόνοι φθοροσκόπησης ήταν στα άτομα που έλαβαν ένα χαμηλη ποσότητα contrast.

28

Page 29: Six Sigma Statistics

Η τρισδιάστατη γραφική παράσταση κύβων παρουσιάζει συμβολικά τη μέση, σταθερή απόκλιση, και τις πληροφορίες πιθανότητας τριών μεταβλητών ταυτόχρονα. Σημειώστε τη θέση που βρίσκονται και οι δύο πιο μακροχρόνιοι προβλεφθέντες,. ∆εν κάνει καμία διαφορά εάν ο παθολόγος είναι "β-" ή "β+." Και στις δύο περιπτώσεις οι προβλεφθέντες υψηλοί αριθμοί μειώθηκαν κατά μήκος των επιπέδων Α + (High Contrast) και του C- (Gender C μέση τιμή). Αυτό είναι ένα κλασικό παράδειγμα μιας προκατάληψης ως προς το φύλο στην καρδιολογία.

29