sampling dis 2560 - @@ home - kku web hosting(*sampling distribution=การแจกแจงค...

24
Sampling Distribution การแจกแจงค่าสถิติ (การแจกแจงค่าตัวอย่าง) ผู้ช่วยศาสตราจารย์นิคม ถนอมเสียง สาขาวิชาวิทยาการระบาดและชีวสถิติ คณะสาธารณสุขศาสตร์ มหาวิทยาลัยขอนแก่น Email [email protected] web http://home.kku.ac.th/nikom

Upload: others

Post on 04-Aug-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

Sampling Distributionการแจกแจงค่าสถิติ

(การแจกแจงค่าตวัอย่าง)

ผู้ชว่ยศาสตราจารย์นิคม ถนอมเสยีงสาขาวชิาวทิยาการระบาดและชีวสถิติ

คณะสาธารณสุขศาสตร์ มหาวทิยาลัยขอนแก่นEmail [email protected]

web http://home.kku.ac.th/nikom

Page 2: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

After studying this chapter, the student will1. be able to construct a sampling distribution of

a statistic.2. understand how to use a sampling distribution to

calculate basic probabilities.3. understand the central limit theorem and when

to apply it.4. understand the basic concepts of sampling with

replacement and without replacement.

Page 3: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

การแจกแจงค่าสถิติ* หมายถึงการแจกแจง ของค่าที่

เป็นไปได้ทั้งหมด (ค่าเฉลี่ยของค่าสถิติบางอย่าง เช่น

ค่าเฉลี่ย ความแปรปรวน) ที่ได้จากการสุ่มตัวอย่าง

หลายๆ ครั้ง จากประชากรเดียวกัน(*sampling distribution=การแจกแจงค่าตัวอย่าง;

พจนานุกรมศัพท์สถิติศาสตร์ ฉบับราชบัณฑิตยสภา, 2558)

การสร้างการแจกแจงค่าสถิติ

1. สุ่มตัวอย่างที่เป็นไปได้ทั้งหมด n ราย จากประชากร N

2. คํานวณค่าที่สถิติที่สนใจ ในแต่ละกลุ่มตัวอย่าง

3. แสดงตาราง ประกอบด้วยค่าสถิติ และความถี่

Page 4: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

Sampling Distribution

Heart Rate ของประชากร

μ2

= 66

= 8

62 62 62 62

64 64 64 64

66 66 66 66

68 68 68 68

70 70 70 70

Page 5: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

Sampling Distribution

Heart Rate ของประชากร ตัวอย่าง

68 70

626666 64

70

สุ่ม

2/8

662

X

8

662

68 70

6266

6464

สุ่ม

8

662

x…

…62 62 62 62

64 64 64 64

66 66 66 66

68 68 68 68

70 70 70 70

Page 6: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

Sampling Distributionถ้าไม่ทราบข้อมูลประชากร เราจะเดา

ค่าเฉลี่ยของประชากร จากอะไร68 70

626866 64

62จากค่าเฉลี่ยของตัวอย่าง

= ?s = ?

X

62 62 62 62

64 64 64 64

66 66 66 66

68 68 68 68

70 70 70 70

Page 7: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

คํานวณค่าพารามิเตอร์

N

x

N

xN

ii

N

ii

1

2

21)(

;

ตัวอย่าง การศึกษาเกี่ยวกับ Heart rate 5 คน (N) ในชุมชน

แห่งหนึ่งได้แก่ x1=62, x2=64, x3=66, x4=68, x5=70

85

)6670()6668()6666()6664()6662(

665

7068666462

222222

Page 8: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

62 64 66 68 70

62 62,62

(62)

62,64

(63)

62,66

(64)

62,68

(65)

62,70

(66)

64 64,62

(63)

64,64

(64)

64,66

(65)

64,68

(66)

64,70

(67)

66 66,65

(64)

66,64

(65)

66,66

(66)

66.68

(67)

66,70

(68)

68 68,62

(65)

68,64

(66)

68,66

(67)

68,68

(68)

68,70

(69)

70 70,62

(66)

70,64

(67)

70,66

(68)

70,68

(69)

70,70

(70)

- สุ่มตัวอยา่งที่เป็นไปได้ทั้งหมด 2 ราย จากประชากร 5 ราย (N)

- คํานวณค่าที่สถิติที่สนใจ ในแต่ละกลุ่มตัวอยา่ง

Page 9: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

- แสดงตาราง ประกอบด้วยค่าสถิต ิและความถี่- นําค่าเฉลี่ยมาแจกแจงความถี่ เรียกว่า “Sampling

Distribution of Mean”

X ความถี่ ความถี่สัมพันธ์

62 1 1/25

63 2 2/25

64 3 3/25

65 4 4/25

66 5 5/25

67 4 4/25

68 3 3/25

69 2 2/25

70 1 1/25

Page 10: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

การแจกแจงของประชากร

การแจกแจงค่าสถิติของค่า x

Page 11: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

นําค่าเฉลี่ยมาคํานวณค่าเฉลี่ยเรียกว่า

เพราะฉะนั้น ค่าเฉลี่ยของตวัอยา่งเทา่กับ

ค่าเฉลี่ยของประชากร

x

6625

70...636362

n

ix N

x

x

Page 12: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

คํานวณค่าความแปรปรวนของค่าเฉลี่ย

425

)6670(..)6662(

)(

22

2

n

xix

Nx

2x

4282

2 nx

Page 13: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย

เพราะฉะนั้น ส่วนเบี่ยงเบนมาตรฐานของ sampling

distribution คือ

เรียกว่า “Standard Error of the mean”

nn

n

x

x

2

22

nx

x

Page 14: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

แบบไม่ใส่คืน

ค่า เท่ากับ

ค่า เท่ากับ

ถ้าขนาดตัวอย่างโต finite population ~ 1

x x

1.

22

NnN

nx

Finite population

2x

nx

Page 15: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

- เมื่อมีการสุ่มเพยีง 1 ครัง้ การประมาณที่ดีที่สุด

ของคา่เฉลี่ยประชากรคอื ค่าเฉลี่ยของตวัอยา่ง

- และเนื่องจากว่าการศึกษาส่วนใหญ่ไม่ทราบ

ค่าส่วนเบี่ยงเบนมาตรฐานของประชากรดังนั้นประมาณ

ค่า standard error จาก

nsSE

n

xx

n

ii

1

Page 16: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

2x

2x

2x

2x

ดังนั้น เมื่อข้อมูลมีการแจกแจงแบบปกติ

ถ้าเราสุ่มตัวอย่าง

จากประชากร

D:\prob\normal2.gif

2;

1x2x 3x

2; xx

2x

Page 17: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

เมื่อข้อมูลมีการแจกแจง

แบบอื่นๆ เมื่อ n ใหญ่

x 22x

Central Limit Theorem

Given a population of any nonnormal functional form with a mean and finite variance 2 the sampling distribution of computed from

samples of size n From this population, will have mean and

variance 2/n and will be approximately normally distributed when

the sample size is large.

Page 18: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

we are assured of at least an approximately normally

distributed sampling distribution under three conditions:

(1) when sampling is from a normally distributed population;

(2) when sampling is from a nonnormally distributed

population and our sample is large; and

(3) when sampling is from a population whose functional

Form is unknown to us as long as our sample size

is large.

Page 19: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

- The logical question that arises at this point is,

- How large does the sample have to be in order for the

central limit theorem to apply?

- There is no one answer, since the size of the sample

needed depends on the extent of nonnormality present in

the population.

- One rule of thumb states that, in most practical situations,

a sample of size 30 is satisfactory.

(Daniel,W.W. (2000). BIOSTATISTICS A Foundation for Analysis in the Health Sciences. 9th,

p.141)

Page 20: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

การประยุกต์ใช้ Sampling distribution

- การคํานวณค่าความน่าจะเป็นของคา่เฉลี่ยของตัวอย่าง เช่น

- ถ้าทราบค่าเฉลี่ยของตวัอยา่ง ( ) สามารถเปลี่ยน

เปน็ค่า Z ได้ดังนี้ (ซึ่งจะนําไปใช้ในการทดสอบสมมุติฐาน

และการประมาณค่าตอ่ไป)

n

XZ

X

Page 21: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

ตัวอย่าง

ตัวแปรความดันโลหติ systolic มีการแจกแจง N~(120,1600)

ถ้าสุ่มตัวอยา่งมา 20 คน จงหาความน่าจะเป็นที่ systolic BP

(1) มีค่าเฉลี่ย อยู่ระหว่าง 100-120 mmHg

(2) มีค่าเฉลี่ย มากกว่า 137 mmHg

ตัวแปรความดันโลหติ systolic มีการแจกแจงแบบปกติ

มีค่าเฉลี่ย = 120 mmHg;

ความแปรปรวนเท่ากบั 1600 mmHg2 หรอื

(ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 40 mmHg)

Page 22: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

20/40120120

20/40120100 Z

วิเคราะห์ด้วย Stata. di normal((120-120)/(40/sqrt(20))).5. di normal((100-120)/(40/sqrt(20))).01267366. di .5-.01267366.48732634

. di normal((120-120)/(40/sqrt(20)))-normal((100-120)/(40/sqrt(20)))

.48732634

1. X ระหว่าง 100 ถึง 120วิธีทํา 1. (100<X<120) แปลงเป็น Z ดังนี้

2. หาค่าจะเป็นจาก Z = P(-2.24<Z< 0) = 0.4873

หรือ

100 120 X

-2.24 0 Z

Page 23: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

2. x > 135 mmHgวิธีทํา 1. X>135 แปลงเป็น Z ดังนี้

2. หาความนา่จะเป็นจากค่า Z = P(Z>1.677051)=0.0468

677051.120/40120135

Z

วิเคราะห์ด้วย Stata

. display 1-normal((135-120)/(40/sqrt(20)))

.04676626

1.677051 Z

135 x

Page 24: sampling dis 2560 - @@ Home - KKU Web Hosting(*sampling distribution=การแจกแจงค าต วอย าง; พจนาน กรมศ พท สถ ต ศาสตร

Sampling distribution ของการแจกแจงแบบอื่นๆ-เช่น Binomial

ค่าสัดส่วน

-ทางปฏิบัตจิะใช้ค่า SE วิเคราะห์ในการทดสอบสมมุติฐานหรือ

การประมาณค่าต่อไป

-SE ที่กล่าวมาเป็นส่วนหนึ่งเท่านั้น ในการวิเคราะหเ์พื่อทดสอบ

สมมตุิฐานหรือการประมาณค่าขึ้นอื่นๆ SE แตกต่างออกไป

nxp

npppse )1()(