informational statistics 데이터가주어진경우(givendata)(given...
TRANSCRIPT
![Page 1: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/1.jpg)
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석
모비율추론•데이터가주어진경우에도 n(시행회수), x(성공회수)을
예제 데이터 NOTEBOOK.xls•노트북평가 95% 신뢰구간경 ( 행 ), (성공 )
구하면신뢰구간을구할수 있다.
•가설검정, p-value 계산
모평균 추론
평
•작년 75점보다높아졌나?
hnu
.ac.
kr Cha
pte•이상치진단
표본크기(?)
tp://
wol
fpa
ck.h er 3. U
sing R (U
이상치진단
대표본 (CLT) n > 20~30 소표본 n≤20
htt niva
riate D
ata
대 본 ( )
(1)이상치 진단 나무상자 그림(이상치 제거)
(1)이상치 진단나무상자 그림
(이상치 제거)
(2)치우침 진단 Ana
lysis)
T d Mi i
( )치우침 진단히스토그램/정규성 검정
(변수변환)
(37)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Today MissionWord 문서: “이름 20081029.doc”
![Page 2: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/2.jpg)
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
이상치 제거 95% 신뢰구간
hnu
.ac.
kr Cha
pte
•이상치 4개를제외하고상자-수염그림을그린다. 이상치가다시나타나면계속제외한다.
tp://
wol
fpa
ck.h er 3. U
sing R (U
치우침 진단•정규성검정
• 귀무가설 정규분포를 따른다 (좌우대칭)
가설검정•귀무가설:작년수준인 75점이다.
•대립가설: 75점 이상이다. 작년보다높다
htt niva
riate D
ata
• 귀무가설: 정규분포를 따른다. (좌우대칭)
• 대립가설: 정규분포를 따르지 않는다. (치우침)
Ana
lysis)
귀무가설 채택 정규분포를 따른다•유의확률=0.000119, 귀무가설기각작년보다높다.
(38)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
• 귀무가설 채택: 정규분포를 따른다.,
![Page 3: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/3.jpg)
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
모분산 추론이상치 제거 및 정규성 검정 이후 실시
데이터 CEO.xls미국 기업 20개 기업 자본, CEO 연봉 데이터이상치 제거 및 정규성 검정 이후 실시
• In Editor window
미국 기업 20개 기업 자본, CEO 연봉 데이터
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
•미국기업 CEO 연봉의 95% 신뢰구간을구하시오.
htt niva
riate D
ata
Upcoming Assignment
공모전 참여 (deadline: 2008.11.21) Ana
lysis)
공모전 참여 (deadline: 2008.11.21)
• http://hnu.kr/new/081024-contest/
학술제 연극 참여?
(39)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
![Page 4: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/4.jpg)
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
우로 치우쳐 있다고 가정하고 치우침 해결
• X3, X2, √,Log
•작년 CEO 평균임금은 1,200이었다. 작년에비해 CEO 임급이낮아졌다고할수 있나?
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
•귀무가설(작년과동일하다, 1200이다) 채택, 작년보다낮아졌다고할수없다.
htt niva
riate D
ata
•변수변환한데이터를이용하여가설검정하시오.
2008.10.30 Mission (변수변환의경우)미국기업자본의 95% 신뢰구간을구하시오
Ana
lysis) •신뢰구간이좁아진다. 동일한신뢰수준인데…
•미국기업자본의 95% 신뢰구간을구하시오.
•작년자본이 85,000이었다. 자본이작년에비해낮아졌다고할수있나?
• R 프로그램
(40)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
![Page 5: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/5.jpg)
Informational StatisticsScatterScatter plotplot
HW10 #1ScatterScatter plotplot
산점도•두변수간함수관계를나타내는 2차원그래프
HW10 due 11.05 BLS.xlsHW10 (due 11.05.2008) BLS.xls
• x-축: 설명변수, y-축: 종속변수
선형함수 linear function (일차식 1st order)• Y=a+bx+e, e=오차
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
htt niva
riate D
ata
S=707+0.004815*C
Ana
lysis)
(41)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
![Page 6: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/6.jpg)
Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105
HW10 #2 Quality.XLS
HWHW#10 more due 2008.11.05.#10 more due 2008.11.05.HW10 #3 Auto.XLS
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
htt niva
riate D
ata
Ana
lysis)
4. Can we say actual miles before the transmission failure is greater than 70,000? α=0.05
(42)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
![Page 7: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/7.jpg)
Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105HWHW#10 more due 2008.11.05.#10 more due 2008.11.05. HW10 #4 HW10 #5
The data shows the additional sleeping time gained by using two different sleeping pills, DEXTRO and LAEVO.
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
(1)
htt niva
riate D
ata
(2)
Ana
lysis)
(3) Using the results of (1) and (2), How can you say which one is better for sleeping help?
(f) Draw a Dot plot and star for this data.
(43)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
sleeping help?
![Page 8: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given](https://reader031.vdocuments.us/reader031/viewer/2022011906/5f35120bfa97306afc2a8b08/html5/thumbnails/8.jpg)
Informational StatisticsDot and Star PlotDot and Star PlotDot and Star PlotDot and Star Plot
점 도표•개체별로관측치의값을출력한다.
Star plot•개체별로관측치의값을스타 형태로출력한다.
•개체값(observation)을 개체이름포함한시각적표현
형
•개체값(observation)을 개체이름으로시각표현
Anhe ser B sch
CEO Salary
hnu
.ac.
kr Cha
pte1500
2000 2500 3000 3500 Anheuser‐Busch
AT&TCharles Schwab
Chevron
D P tS Mi t
Texaco
US WestWalt Disney
tp://
wol
fpa
ck.h er 3. U
sing R (U
0 500
1000 DuPont
General Elec.
GilletteQualcomm
Schering‐Plough
Sun Microsystems
htt niva
riate D
ata
IBM
Johnson & JohnsonKimberly‐Clark
Merrill LynchMotorola
Philip Morris
Procter & Gamble
Ana
lysis) •엑셀에서그린것임.
•여러분은 R에서그리는방법을아나요? 슬라이드 #4 (f)을
(44)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
( )위해스스로발견하시오.