kuliah 1 science statistics-stis.ppt
DESCRIPTION
statistikTRANSCRIPT
Who am I ?
Given name : MOHAMMAD DOKHI
Call name : Do-Q
Family Name: OrTegA
M.Sc. : Statistics (Hiroshima University)
Ph.D. : Medical Science (Hiroshima Univ.)
Today’s talking
Perkenalan
Pentingnya statistika sebagai science
Definisi formal statistik
Prinsip prosedur statistik
Contoh penelitian statistik
Pemilihan metode statistik yang cocok
Textbook Utama ?
Survival Analysis – A Self Learning text
(Second Edition)
David G. Klienbaum
Michel Klein
Statistician ?
Who are you? Statistician dengan konsentrasi aplikasi
Focus of this lecturers: Statistics for researcher
Statistika potensial untuk diaplikasikan di segala bidang ilmu lain sebagai alat analisis data
More collaboration of statistics
StatistikaEkonomi
Ekonometrika
Statistika Social
Sosiometrika
StatistikaPsikologi
Psikometrika
An important fact of statistics
Top 20 discoveries in science most changed our lives since 1900
Hasil survey sebuah Science magazine th 1984 dgn respondent para “the leading US scientists”
Antibiotics The laser
Atomic fission Networks
The big bang theory Pesticides
Birth control pill Plant breeding
Blood types Plastics
The computer Statistics
DNA The Taung skull
Drugs for mental illness Television
Einstein’s theory of relativity
The transistor
The IQ test The vacuum cleaner
More important fact of statistics
Statistics berkontribusi pada hampir semua penemuan di atas:
•Test IQ menggunakan statistics sbg alat analisis datanya
•Data dari plant breeding experiment juga dianalisa dengan statistik
•Efect dari penicillin dan antibiotika lainnya pada manusia juga dipelajari dengan menggunakan statistik
•Effect dari pill anti hamil dan mental illness juga dipelajari dengan membandingkan ukuran2 statistik pada kontrol group dan experiment group
•Professional hampir di semua bidang kehidupan manusia, menggunakan statistics untuk menganalisa data
H.G. Wells: Berfikir secara statistik suatu hari nanti akan menjadi kebutuhan seperti keahlian membaca dan menulis
Statistics as a science
Berdasarkan fakta di atas, statistics adalah tool/alat analisis data bagi para scientist di bidang ilmu lain dalam melakukan penelitian
Dilihat dari sudut pandang matematika/statistika, bisa dikatakan bahwa tujuan akhir dari semua research atau scientific analysis adalah untuk merumuskan/menemukan pola hubungan matematik antar variables of interest
Contoh:
Dokter mungkin ingin mengetahui pola hubungan antar beberapa variable seperti umur, berat badan, tinggi badan, jenis kelamin dan tekanan darah pasien
Ekonom mungkin tertarik untuk meneliti bagaimana pengaruh tingkat pendidikan, jenis kelamin, jenis pekerjaan terhadap penghasilan tenaga kerja
Ahli kependudukan pengaruh tingkat pendidikan, jenis kelamin, jenis pekerjaan thd fertilitas perempuan usia subur
Ahli epidemiology ingin mengetahui pengaruh cara bergaul, lingkungan tempat tinggal, lingkungan kerja, frekuensi berhubungan seksual thd kemungkinan seseorang terkena AIDS
Formal definition of statistics?
Statistics/Statistika :
Ilmu yang mempelajari cara-cara pengumpulan, pengolahan dan penyajian data, serta inferensi (penarikan kesimpulan) berdasarkan data empirik yang ada
• Statistika deskripsi : pengumpulan, pengolahan, penyajian data dengan menghitung ukuran-ukuran data, penyajian tabel-tabel data, visualisasi pola data dengan menggunakan grafik
• Statistika inferensi : melakukan penarikan kesimpulan tentang population of interest berdasarkan sampel atau data empik yang ada
Statistic/Statistik :
Ukuran data yang dihitung dari sampel/data empirik (produk dari penelitian sampel)
Steps penelitian statistics
Definisikan populasi
Pada level Populasi asumsikan model matematik ttg hubungan antar variabel
of interet
Lakukan satistical experiment
Untuk memberikan batasan dari obyek penelitian
Distribusi prob. terotis (Normal, binomial, multinomial dll…………..)
• Pengambilan sampel
• Pengukuran variable
• Diskripsikan data
• Inferensi : Estimasi & Uji hipotesa
Contoh asumsi hub variabel pada level populasi
Technique Mathematical model
Yields
Linear Regression
Y=B1X + Bo (linear)
Linear changes
Logistic Regression
Ln(P/1-P)=B1X+Bo (Logit model)
Odds ratios
Survival Analyses
h(t) = ho(t)exp(B1X+Bo)
Hazard rates
Assumtion
Technique Predictor Variables
Outcome Variable
Censoring permitted?
Linear Regression
Categorical or continuous
Normally distributed
No
Logistic Regression
Categorical or continuous
Binary (except in polytomous log.
regression)
No
Survival Analyses
Time and categorical or
continuous
Continuous Yes
Experimen Statistik
Populasi (N)
Sampel
(n)
Parameter
Statistik
Asumsi
Kalkulasi
Am
bil s
am
pel E
stim
asi
& U
ji
Idealnya penelitian dilakukan dengan cara sensus yaitu mencakup seluruh obyek penelitian (seluruh anggota populasi penelitian diamati/diteliti) contoh sederhana rata-rata umur mhswa/i dalam kelas
Prinsip prosedur statistika:
Alasan sampel:
Alasan sampel
Menarik kesimpulan tenteng populasi yang menjadi obyek penelitian dengan menggunakan informasi yang berasal dari sampel
• Effisiensi: waktu, tenaga, biaya
• Sensus bersifat destruktif
• Populasi tak terbatas
• Populasi terbatas tapi tidak mungkin dilakukan sensus
In some case
Populasi (N)
Sampel
(N)
Hubungan matematik
antar variabel of interest
Pendugaan parameter
model
Asumsi
Kalkulasi
Est
imasi
& U
ji
Inferensi model hub. matematik menggunakan data empirik
Statistical experiment?
Populasi?
Sampel/sampel random?
Variabel /variabel random ?
Unit observasi?
Beberapa pengertian
Besaran yang nilainya berubah-ubah sesui dengan hasil pengukuran di dalam suatu experiment disebut variabel random jika perubahan nilainya bersifat acak/random
Element populasi yang langsung menjadi obyek pengamatan/ penelitian
Kesuruhan obyek/unit yang menjadi sasaran dalam suatu penelitian/experiment
Sebagian dari populasi yang diambil sebagai wakil dari populasi tersebut dalam pelaksanaan prosedur statistik disebut sampel random jika jika pengambilan sampelnya dilakukan scr acak/random
Pelaksanaan prosedur statistik: pengambilan sampel, pengukuran/wawancara, estimasi, penarikan kesimpulan
Sebuah contoh: epidemiology
Ingin diketahui faktor-faktor yang mempengaruhi kemungkinan suatu wilayah kelurahan di DKI Jakarta terkena wabah DB
Populasi penelitian?
Seluruh unit kelurahan di DKI Jakarta
Variabel of interest ?
• Berapa kali kelurahan tersebut terkena DB
• Pernah/tidaknya di kel. terjadi wabah DB
• Lokasi kelurahan (dilalui sungai/non sungai)
• Kepadatan penduduk
• Ada tidaknya kawasan kumuh (ada/tidak)
• Jarak ke lokasi TPS
• Etc….Unit observasi ?
Area kelurahan
Respond variabel
Census is possible
Sebuah contoh: epidemiology
Ingin diketahui faktor-faktor yang mempengaruhi kemungkinan seseorang terkena DB di wilayah DKI
Populasi penelitian?
Seluruh penduduk di wilayah DKI Jakarta
Variabel of interest ?
• Status individu yang diamati (pernah kena DB/tidak)
• Lokasi kelurahan (dilalui sungai/non sungai)
• Kepadatan penduduk
• Jumlah anggota rumah tangga
• Kondisi rumah tempat tinggal
• Tinggal di kawasan kumuh/tidak (ya/tidak)
• Etc….Unit observasi ?
Individu respondent Census is possible
but not efficient
How statistician conduct the research?
• Berdasar subyek masalah susun dugaan-dugaan awal penelitian (Hipotesis penelitian)
• Definisikan dugaan model hubungan matematik antara variabbel respond dengan variabel penjelas
• Lakukan pengambilan sampel
• Hitung besaran-besaran statistik
• Check dugaan-dugaan awal tsb dengan analisis diskriptif (tabel,grafik)
Berdasrakan data sampel lakukan inferensi statistik (Confident interval dan uji hipotesis statistik untuk menjawab hipotesis penelitian)
Statistical research
Sebuah contoh: medical research
Ingin diketahui faktor prognosis yang memengaruhi daya tahan pasien demam berdarah di wilayah DKI Jakarta
Populasi penelitian?
Seluruh pasien DB yang tinggal di wilayah DKI Jakarta
Variabel of interest ? • Durasi waktu mulai dari terkena DB sampai dengan meninggal
atau sampai batas waktu tertentu
• Status pasien (meninggal/hidup)
• Umur pasien
• Jenis kelamin
• Jumlah sel darah merah pada saat diagnosis
• Punya riwayat penyakit dalam/tidak
• Metode pengobatan (Etc…..)Unit observasi ?
Pasien DB di wilayah DKI Jakarta
Census is not
possible
Type of Variable
Dalam penelitian mengenai prognosis faktor neuroblastoma, variabel of interest-nya bisa kita kelompokkan sbb:
• Daya tahan hidup pasien
• Status pasien hidup/mati
• Umur pasien
• Jenis kelamin
• Jumlah sel darah merah
• Metode pengobatan
• e.t.c ….
Variabel respond/tetapoutcome/dependent
Variabel prediktor/tidak tetap/ regressor/independent
Y
X
Tipe dan sifat data
Data : hasil pengukuran variabel pada penelitian statistika
• Daya tahan hidup pasien
• Status pasien hidup/mati
• Umur pasien
• Jenis kelamin
• Jumlah sel darah merah
• Metode pengobatan
• Stadium DB
Tipe : numerik, sifat : continuous
Tipe : kategorik, sifat : nominal
Tipe : numerik, sifat : continuousTipe : kategorik, sifat : nominal
Tipe : numerik, sifat : continuous/ diskrit
Tipe : kategorik, sifat : nominal
Tipe : kategorik, sifat : ordinal
Data set (Himpunan data)
Data hasil pengukuran biasanya disajikan dalam bentuk tabel data yang sering disebut sebagai dataset
No. pasie
n
status Daya tahan
(minggu)
Jenis kelamin
Umur (tahun)
…….
1 0 - L 12,6 …
2 1 25,5 P 25,3 …
3 1 12,0 L 15.9 …
4 0 - P 45,2 …
… … … … … …
Multivarite dataset : dataset yang memuat banyak variabel
Bivariate dataset : dataset yang hanya memuat 2 variabel
Univariate dataset : dataset yang hanya memuat 1 variabel
How to chose the statistical methods
• Statistika sebagai alat analisis data memiliki banyak pilihan metode
• Secara matematik metode yang sudah adapun potensial untuk dikembangkan sesuai dengan kebutuhan modern data analisis
• Pemilihan metode yang akan digunakan didasarkan pada:
1. Tujuan penelitian yang ingin dicapai
2. Didasarkan pada tipe dan sifat variabel dependent/respond
Kebanyakan hipotesis penelitian adalah ingin membuktikan hubungan antar variabel:
•Hubungan searah dari X ke Y Regression analysis
•Hubungan dua arah antara Y dan X Correlation analysis
How to chose the statistical methods
Dalam penelitian mengenai prognosis faktor neuroblastoma, kemungkinan variabel respond-nya adalah:
Daya tahan hidup pasien
Status hidup/mati pesien
Y={0,1} Regresi logistik
Y={0≤y≤∞}
Y={0≤y≤∞}
Pilih pasien yang statusnya meninggal saja, gunakan analisis regresi linear
Seluruh pasien yg masih hidup dan sudah meninggal dianalisi, gunakan survival analysisSurvival
Analysis
Others name for Survival Analysis
Event History Analysis
Duration analysis
Transition analysis
Time to failure analysis
Reliability analysis
Analisis tahan hidup
Analisis uji hidup
Time to event analysis
Next talking
Basic concept of survival analysis
Kaplan-Meier survival curve