topic - essentialoil.wu.ac.th · regression analysis regression analysis applies to paired data...

9
AG060-310 Applied Statistics for Ago-Industry Topic Correlation and Regression By Associate Professor Dr. Narumol Matan Food Science and Technology School of Agricultural Technology Walailak University 1/2019

Upload: others

Post on 31-Oct-2019

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

AG060-310 Applied Statistics for Ago-Industry

Topic

Correlation and Regression

By

Associate Professor Dr. Narumol Matan

Food Science and Technology School of Agricultural Technology

Walailak University 1/2019

Page 2: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Correlation and Regression Distinguished It should be apparent that correlation and regression procedures have some features in common and as a result are often confused. The classic regression situation involves one dependent variable and one or more independent variable. The independent variable is the variable that is controlled or manipulated by a researcher so that its effect on a dependent variable can be determined.

Figure 1 Scatterplots illustrating various degrees of correlation ที่มา: https://www.mathsisfun.com/data/correlation.html Various schemes have been suggested to help students interpret correlation coefficients. A common but misleading scheme is the classification of certain r values as “very high” (r0.90), “high” (r=0.70-0.89), “medium” (r=0.30-0.69) or “low” (r=0.30). This will be illustrated for the concepts of reliability and validity, two desirable characteristics of psychological test. One type of reliability, called test-retest reliability, is determined by administering a test to a group of participants, waiting a suitable period of time and then readministering the test to the same participants. A nonzero correlation coefficient simply means that there is a concomitant relationship between X and Y that is variation in one variable is associated in some way with variation in the other. In addition, a different correlation measure called correlation ration have been developed for determining the strength of association between nonlinearly related variable

Page 3: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Example 1 Compute scatterplots and r use (Weight) and (ac: arm circumference) Ho: Ha: 1. Open the file below

Click--- Graphs—legacy dialogs—scatter

Weight Arm

Page 4: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Output

…………………………………………………………………………………………………………………………………………………………

Simple Scatter

add weight into Y Axis and arm circumference into X Axis--OK

Page 5: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… 2. For Correlation Select Analyze—correlation—bivariate

Select---weight and arm circumference to Variables—select Options—select Means and standard deviations-Continue--OK

Select---Person (Quantitative data) Select--- Kendall’s Tau-b (Ordinal scale)

Page 6: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Select--- Spearman (Non-parametric) Output

Conclusion......................................................................................................................................................... ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………………………………………………

r value

Page 7: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Regression analysis

Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance, and Y is the dependent variable with values Y1 that are free to vary. However, regression procedures also are applicable when both X and Y are free to vary, as they are in correlation. For r+1 or -1, the dependent variable, denoted by Y, can be predicted from the independent variable, X, with perfect accuracy. If, however, r is equal to zero, a knowledge of X is useless in predicting Y. Although a correlation coefficient is indicative of our ability to predict, the actual predication is made using regression analysis. 1 Simple Regression Example 1 From correlation data Ho: Ha: Select---- Analyze—regression—Linear

Page 8: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

Conclusion......................................................................................................................................................... ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………………………………………………

Select--- arm circumference into Dependent and select Weight into Independent --OK

Page 9: Topic - essentialoil.wu.ac.th · Regression analysis Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance,

แบบฝึกหัด 1 จงหาค่า Correlation และสมการ Regression ระหว่างค่าของ mch (คือ ค่าเฉลี่ยของน ้าหนักฮีโมโกลบินที่มีอยู่ในเม็ดเลือดแดง มีหน่วยเป็นพิโคกรัม) และค่า mcv (ค่าเฉลี่ยของปริมาตรเม็ดเลือดแดงที่มีหน่วยเป็น เฟมโตลิตร) ที่วัดได้จากผู้ตอบแบบสอบถาม 2 จากสมการที่ได้จากข้อ 1 จงบอกสมการที่ใช้ท้านาย และจงบอกว่ามาว่าหากมีการวัดค่า mch ได้ 29.5 พิโคกรัม จงใช้สมการในการค้านวณค่า mcv ที่ได้จากสมการ และสมการดังกล่าวมีความถูกต้องมากน้อยเพียงใด 3 จงหาค่า Correlation และสมการ Regression ระหว่างค่าของ weight ค่า hip (ความยาวรอบสะโพกหน่วยเป็นเซนติเมตร) และค่า arm circumference ที่วัดได้จากผู้ตอบแบบสอบถาม 3 จากข้อ 3 จงอธิบายมาว่าสมการที่ได้จากวิธีการ Enter วิธี Backward วิธี Forward วิธี Stepwise มีความเหมือนแตกต่างกันหรือไม่อย่างไร

4 จากสมการได้จากข้อ 3 จงบอกสมการที่ใช้ท้านายค่า weight ที่ดีที่สุด และหากวัดค่า hip ได้ 101 และค่า arm circumference =31 จงท้านายค่า weight โดยใช้สมการดังกล่าว ทั งนี ค่าที่ค้านวณได้จากสมการมีความถูกต้องมากน้อยเพียงใด 5 จากข้อ 3 จงอธิบายมาว่าสมการที่ได้จากวิธีการ Enter วิธี Backward วิธี Forward วิธี Stepwise มีความเหมือนแตกต่างกันหรือไม่อย่างไร