TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRONG MÔ HÌNH PHÂN TÍCH ...

Tải bản đầy đủ (.pdf) (8 trang)
  1. Trang chủ
  2. >>
  3. Khoa Học Tự Nhiên
  4. >>
  5. Toán học
TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRONG MÔ HÌNH PHÂN TÍCH THỒNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.05 MB, 8 trang )

TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRON GMÔ HÌNH PHÂN TÍCH THỒNG KÊĐẶNG VĂN ĐÀNGHệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tươngquan giữa hai biến số, như giữa độ mặn (x) và độ PH (y). Hệ số tương quancó giá trị từ -1 đến 1. Bằng 0 (hay gần 0) có nghĩa là hai biến số không có liênhệ gì với nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số cómột mối liên hệ tuyệt đối.1. Giới thiệu:Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quangiữa hai biến số, như giữa độ mặn (x) và độ PH (y)[3].- Hệ số tương quan không (r) có đơn vị, có thể tính từ giá trị mã hóa bằngphép biến đổi tuyến tính của x và y.- Hệ số tương quan có giá trị từ -1 đến 1. Bằng 0 (hay gần 0) có nghĩa là haibiến số không có liên hệ gì với nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩalà hai biến số có một mối liên hệ tuyệt đối.- Nếu giá trị của hệ số tương quan là âm (r 0) có nghĩa là khi x tăng cao thìy cũng tăng, và khi x tăng cao thì y cũng giảm theo.Có nhiều hệ số tương quan trong thống kê, sau đây là 3 hệ số tương quanthông dụng nhất:Page 1-Hệ số tương quan Pearson r-Hệ số tương quan Spearman ρ-Hệ số tương quan Kendall τ2. Các hệ số tương quan:2.1.Hệ số tương quan PearsonCho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tínhbằng công thức sau đây:HoặcTrong đó vàlà giá trị trung bình của biến số x và y.Để ước tính hệ số tương quan giữa độ tuổi dman và dph, chúng ta có thể sửdụng hàm cor(x,y) như sau:> cor(dman, dph)[1] 0.936726Chúng ta có thể kiểm định giả thiết hệ số tương quan bằng 0 (tức hai biến x vày không có liên hệ). Phương pháp kiểm định này thường dựa vào phép biến đổiFisher mà R đã có sẵn một hàm cor.test để tiến hành việc tính toán.> cor.test(dman, dph)Pearson's product-moment correlationdata: dman and dpht = 14.971, df = 19, p-value = 5.694e-12Page 2alternative hypothesis: true correlation is not equal to 095 percent confidence interval:0.9025175 0.9839818sample estimates:cor0.96013212.2.Hệ số tương quan SpearmanHệ số tương quan Pearson chỉ hợp lí nếu biến số x và y tuân theo luật phânphối chuẩn. Nếu x và y không tuân theo luật phân phối chuẩn, chúng ta phải sửdụng một hệ số tương quan khác tên là Spearman, một phương pháp phân tích phitham số. Hệ số này được ước tính bằng cách biến đổi hai biến số x và y thành thứbậc (rank), và xem độ tương quan giữa hai dãy số bậc.Do đó, hệ số còn có tên Spearman’s Rank correlation. R ước tính hệ số tươngquan Spearman bằng hàm cor.test với thông số method=”spearman” như sau:> cor.test(dman, dph, method="spearman")Spearman's rank correlation rhodata: dman and dphS = 78.1582, p-value = 5.405e-11alternative hypothesis: true rho is not equal to 0sample estimates:rho0.94924792.3.Hệ số tương quan KendallHệ số tương quan Kendall (phương pháp phi tham số) được ước tính bằng cáchtìm các cặp số (x, y) song song với nhau. Một cặp (x, y) được định nghĩa là hiệuPage 3(độ khác biệt) trên trục hoành có cùng dấu hiệu (dương hay âm) với hiệu trên trụctung.Nếu hai biến số x và y không có liên hệ với nhau, thì số cặp song song bằnghay tương đương với số cặp không song song.Có nhiều cặp phải kiểm định, phương pháp này đòi hỏi thời gian xữ lý củamáy tính khá cao. Tuy nhiên, nếu bộ dữ liệu dưới 5000 mẫu thì máy tính có thểtính toán khá dễ dàng.R dùng hàm cor.test với thông số method=”kendall” để ước tính hệ số tươngquan Kendall:> cor.test(dman, dph, method="kendall")Kendall's rank correlation taudata: dman and dphz = 5.013, p-value = 5.358e-07alternative hypothesis: true tau is not equal to 0sample estimates:tau0.88035893. Mục tiêu của phân tích hệ số tương quan:Ước tính hệ số tương quan:3.1.3.2.Page 4-Covariance có đơn vị đo lường (X*Y).-Correlation coefficient(r) giữa X và Y là một hệ số không có đơn vị đo lường.-r được định nghĩa:Kiểm định giả thuyết r = 0:Giả thuyết vô hiệu: H0, r = 0 và HA, r ≠ 0.Fisher ‘s z-transformation: r  z, z =Tính phương sai của z:Dùng kiểm định t:SE(z) =t=12ln⁡(1+𝑟1−𝑟) [4]1√𝑛−3𝑧𝑆𝐸(𝑧)4. Thực nghiệm:Bảng theo dõi của 1 hộ dân sản xuất tôm sú theo từng năm trong cùng mộtthời điểm về môi trường nước: liên quan đến nồng độ PH và nồng độ mặn trongnước như sau:X: nồng độ PH (thang đo lôgarít của tính axít. Ví dụ, dung dịch có pH=8,2 sẽ cóđộ hoạt động [H+] (nồng độ) là 10−8.2 mol/L, hay khoảng 6,31 × 10−9 mol/L)Y: nồng độ mặn (tính trên phần nghìn – số gram muối trên 1kg nước)NĂMXYNĂMXYNĂMXY19945.5420016.0520085.8519956.5620026.3620096.4619966.4620036.8720106.9719976.0520046.6720116.6619986.5620057.8820126.3619996.7720066.4620135.9520007.5820077.1720146.46Bảng 1: Nồng độ PH và nồng độ mặnCâu hỏi đặt ra:o Có mối tương quan nào giữa nồng độ PH và nồng độ mặn trong môitrường nước hay không?o Nếu có thì mối tương quan đó có ý nghĩa thống kê hay không?Quá trình thực hiện:Page 5Bước 1: Xác định hệ số tương quan[2][3]Từ bảng số liệu trên ta tính trung bình mẫu như sau:x = 136.4 / 21 = 6.45y = 129 /21 = 6.14= 848.4 – 21*6.45*6.14 = 10.514=891.78 - 21*(6.45)2 = 5.829=813 – 21*(6.14)2== 20.57110.95Suy ra:= 10.514 / 10.95 = 0.96Như vậy 0 attach(dat)> plot(dman~dph,pch=16)> abline(lm(dman~dph),col="red",lwd=2)Hình 1: Biểu đồ hồi quy tuyến tính của độ PH so với độ mặnPage 7> cor.test(dman,dph)Kiểm tra r=0? Nếu r=0, giả thuyết vô hiệu đúng không tương quan 2 biến sốNếu r#0, bát bỏ giả thuyết vô hiệu có tương quan 2 biến sốPearson's product-moment correlationP-value 2. V. T. T. Lộc, “Phương pháp hồi qui và tương quan”, Phân tích dữ liệu đơn biến đa biến, />3. N. V. Tuấn, “Phân tích tương quan”, Chương trình huấn luyện y khoa – Lâm sàn thống kê, />4. Carolyn J. Anderson,” Fisher ‘s z-transformation” , Correlation Edpsy 580, />Page 8

Tài liệu liên quan

  • Tìm hiểu về hồ sơ hưởng chế độ ốm đau, hưởng chế độ thai sản Tìm hiểu về hồ sơ hưởng chế độ ốm đau, hưởng chế độ thai sản
    • 15
    • 1
    • 1
  • TÌM HIỂU VỀ  VPN - CÀI ĐẶT THỰC NGHIỆM MÔ HÌNH VPN EXTRANET TÌM HIỂU VỀ VPN - CÀI ĐẶT THỰC NGHIỆM MÔ HÌNH VPN EXTRANET
    • 82
    • 500
    • 0
  • TÌM HIỂU VỀ NGÂN HÀNG TRUNG ƯƠNG TRONG LỊCH SỬ VÀ QUAN ĐIỂM VỀ MỐI QUAN HỆ GIỮA NẠN THẤT NGHIỆP VỚI LƯỢNG TIỀN CUNG ỨNG TÌM HIỂU VỀ NGÂN HÀNG TRUNG ƯƠNG TRONG LỊCH SỬ VÀ QUAN ĐIỂM VỀ MỐI QUAN HỆ GIỮA NẠN THẤT NGHIỆP VỚI LƯỢNG TIỀN CUNG ỨNG
    • 3
    • 761
    • 0
  • Tìm hiểu về hệ thống thông tin di động thế hệ thứ tư (4g) Tìm hiểu về hệ thống thông tin di động thế hệ thứ tư (4g)
    • 31
    • 558
    • 0
  • Tài liệu Tìm hiểu về hệ màu CMYK ppt Tài liệu Tìm hiểu về hệ màu CMYK ppt
    • 3
    • 598
    • 1
  • Tìm hiểu về hệ thống camera doc Tìm hiểu về hệ thống camera doc
    • 4
    • 456
    • 4
  • tìm hiểu về hệ thống chương cất tìm hiểu về hệ thống chương cất
    • 11
    • 410
    • 0
  • Tìm hiểu về hệ thống treo phụ thuộc pdf Tìm hiểu về hệ thống treo phụ thuộc pdf
    • 10
    • 1
    • 15
  • Tìm hiểu về `hệ thống tuần hoàn xăng` trên ôtô ppt Tìm hiểu về `hệ thống tuần hoàn xăng` trên ôtô ppt
    • 6
    • 409
    • 0
  • TÌM HIỂU VỀ HỆ THỐNG ĐIỆN CỦA IEEE (Understanding Electric Power Systems) TÌM HIỂU VỀ HỆ THỐNG ĐIỆN CỦA IEEE (Understanding Electric Power Systems)
    • 231
    • 1
    • 0

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

(1.05 MB - 8 trang) - TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRONG MÔ HÌNH PHÂN TÍCH THỒNG KÊ Tải bản đầy đủ ngay ×

Từ khóa » Hệ Số Tương Quan Spearman Là Gì