Tuong Quan Pearson La Gi Phan Tich He So Tuong Quan Pearson

September 3, 2020

Phân tích tương quan Pearson đóng vai trò rất quan trọng trong quá trình nghiên cứu và thực hiện các phân tích định lượng SPSS. Tuy nhiên, còn khá nhiều người chưa biết tới khái niệm này, ý nghĩa của nó ra sao, cách thực hiện như thế nào.

Trong bài viết dưới đây, Tri Thức Cộng Đồng chuyên xử lý dữ liệu SPSS sẽ chia sẻ đến bạn những kiến thức cơ bản và đầy đủ nhất về hệ số tương quan Pearson. 

1. Tương quan Pearson là gì?

Trong nghiên cứu thống kê, hệ số tương quan dùng để chỉ mối quan hệ giữa các biến. Những biến có quan hệ với nhau đặt trong một điều điều kiện cụ thể thay vì mối quan hệ mang tính tuyệt đối trong mọi trường hợp. 

Điều này có nghĩa là, với điều kiện này, hai biến cụ thể có thể có mối liên hệ với nhau chứ không phải trong bất cứ trường hợp nào, hai biết này cũng có chung một mối quan hệ. 

Khi nhắc đến hệ số tương quan thì ta ngầm hiểu và mặc định rằng đó là tương quan Pearson. Tương quan Pearson được coi như cách tốt nhất để đo lường mối quan hệ giữa các biến với nhau. 

Bằng việc thực hiện hàng loạt các thao tác thống kê như ước lượng điểm, giải thích, dự báo, ước lượng độ tin cậy và tính hợp lý, tương quan Pearson có thể cung cấp thông tin về mức độ quan trọng của mối liên hệ, hoặc mối tương quan cũng như hướng của mối quan hệ. 

Ngoài ra, nó cũng có thể xác lập cũng như kiểm tra các mô hình có có chứa các biến tiềm ẩn và các biến có thể đo lường được. 

2. Phân tích hệ số tương quan Pearson

Hệ số tương quan Pearson ký hiệu là r. Theo quy tắc, phân tích hệ số Pearson sẽ đưa ra một đường thẳng phù hợp nhất tương ứng với mối quan hệ tuyến tính của hai biến cụ thể. Từ đường thẳng này có thể kết luận được mức độ quan trọng trong mối quan hệ giữa hai biến. 

Hệ số tương quan Pearson (r) luôn nằm trong khoảng giá trị từ +1 đến -1. Điều kiện xác định để tương quan có thể xảy ra là giá trị sig. <0.05. Lúc này sẽ có 3 trường hợp xảy ra: 

  • r < 0: hai biến có mối tương quan tỉ lệ nghịch với nhau. Nếu giá trị của biến này giảm thì giá trị của biến kia sẽ tăng lên.  
  • r = 0: hai biến không có mối tương quan nào với nhau.
  • r > 0: hai biến có mối tương quan tỉ lệ thuận với nhau. Nếu giá trị của một biến tăng, giá trị của biến còn lại cũng sẽ tăng và ngược lại. 

Công thức tính hệ số tương quan Pearson như sau: 

Trong đó x, y là hai biến cần xác định tương quan, n là số mẫu. 

Để đánh giá hệ số tương quan Pearson trong SPSS, bạn chọn trên thanh công cụ ta mục Analyze > Correlate > Bivariate.

Lúc này, màn hình mở cửa sổ Bivariate Correlations, nơi bạn sẽ chỉ định các biến được sử dụng trong phân tích. Tất cả các biến trong tập dữ liệu của bạn xuất hiện trong danh sách ở phía bên trái. Để chọn các biến cho phân tích, chọn các biến trong danh sách bên trái và nhấp vào nút mũi tên để di chuyển chúng sang phải, trong trường Variables.

(A) Variables: Các biến được sử dụng trong Tương quan Pearson bivariate. Bạn phải chọn ít nhất hai biến liên tục, nhưng có thể chọn nhiều hơn hai biến. Thử nghiệm sẽ tạo ra các hệ số tương quan cho từng cặp biến trong danh sách này. Lưu ý: Bạn nên sắp xếp biến phụ thuộc nằm trên cùng trong bảng Variables.

(B) Correlation Coefficients: Có nhiều loại hệ số tương quan. Theo mặc định, Pearson được chọn. 

(C) Test of Significance: Nhấp vào Two-tailed hoặc One-tailed, tùy thuộc vào thử nghiệm ý nghĩa mong muốn của bạn. SPSS sử dụng thử nghiệm two-tailed theo mặc định.

(D) Flag significant correlations: Kiểm tra tùy chọn này sẽ bao gồm các dấu sao (**) bên cạnh các tương quan có ý nghĩa thống kê trong đầu ra.

Cuối cùng là nhấp OK để xuất kết quả ra output. 

3. Ý nghĩa hệ số tương quan Pearson

Dưới đây là bảng kết quả Correlations:

Đầu tiên, khi nhìn vào bảng kết quả Correlations, bạn cần quan tâm đến giá trị sig. 

- Đối với dòng giá trị sig. được tô màu cam: Giá trị nào < 0.05 thì ta kết luận rằng biến độc lập có tương quan tuyến tính với biến phụ thuộc và ngược lại (giá trị nào > 0.05 thì không có sự tương quan giữa biến độc lập và biến phụ thuộc). 

Lưu ý, chúng ta sẽ dựa trên sự so sánh giá trị sig. với mức ý nghĩa 0.05 để đánh giá sự tương quan giữa cặp biến chứ không loại biến không đạt và chạy lần 2.

Sau khi đánh giá xong sự tương quan giữa cặp biến, ta sẽ dựa vào giá trị r để đánh giá mức độ tương quan mạnh/ yếu giữa biến phụ thuộc và các biến độc lập theo ý nghĩa hệ số tương quan pearson đã nêu ở phần trên.

- Đối với dòng giá trị sig. được tô màu hồng: Giá trị ở dòng này thể hiện cho sự tương quan giữa các biến độc lập với nhau. Chúng ta cũng xét tương tự như đối với đánh giá sự tương quan giữa biến độc lập và biến phụ thuộc. Tuy nhiên, nếu như r > 0.4 và sig. < 0.05 thì bạn cần lưu ý đến việc xảy ra đa cộng tuyến.


Trên đây là những kiến thức cơ bản và đầy đủ nhất về tương quan Pearson trong nghiên cứu định lượng SPSS. Hy vọng qua bài viết này, bạn đã có thể nắm được định nghĩa, cách phân tích cũng như đọc ý nghĩa của hệ số Pearson. 

Nếu như bạn vẫn còn những thắc mắc cần giải đáp, hãy liên hệ với Tri Thức Cộng Đồng thông qua SĐT: 0946 88 33 50 hoặc Email: ttcd.group@gmail.com để được trợ giúp ngay hôm nay.

Grow your business.
Today is the day to build the business of your dreams. Share your mission with the world — and blow your customers away.
Start Now