Tiếp theo bài so sánh hôm trước, bài viết này giới thiệu cách so sánh giữa hai nhóm đối tượng khi biến cần so sánh ở dạng scale. Ví dụ cụ thể như sau:
Tôi muốn biết giữa Nam và Nữ có sự khác biệt về mức độ tham gia hoạt động Câu lạc bộ tiếng Anh ở trường hay không. Tôi đã thiết kế bảng câu hỏi như sau:
Hãy đánh dấu chéo vào câu trả lời của bạn cho các câu hỏi bên dưới:
Q1. Giới tính của bạn: Nam/Nữ
Q2. Khi trường bạn tổ chức Câu lạc bộ Tiếng Anh, bạn tham gia ở mức độ nào:
- Luôn luôn tham gia
- Thường tham gia
- Thỉnh thoảng tham gia
- Ít khi tham gia
- Hiếm khi hoặc không bao giờ
Sau đó tôi phát bảng câu hỏi này cho 300 bạn sinh viên trong trường chẳng hạn. Thu kết quả về, tôi nhập liệu như sau. Đối với câu 1, nếu là Nam, tôi nhập 1; nếu là Nữ, tôi nhập 2. Đối với câu 2, tôi nhập từ 5 đến 1, tương ứng với thứ tự như trong bảng câu hỏi. Nghĩa là nếu câu trả lời là Luôn luôn tham gia, thì tôi nhập 5; còn nếu Ít khi tham gia thì tôi nhập 2. Kết quả, tôi sẽ có bảng số liệu như sau:
Thẻ Variable View
Để ý trong thẻ Variable View này tôi chọn Measure cho Q2 là Scale vì những giá trị từ 1 đến 5 cho biến này có quan hệ tương đối với nhau.
Thẻ Data View ứng với 8 đối tượng tham gia đầu tiên:
Sau khi đã nhập liệu đầy đủ đối với 300 đối tượng. Tôi tiến hành thực hiện t-test. Sở dĩ tôi chọn t-test trong trường hợp này là vì tôi có 2 nhóm (Nam và Nữ) và một biến với data ở dạng scale cần để so sánh.
Tiến hành thực hiện t-test như sau. Trong SPSS 18, Analyze --- Compare Means --- Independent Samples T-Test. Khung t-test sẽ hiện ra. Sau đó tôi sẽ di chuyển biến cần so sánh vào ô Test Variable(s) ở phía trên. Trường hợp này là Q2. Rồi tôi di chuyển biến về nhóm vào ô Grouping Variable bên dưới. Trường hợp này là Q1. Sau đó tôi định nghĩa giá trị cho 2 nhóm trong ô Grouping Variable bằng cách nhấn nút Define Groups ngay bên dưới. Trong ô Group 1 tôi điền 1 (Giá trị tương ứng với Nam) và trong ô Group 2 tôi điền 2 (Giá trị tương ứng với Nữ). Sau đó nhấn Continue. Xem hình bên dưới.
Sau đó tôi tiếp tục nhấn vào Options và chọn Confidence Interval Percentage là 95% (thường thì đây là giá trị mặc định), rồi tiếp tục nhấn Continue để quay về hộp thoại chính rồi nhấn OK để chạy test. Kết quả cho ra tôi thu được 2 bảng như sau:
Ở bảng thứ nhất là các số liệu thống kê tổng hợp. Tôi không quan tâm nhiều lắm. Tôi quan tâm ở bảng thứ hai vì nó sẽ cho tôi biết là có sự khác biệt giữa Nam và Nữ về mức độ thường xuyên trong việc tham gia hoạt động Câu lạc bộ tiếng Anh ở trường hay không.
Nhìn vào cột bên trái, tôi quan tâm đến dòng Equal variances assumed và đối chiếu qua cột Sig đầu tiên (tức nằm trong cột Test for Equality of Variance), tôi thấy giá trị này là .907. Giá trị này lớn hơn .05, do vậy tôi sẽ quan tâm đến giá trị Sig. ở dòng đầu tiên của cột t-test for equality of means. Giá trị này là .000, là một số nhỏ hơn .05. Do vậy tôi kết luận rằng có sự khác nhau giữa Nam và Nữ về mức độ thường xuyên tham gia hoạt động CLB của trường.
Trường hợp nếu giá trị .907 này là một số nhỏ hơn hoặc bằng .05 thì tôi sẽ tiếp tục quan sát giá trị Sig ở dòng Equal variances not assumed (dòng thứ 2) và xét giá trị ở cột Sig (2-tailed) thuộc cột t-test for Equality of Means.
Bài tiếp theo tôi sẽ nói về test dùng để so sánh biến dạng scale như thế này nhưng áp dụng với 3 nhóm đối tượng trở lên.
Lưu ý: Để thực hiện t-test, cần đảm bảo yêu cầu về distribution của sample.
- 36999 views