Tiếp theo bài dùng Chi-square và T-test hôm trước, bài này giới thiệu về cách dùng One-way ANOVA để thực hiện việc so sánh giữa các nhóm đối tượng. Trong các ví dụ hôm trước, ta có 2 nhóm đối tượng. Còn lần này, ta có 3 nhóm đối tượng trở lên với biến cần so sánh ở dạng scale. Ví dụ cụ thể như sau:
Tôi muốn tìm hiểu xem sinh viên ở nhiều ngành học khác nhau có khác nhau về mức độ sử dụng Yahoo! Messenger (YM) hay không. Với tình huống cụ thể của mình, tôi có thể tiếp cận được sinh viên 3 chuyên ngành: Văn, Tin, và Ngoại ngữ. Như vậy, tôi thiết kế bảng câu hỏi như sau:
- Khoanh tròn chuyên ngành mà bạn đang theo học: Văn - Tin - Ngoại ngữ
- Khoanh tròn mức độ sử dụng Yahoo! Messenger của bạn: Thường xuyên - Thỉnh thoảng - Đôi khi - Hiếm khi - Không bao giờ
Sau đó tôi phát bảng câu hỏi này cho sinh viên các ngành Văn, Tin, và Ngoại ngữ. Giả sử tôi thu được câu trả lời đầy đủ từ 400 bạn sinh viên. Tôi sẽ tiến hành nhập liệu như sau. Ở câu 1, nếu là Văn, tôi nhập 1; nếu Tin, tôi nhập 2; nếu là Ngoại ngữ, tôi nhập 3. Dĩ nhiên tôi có thể thay đổi các giá trị 1-2-3 này thành 4-7-9 hoặc bất kỳ giá trị nào khác mà không làm thay đổi cấu trúc dữ liệu vì các ngành học này ko có liên quan gì với nhau cả. Ở câu 2, nếu là Thường xuyên, tôi nhập 5; nếu là Thỉnh thoảng, tôi nhập 4; nếu là Đôi khi, tôi nhập 3; nếu là Hiếm khi, tôi nhập 2; và nếu là Không bao giờ, tôi nhập 1.
Như vậy, trong bảng số liệu, tôi sẽ có dạng như sau:
Bây giờ tôi tiến hành thực hiện Oneway ANOVA để so sánh mức độ thường xuyên trong việc sử dụng YM của sinh viên đang theo học 3 chuyên ngành kia. Trong SPSS 18, bắt đầu từ Analyze -- Compare Means -- Oneway ANOVA. Một khung hội thoại hiện lên. Tôi di chuyển biến Ngành (Major) vào ô Factor và biến sử dụng YM (UsingYM) vào ô Dependent List. Tiếp tục tôi click nút Options bên phải, và đánh dấu chọn vào mục Descriptive để biết thêm các chỉ số thống kê tổng quát. Xem hình bên dưới.
Sau đó tôi nhấn Continue và tiếp tục nhấn vào nút Post Hoc.... Trong này tôi chọn Turkey để xem thử có phát hiện thêm gì về sự tương đồng giữa các nhóm trong 3 nhóm sinh viên này hay không. Sau đó nhấn Continue. Xem hình bên dưới.
Tiếp tục tôi nhấn OK để thực hiện Oneway ANOVA. Kết quả cho ra 4 bảng, 2 bảng đầu như sau:
Bảng đầu tiên cho thấy mức độ trung bình về việc dùng YM của các nhóm, tức cột Mean. Nó cũng cho ta thấy SD và các chỉ số khác. Ở đây tôi tập trung vào bảng thứ 2 - ANOVA. Nhìn vào cột Sig., tôi thấy giá trị p là .000. Như vậy tôi có thể kết luận rằng 3 nhóm này có mức độ sử dụng YM khác nhau. Để biết thêm cho cụ thể, tôi nhìn vào 2 bảng tiếp theo như bên dưới.
Bảng Multiple Comparisons cho thấy các chỉ số so sánh chi tiết hơn. Nó hiển thị kết quả của việc so sánh 1 nhóm này với 2 nhóm còn lại. Nhìn vào các kết quả này, ta đều thấy có dấu * và dấu * này được chú thích ngay bên dưới, nói rằng các kết quả khác nhau này có ý nghĩa ở mức p=0.05. Có nghĩa là khác nhau.
Tôi tiếp tục nhìn vào bảng cuối cùng và thấy rằng cả 3 nhóm này đều được tách nhau ra riêng lẽ. Có nghĩa là chúng hoàn toàn khác nhau.
Như vậy tôi kết luận rằng giữa 3 nhóm này đều khác nhau về mức độ dùng YM. Những tests khác nằm trong phần này, để dành cho mỗi cá nhân chúng ta tự khám phá.
Các qui ước về giá trị p có thể đọc thêm ở nhiều nguồn khác nhau. Có thể tôi sẽ đề cập đến vấn đề này ở một bài viết nào đó sau này.
Lưu ý: Để thực hiện Oneway ANOVA, cần đảm bảo yêu cầu về distribution của sample.
- 37886 views