Cách tính yếu vị

Yếu vị (Mode) là gì? Ưu điểm và nhược điểm của yếu vị

Yếu vị (tiếng Anh: Mode) là số hay giá trị xuất hiện thường xuyên nhất trong một bộ dữ liệu hay một tập dữ liệu.

Yếu vị

Khái niệm

Yếu vị trong tiếng Anh là Mode.

Một tập hợp các số có thể có một hoặc nhiều hơn một yếu vị hoặc không có yếu vị nào cả. Các khái niệm thống kê phổ biến khác theo xu hướng đo lường trung tâm gồm có giá trị trung bình hay bình quân của một tập dữ liệu và trung vị, giá trị nằm ở giữa trong một tập dữ liệu.

Yếu vị có thể có cùng giá trị với giá trị trung bình và trung vị, nhưng không phải lúc nào cũng đúng như vậy.

Hiểu hơn về yếu vị

Trong thống kê, dữ liệu được phân phối theo nhiều cách khác nhau. Phân phối thường được nhắc đến nhất là phân phối chuẩn cổ điển (đường cong hình chuông). Trong phân phối này và một số phân phối khác, giá trị trung bình (bình quân) rơi vào điểm ở giữa, đây cũng là nơi có tần số của các giá trị quan sát được cao nhất. Đối với các phân phối này, giá trị trung bình cũng là yếu vị hay giá trị xuất hiện thường xuyên nhất trong bộ dữ liệu.

Trong các phân phối khác, giá trị xuất hiện thường xuyên nhất có thể khác với giá trị trung bình. Ví dụ, tần suất trung bình cho những người sinh ra với sáu ngón tay là khoảng 0,2%, nhưng yếu vị ở trường hợp này bằng không vì kết quả xuất hiện phổ biến nhất vẫn là năm ngón tay.

Ví dụ về Yếu vị

Trong danh sách các số dưới đây, 16 là yếu vị vì nó xuất hiện nhiều lần trong tập dữ liệu này hơn bất kì số nào khác:

3, 3, 6, 9, 16, 16, 16, 27, 27, 37, 48

Một tập hợp các số có thể có nhiều hơn một yếu vị (nếu có hai yếu vị thì được gọi là bimodal) nếu có nhiều số xuất hiện với tần số bằng nhau và nhiều lần hơn các yếu vị khác trong tập hợp.

3, 3, 3, 9, 16, 16, 16, 27, 37, 48

Trong ví dụ trên, cả số 3 và số 16 đều là yếu vị vì mỗi số xuất hiện ba lần và không có số nào khác trong chuỗi xuất hiện thường xuyên hơn.

Nếu không có số nào trong một tập hợp số xuất hiện nhiều lần, thì tập hợp đó không có yếu vị:

3, 6, 9, 16, 27, 37, 48

Một tập hợp các số có hai yếu vị là bimodal, một tập hợp các số có ba yếu vị là trimodal và một tập hợp các số có bốn nút trở lên là multimodal.

Ưu điểm và nhược điểm của yếu vị

Ưu điểm của yếu vị:

– Dễ hiểu và dễ tính toán.

– Không bị ảnh hưởng bởi các giá trị ngoại lai.

– Dễ dàng xác định trong các dữ liệu chưa được gộp và phân phối có tần số rời rạc.

– Hữu ích cho dữ liệu định tính.

– Có thể tính toán với bảng tần số không giới hạn.

– Có thể được xác định bằng hình ảnh.

Nhược điểm của yếu vị:

– Không được định nghĩa rõ ràng.

– Không tạo thành dựa trên tất cả các giá trị trong tập dữ liệu.

– Chỉ ổn định cho số lượng giá trị nhiều và sẽ không được xác định rõ ràng nếu dữ liệu chỉ có một số lượng nhỏ các giá trị.

– Không có khả năng sử dụng tính toán thêm.

– Đôi khi dữ liệu có một hoặc nhiều yếu vị hoặc không có yếu vị nào cả.

Các ý chính

– Trong thống kê, yếu vị là giá trị được quan sát thấy tần suất xuất hiện nhiều nhất trong một tập hợp dữ liệu.

– Đối với phân phối chuẩn, yếu vị có cùng giá trị với giá trị trung bình và trung vị.

– Trong nhiều trường hợp, giá trị của yếu vị sẽ khác với giá trị trung bình.

TÓM TẮT MỘT SỐ CÔNG THỨC SỬ DỤNG TRONG HỌC PHẦN NGUYÊN LÝ THỐNG KÊ KINH TẾ

Số yếu vị

Trong ngành Thống kê mô tả, yếu vị (tiếng Anh: mode) của một danh sách dữ liệu hoặc một mẫu là giá trị của phần tử có số lần xuất hiện lớn nhất trong danh sách. Ví dụ, yếu vị của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6. Khác với số bình quân số học giản đơn, yếu vị không nhất thiết phải là duy nhất. Một danh sách dữ liệu hoặc mẫu có thể có một yếu vị (unimodal), hai yếu vị (bimodal), ba yếu vị (trimodal)… hoặc thậm chí không có yếu vị nào.

Yếu vị đặc biệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy (thường khi dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xác định. Ví dụ, yếu vị của {táo, táo, chuối, cam, cam, cam, đào} là cam.

Phân biệt các giá trị yếu vị, trung vị, và bình quân trong một phân bố xác suất.

Trong một phân phối chuẩn (đồ thị hình chuông), yếu vị nằm tại đỉnh. Do đó, yếu vị là giá trị đại diện nhất cho phân bố. Ví dụ, nếu ta đo chiều cao và cân nặng của mọi người, các giá trị này sẽ tạo thành một phân bố hình cái chuông úp, đỉnh của đường cong hình chuông này sẽ là chiều cao và cân nặng phổ biến nhất của mọi người. Số bình quân thường bị ảnh hưởng bởi các điểm ngoài hoặc độ xiên và có thể nằm xa đỉnh của phân bố. Như vậy, số bình quân không phải là một đại diện tốt bằng giá trị cho đa số người.

Yếu Vị Số Học

Yếu vị số học thường dùng để chỉ giá trị hay xuất hiện nhất trong tập dữ liệu mẫu. Nói cách khác, nó chính là giá trị mang tính kiểu mẫu với tần số xuất hiện cao nhất. Nó thường được ký hiệu bởi Mo hoặc Mode.

Chúng ta sẽ đi sâu vào các phương pháp tính toán yếu vị số học cho ba nhóm:

  • Nhóm dữ liệu độc lập
  • Nhóm dữ liệu rời rạc
  • Nhóm dữ liệu liên tục

Nhóm dữ liệu độc lập

Khi dữ liệu được cung cấp theo hướng độc lập. Dưới đây là một ví dụ về nhóm độc lập:

Nhóm rời rạc

Khi dữ liệu được đưa ra kèm với tần suất xuất hiện của chúng. Dưới đây là một ví dụ về nhóm rời rạc:

Nhóm liên tục

Khi dữ liệu được đưa ra theo dạng khoảng kèm theo tần suất xuất hiện của chúng. Dưới đây là một ví dụ về nhóm liên tục:

Trả lời

Email của bạn sẽ không được hiển thị công khai.