Số trung bình số trung vị tứ phân vị mốt của mẫu số liệu ghép nhóm và cách tìm chương trình mới THPT 2018 lớp 11
1. Số trung bình của mẫu số liệu ghép nhóm:
Nhóm $[a_1 ; a_2)$ $[a_i ; a_{i+1})$ $[a_k ; a_{k+1})$
Tần số $m_1$ $\ldots$ $m_i$ $\ldots$ $m_k$ \\
Bảng 3.2
Số trung bình của mẫu số liệu ghép nhóm kí hiệu là $\bar{x}$.
$$
\bar{x}=\frac{m_1 x_1+\ldots+m_k x_k}{n}
$$
trong đó, $n=m_1+\ldots+m_k$ là cỡ mẫu và $x_i=\frac{a_i+a_{i+1}}{2}$
(với $i=1, \ldots, k$ ) là giá trị đại diện của nhóm $\left[a_i ; a_{i+1}\right)$.
Ý nghĩa. Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu gốc, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
Cho mẫu số liệu ghép nhóm như trong Bảng 3.2.
Để tính trung vị của mẫu số liệu ghép nhóm, ta làm như sau:
Bước 1. Xác định nhóm chứa trung vị. Giả sử đó là nhóm thứ $p:\left[a_p ; a_{p+1}\right)$.
Bước 2. Trung vị là $M_e=a_p+\frac{\frac{n}{2}-\left(m_1+\ldots+m_{p-1}\right)}{m_p} \cdot\left(a_{p+1}-a_p\right)$, trong đó $n$ là cỡ mẫu, $m_p$ là tần số nhóm $p$. Với $p=1$, ta quy ước $m_1+\ldots+m_{p-1}=0$.
Ví dụ 2. Thời gian (phút) truy cập Internet mỗi buổi tối của một số học sinh được cho trong bảng sau:
Thời gian (phút) $[9,5 ; 12,5)$ $[12,5 ; 15,5)$ $[15,5 ; 18,5)$ $[18,5 ; 21,5)$ $[21,5 ; 24,5)$
Số học sinh 3 12 15 24 2
Tính trung vị của mẫu số liệu ghép nhóm này.
Giải
Cỡ mẫu là $n=3+12+15+24+2=56$.
Gọi $x_1, \ldots, x_{56}$ là thời gian vào Internet của 56 học sinh và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là $\frac{x_{28}+x_{29}}{2}$. Do 2 giá trị $x_{28}, x_{29}$ thuộc nhóm [15,5; 18,5) nên nhóm này chứa trung vị. Do đó, $p=3 ; a_3=15,5 ; m_3=15 ; m_1+m_2=3+12=15 ; a_4-a_3=3$ và ta có
$$
M_e=15,5+\frac{\frac{56}{2}-15}{15} \cdot 3=18,1
$$
Ý nghĩa. Trung vị của mẫu số liệu ghép nhóm xấp xỉ cho trung vị của mẩu số liệu gốc, nó chia mẫu số liệu thành hai phần, mỗi phần chứa $50 \%$ giá trị.
3. Tứ phân vị của mẫu số liệu ghép nhóm:
Để tính tứ phân vị thứ nhất $Q_1$ của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa $Q_1$, giả sử đó là nhóm thứ $p$ : $\left[a_p ; a_{p+1}\right)$. Khi đó,
$$
Q_1=a_p+\frac{\frac{n}{4}-\left(m_1+\ldots+m_{p-1}\right)}{m_p} \cdot\left(a_{p+1}-a_p\right),
$$
trong đó, $n$ là cỡ mẫu, $m_p$ là tần số nhóm $p$, với $p=1$ ta quy ước $m_1+\ldots+m_{p-1}=0$.
Để tính tứ phân vị thứ ba $Q_3$ của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa $Q_3$. Giả sử đó là nhóm thứ $p$ : $\left[a_p ; a_{p+1}\right)$. Khi đó,
$$
Q_3=a_p+\frac{\frac{3 n}{4}-\left(m_1+\ldots+m_{p-1}\right)}{m_p} \cdot\left(a_{p+1}-a_p\right),
$$
trong đó, $n$ là cỡ mẫu, $m_p$ là tần số nhóm $p$, với $p=1$ ta quy ước $m_1+\ldots+m_{p-1}=0$.
Tứ phân vị thứ hai $Q_2$ chính là trung vị $M_e$.
Ví dụ 3. Tìm tứ phân vị thứ nhất $Q_1$ và tứ phân vị thứ ba $Q_3$ của mẫu số liệu ghép nhóm cho trong Ví dụ 2.
Giải
Cỡ mẫu là $n=56$.
Tứ phân vị thứ nhất $Q_1$ là $\frac{x_{14}+x_{15}}{2}$. Do $x_{14}, x_{15}$ đều thuộc nhóm $[12,5 ; 15,5)$ nên nhóm này chứa $Q_1$. Do đó, $p=2 ; a_2=12,5 ; m_2=12 ; m_1=3, a_3-a_2=3$ và ta có
$$
Q_1=12,5+\frac{\frac{56}{4}-3}{12} \cdot 3=15,25
$$
Với tứ phân vị thứ ba $Q_3$ là $\frac{x_{42}+x_{43}}{2}$. Do $x_{42}, x_{43}$ đều thuộc nhóm $[18,5 ; 21,5)$ nên nhóm này chứa $Q_3$. Do đó, $p=4 ; a_4=18,5 ; m_4=24 ; m_1+m_2+m_3=3+12+15=30 ; a_5-a_4=3$ và ta có
$$
Q_3=18,5+\frac{\frac{3.56}{4}-30}{24} \cdot 3=20 .
$$
Nhận xét. Ta cũng có thể xác định nhóm chứa tứ phân vị thứ $r$ nhờ tính chất: có khoảng $\left(\frac{r \cdot n}{4}\right)$ giá trị nhỏ hơn tứ phân vị này.
Ý nghĩa. Các tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ cho các tứ phân vị của mẫu số liệu gốc, chúng chia mẫu số liệu thành 4 phần, mỗi phần chứa $25 \%$ giá trị.
4. Mốt của mẫu số liệu ghép nhóm:
Để tìm mốt của mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:
Bước 1. Xác định nhóm có tần số lớn nhất (gọi là nhóm chứa mốt), giả sử là nhóm j: [a; $a_{j+1}$ ).
Bước 2. Mốt được xác định là: $M_o=a_j+\frac{m_j-m_{j-1}}{\left(m_j-m_{j-1}\right)+\left(m_j-m_{j+1}\right)} \cdot h$ trong đó $m_j$ là tần số của nhóm $j$ (quy ước $m_0=m_{k+1}=0$ ) và $h$ là độ dài của nhóm.
Lưu ý. Người ta chỉ định nghĩa mốt cho mẫu ghép nhóm có độ dài các nhóm bằng nhau. Một mẫu có thể không có mốt hoặc có nhiều mốt.
Khi tần số của các nhóm số liệu bằng nhau thì mẫu số liệu ghép nhóm không có mốt.
Ý nghĩa. Mốt của mẫu số liệu ghép nhóm xấp xỉ cho mốt của mẫu số liệu gốc, nó được dùng để đo xu thế trung tâm của mẫu số liệu.
Ví dụ. Bảng số liệu ghép nhóm sau cho biết chiều cao $(\mathrm{cm})$ của 50 học sinh lớp 11A.
Khoảng chiều cao $(\mathrm{cm})$ $[145 ; 150)$ {$[150 ; 155)$} $[155 ; 160)$ $[160 ; 165)$ $[165 ; 170)$
Số học sinh 7 14 10 10 9
Tính mốt của mẫu số liệu ghép nhóm này. Có thể kết luận gì từ giá trị tính được?
Giải
Tần số lớn nhất là 14 nên nhóm chứa mốt là nhóm [150; 155). Ta có, $j=2, a_2=150, m_2=14$, $m_1=7, m_3=10, h=5$. Do đó
$$
M_o=150+\frac{14-7}{(14-7)+(14-10)} \cdot 5 \approx 153,18 .
$$
Số học sinh có chiều cao khoảng $153,18 \mathrm{~cm}$ là nhiều nhất.