2.6.3. Hàm thống kê (Statistical functions)
Tác giả: Bùi Nguyễn Triệu Tường (BNTT - GPE)
Tổng hợp: ongtrungducmx25 (GPE)
Hàm DEVSQ()
Trả về tổng bình phương các sai lệch giữa các điểm dữ liệu từ
trung bình mẫu của chúng, rồi cộng các bình phương lại.
Cú pháp:
= DEVSQ(number1, number2)
Number1,
number2, ...
: Có thể có từ 1 đến 255 đối số. Cũng có thể dùng một mảng đơn hay
một tham chiếu mảng.
Lưu ý:
-
Nếu
các đối số là mảng hay tham chiếu có chứa các giá trị text, logic,
hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa
giá trị zero (0) thì vẫn được tính.

Ví dụ:
DEVSQ(4, 5, 8, 7, 11, 4, 3)
= 48
Sự phân bổ tần số là sự xuất hiện thường xuyên của một giá
trị nào đó trong một bảng dữ liệu.
Trong các bài trên, tôi có đưa ra một ví dụ là một bảng thống kê
những sản phẩm bị lỗi trong quá trình sản xuất tại một công ty.
Mời các bạn xem lại, trong bảng dữ liệu này có cột D, là số lượng
các sản phẩm bị lỗi (product defects).
Đếm các sản phẩm bị lỗi theo nhóm (xem hình sau), ta sẽ có:

Bảng thống kê này là một ví dụ của sự phân bổ tần số.
Hàm FREQUENCY()
Dùng để tính xem có bao nhiêu giá trị thường xuyên xuất hiện bên
trong một dãy giá trị, và trả về một mảng đứng các số. Trong giáo
dục, FREQUENCY() thường được dùng để đếm số điểm thi nằm trong một
dãy điểm nào đó, hoặc dùng để đếm (phân loại) học lực của học sinh
dựa vào điểm trung bình, v.v...
FREQUENCY() là một hàm cho ra kết quả là một mảng, do đó nó phải
được nhập ở dạng công thức mảng.
Cú pháp:
= FREQUENCY(data_array, bins_array)
data_array
: Mảng hay tham chiếu của một tập hợp các giá trị dùng để đếm số
lần xuất hiện. Nếu data_array không có giá trị, FREQUENCY()
trả về một mảng các trị zero (0).
bins_array
: Mảng hay tham chiếu chứa các khoảng giá trị làm mẫu, và các trị
trong data_array sẽ được nhóm lại theo các trị mẫu này. Nếu
bins_array không có giá trị, FREQUENCY() sẽ trả về số phần
tử trong data_array.
Lưu ý:
-
Số
phần tử trong data_array phải nhiều hơn số phần tử trong
bins_array 1 phần tử. Phần tử dôi ra này chứa số lượng các giá
trị lớn hơn khoảng lớn nhất. Ví dụ, khi đếm 3 khoảng giá trị đã
nhập trong 3 ô, phải chắc chắn rằng FREQUENCY() được nhập vào 4 ô;
ô thứ 4 này sẽ trả về số lượng các giá trị trong data_array
khi các gía trị này lớn hơn giá trị trong khoảng thứ 3. Để dễ hiểu
hơn, các bạn xem ở các ví dụ sau.
Ví dụ 1:
Để đếm tần số xuất hiện của các sản phẩm bị lỗi trong bảng sau,
tại K4:K7, nhập số muốn đếm, và tại L4:L8, nhập công thức mảng
{= FREQUENCY(D3:D22, K4:K7)}

Ví dụ 2:

Hàm GEOMEAN()
Trả về trung bình nhân của một mảng hoặc một dãy các số dương. Ví
dụ, có thể dùng GEOMEAN() để tính mức tăng trưởng trung bình.
Cú pháp:
= GEOMEAN(number1, number2, ...)
Number1,
number2 ...
: Có thể có từ 1 đến 255 đối số dùng để tính trung bình. Cũng có
thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số.
Lưu ý:
-
Nếu
các đối số là mảng hay tham chiếu có chứa các giá trị text, logic,
hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa
giá trị zero (0) thì vẫn được tính.

Ví dụ:
GEOMEAN({4, 5, 8, 7, 11, 4, 3})
= 5.476987
Hàm HARMEAN()
Trả về trung bình điều hòa của một dãy các số dương. Trung bình
điều hòa là nghịch đảo của trung bình cộng.
Cú pháp:
= HARMEAN(number1, number2, ...)
Number1,
number2 ...
: Có thể có từ 1 đến 255 đối số dùng để tính trung bình điều hòa.
Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa
số.
Lưu ý:
-
Nếu
các đối số là mảng hay tham chiếu có chứa các giá trị text, logic,
hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa
giá trị zero (0) thì vẫn được tính.

Ví dụ:
HARMEAN({4, 5, 8, 7, 11, 4, 3})
= 5.028376
Hàm KURT()
Trả về độ nhọn của tập dữ liệu. Độ nhọn được tính bằng cách lấy
moment thứ tư của trị trung bình chia cho độ lệch chuẩn lũy thừa
4. Độ nhọn biểu thị mức nhọn hay mức phẳng tương đối của một phân
phối so với phân phối chuẩn. Đô nhọn dương cho biết phân phối là
nhọn tương đối, độ nhọn âm cho biết phân phối là phẳng tương đối.
Cú pháp:
= KURT(number1, number2,...)
Number1,
number2, ...
: Có thể có từ 1 đến 255 đối số (với Excel 2003 trở về trước thì
con số này là 30) dùng cho KURT(). Cũng có thể dùng mảng đơn hay
tham chiếu mảng làm đối số cho hàm.
Lưu ý:

với s là độ lệch chuẩn.
Ví dụ:
KURT(3, 4, 5, 2, 3, 4, 5, 6, 4, 7)
= -0.1518
Hàm LARGE()
Trả về giá trị lớn nhất thứ k trong một tập số liệu. Có thể
dùng hàm này để chọn lựa giá trị dựa theo vị trí tương đối của nó.
Ví dụ, bạn có thể dùng hàm LARGE() để tính số điểm cao nhất, cao
thứ nhì, cao thứ ba, v.v...
Cú pháp:
= LARGE(array, k)
array
: Mảng hay dãy số liệu dùng để xác định giá trị lớn nhất thứ k
k
: Vị trí (tính từ giá trị lớn nhất) trong mảng hay dãy số liệu.
Lưu ý:
-
Giả
sử n là số lượng các số có trong array, thì LARGE(array,
1) trả về giá trị lớn nhất (MAX), và LARGE(array, n) sẽ
trả về giá trị nhỏ nhất (MIN).
Ví dụ:
Để xem số sản phẩm bị lỗi nhiều thứ hai (nhỏ hơn nhiều nhất) là
bao nhiêu trong danh sách sau, dùng công thức
= LARGE($D$3:$D$22)
ở ô I10

Ví dụ 2:

Top
|