2.6. Ham thong ke

2.6.3. Hàm thống kê (Statistical functions)

Tác giả: Bùi Nguyễn Triệu Tường (BNTT - GPE)
Tổng hợp: ongtrungducmx25 (GPE)

Hàm DEVSQ()

Trả về tổng bình phương các sai lệch giữa các điểm dữ liệu từ trung bình mẫu của chúng, rồi cộng các bình phương lại.

Cú pháp: = DEVSQ(number1, number2)

Number1, number2, ... : Có thể có từ 1 đến 255 đối số. Cũng có thể dùng một mảng đơn hay một tham chiếu mảng.

Lưu ý:

Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số.

Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính.

DEVSQ() được tính theo công thức sau đây:

Ví dụ:

DEVSQ(4, 5, 8, 7, 11, 4, 3) = 48

Sự phân bổ tần số là sự xuất hiện thường xuyên của một giá trị nào đó trong một bảng dữ liệu.
Trong các bài trên, tôi có đưa ra một ví dụ là một bảng thống kê những sản phẩm bị lỗi trong quá trình sản xuất tại một công ty. Mời các bạn xem lại, trong bảng dữ liệu này có cột D, là số lượng các sản phẩm bị lỗi (product defects).
Đếm các sản phẩm bị lỗi theo nhóm (xem hình sau), ta sẽ có:

Bảng thống kê này là một ví dụ của sự phân bổ tần số.

Hàm FREQUENCY()

Dùng để tính xem có bao nhiêu giá trị thường xuyên xuất hiện bên trong một dãy giá trị, và trả về một mảng đứng các số. Trong giáo dục, FREQUENCY() thường được dùng để đếm số điểm thi nằm trong một dãy điểm nào đó, hoặc dùng để đếm (phân loại) học lực của học sinh dựa vào điểm trung bình, v.v...
FREQUENCY() là một hàm cho ra kết quả là một mảng, do đó nó phải được nhập ở dạng công thức mảng.

Cú pháp: = FREQUENCY(data_array, bins_array)

data_array : Mảng hay tham chiếu của một tập hợp các giá trị dùng để đếm số lần xuất hiện. Nếu data_array không có giá trị, FREQUENCY() trả về một mảng các trị zero (0).

bins_array : Mảng hay tham chiếu chứa các khoảng giá trị làm mẫu, và các trị trong data_array sẽ được nhóm lại theo các trị mẫu này. Nếu bins_array không có giá trị, FREQUENCY() sẽ trả về số phần tử trong data_array.

Lưu ý:

FREQUENCY() phải được nhập dưới dạng công thức mảng sau khi chúng ta đã chọn một dãy ô kề nhau để phân bổ sự xuất hiện của các phần tử trong mảng.

Số phần tử trong data_array phải nhiều hơn số phần tử trong bins_array 1 phần tử. Phần tử dôi ra này chứa số lượng các giá trị lớn hơn khoảng lớn nhất. Ví dụ, khi đếm 3 khoảng giá trị đã nhập trong 3 ô, phải chắc chắn rằng FREQUENCY() được nhập vào 4 ô; ô thứ 4 này sẽ trả về số lượng các giá trị trong data_array khi các gía trị này lớn hơn giá trị trong khoảng thứ 3. Để dễ hiểu hơn, các bạn xem ở các ví dụ sau.

FREQUENCY() sẽ bỏ qua các ô trống hoặc các chuỗi text.

Ví dụ 1:

Để đếm tần số xuất hiện của các sản phẩm bị lỗi trong bảng sau, tại K4:K7, nhập số muốn đếm, và tại L4:L8, nhập công thức mảng {= FREQUENCY(D3:D22, K4:K7)}

Ví dụ 2:

Hàm GEOMEAN()

Trả về trung bình nhân của một mảng hoặc một dãy các số dương. Ví dụ, có thể dùng GEOMEAN() để tính mức tăng trưởng trung bình.

Cú pháp: = GEOMEAN(number1, number2, ...)

Number1, number2 ... : Có thể có từ 1 đến 255 đối số dùng để tính trung bình. Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số.

Lưu ý:

Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số.

Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính.

Nếu có bất kỳ đối số nào không phải là số dương, GEOMEAN() sẽ trả về giá trị lỗi #VALUE!

GEOMEAN được tính bằng phương trình sau:

Ví dụ:

GEOMEAN({4, 5, 8, 7, 11, 4, 3}) = 5.476987

Hàm HARMEAN()

Trả về trung bình điều hòa của một dãy các số dương. Trung bình điều hòa là nghịch đảo của trung bình cộng.

Cú pháp: = HARMEAN(number1, number2, ...)

Number1, number2 ... : Có thể có từ 1 đến 255 đối số dùng để tính trung bình điều hòa. Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số.

Lưu ý:

Trung bình điều hòa luôn nhỏ hơn trung bình nhân, mà trung bình nhân là một số luôn nhỏ hơn trung bình cộng.

Những đối số là giá trị lỗi hay giá trị text mà không thể chuyển đổi thành giá trị số sẽ gây ra lỗi.

Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số.

Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính.

Nếu có bất kỳ đối số nào không phải là số dương, HARMEAN() sẽ trả về giá trị lỗi #VALUE!

HARMEAN được tính bằng phương trình sau:

Ví dụ:

HARMEAN({4, 5, 8, 7, 11, 4, 3}) = 5.028376

Hàm KURT()

Trả về độ nhọn của tập dữ liệu. Độ nhọn được tính bằng cách lấy moment thứ tư của trị trung bình chia cho độ lệch chuẩn lũy thừa 4. Độ nhọn biểu thị mức nhọn hay mức phẳng tương đối của một phân phối so với phân phối chuẩn. Đô nhọn dương cho biết phân phối là nhọn tương đối, độ nhọn âm cho biết phân phối là phẳng tương đối.

Cú pháp: = KURT(number1, number2,...)

Number1, number2, ... : Có thể có từ 1 đến 255 đối số (với Excel 2003 trở về trước thì con số này là 30) dùng cho KURT(). Cũng có thể dùng mảng đơn hay tham chiếu mảng làm đối số cho hàm.

Lưu ý:

Nếu có ít hơn 4 điểm số liệu, hay nếu độ lệch chuẩn của mẫu bằng 0, KURT() trả về giá trị lỗi #DIV/0!

KURT() được tính theo công thức:

với s là độ lệch chuẩn.

Ví dụ:

KURT(3, 4, 5, 2, 3, 4, 5, 6, 4, 7) = -0.1518

Hàm LARGE()

Trả về giá trị lớn nhất thứ k trong một tập số liệu. Có thể dùng hàm này để chọn lựa giá trị dựa theo vị trí tương đối của nó. Ví dụ, bạn có thể dùng hàm LARGE() để tính số điểm cao nhất, cao thứ nhì, cao thứ ba, v.v...

Cú pháp: = LARGE(array, k)

array : Mảng hay dãy số liệu dùng để xác định giá trị lớn nhất thứ k

k : Vị trí (tính từ giá trị lớn nhất) trong mảng hay dãy số liệu.

Lưu ý:

Nếu array rỗng, LARGE() sẽ trả về giá trị lỗi #NUM!

Nếu k < 0 hay k lớn hơn số lượng các số có trong array, LARGE() sẽ trả về giá trị lỗi #NUM!

Giả sử n là số lượng các số có trong array, thì LARGE(array, 1) trả về giá trị lớn nhất (MAX), và LARGE(array, n) sẽ trả về giá trị nhỏ nhất (MIN).

Ví dụ:

Để xem số sản phẩm bị lỗi nhiều thứ hai (nhỏ hơn nhiều nhất) là bao nhiêu trong danh sách sau, dùng công thức = LARGE($D$3:$D$22) ở ô I10

Ví dụ 2:

Top