Khi bước đầu học tập môn Quant, tất cả một trong những phần tôi luôn thắc mắc khi nói tới Sample (mẫu) và Population (tạm dịch là tổng thể). Trong phương pháp tính Mean thì cả sample mean (thường xuyên được ký hiệu $ar x$ ) với population mean (thường xuyên được cam kết hiệu μ) phần nhiều được phân tách mang lại n (với giả sử n là số lượng quan tiền liền kề vào sample hoặc vào population).quý khách hàng đang xem: Sample variance là gì

Còn với standard deviation thì không phải như vậy, mẫu mã số của sample sd là (n-1) còn của population sd là n. Tại sao lại có minh bạch đối xử như vậy? 


*

Ok, tôi so sánh bí quyết tính độ lệch chuẩn chỉnh (standard deviation – sd) của một population:

$$ sigma = sqrtfracsum_i=1^N left(X_i – mu_X ight)^2N $$

cùng độ lệch chuẩn của một sample :

$$ s = sqrtfracsum_i=1^n left(X_i – ar X ight)^2n – 1 $$

Hmilimet, rất có thể nhận thấy tức thì điểm khác hoàn toàn rõ nét đó là chủng loại số: với population là N, cùng cùng với sample là (n-1). Vào ngày thi, Lúc áp lực nặng nề là vô cùng bự, 2 phương pháp này hoàn toàn có thể rất giản đơn bị lẫn lộn. Và dĩ nhiên là, trong 3 lời giải những ông hoàn toàn có thể khoanh đã bao hàm cả lời giải sai – đáp án áp dụng n cố gắng vì (n-1) (hoặc tựa như thế).

Bạn đang xem: Sample variance là gì

Vậy do sao là n cùng (n-1) ?

Ý tưởng sinh hoạt đây là tôi ý muốn vừa phải của những phương thơm không nên của tất cả các sample hoàn toàn có thể phải bởi phương không đúng của population. Vậy nên tôi sẽ không còn “thiên vị” (bias).

Xem thêm: Là Vì Em Đã Hết Thương Tôi Rồi Giờ Em Đã Có Ai Bên Đời, Dừng Thương

Để làm rõ rộng, tôi cho các ông ví dụ như sau nhé:

Giả sử gồm 3 lá bài bác với các cực hiếm 0, 2, 4. Nlỗi vậy:

$ Population mean = frac(0+2+4)3 = 2 $$ Population variance = frac(0-2)^2 + (2-2)^2 + (4-2)^23 = frac83 $

Bây tiếng tôi xét tất cả các cách lấy các mẫu-có-2-phần-tử. Có 9 giải pháp như vậy, cùng tôi có bảng sau:

MẫuTrung bình mẫuPhương thơm không nên – mẫu số (n-1)Pmùi hương không nên – chủng loại số (n)
(0,0)000
(0,2)121
(0,4)284
(2,0)121
(2,2)200
(2,4)321
(4,0)284
(4,2)321
(4,4)400

cũng có thể thấy:

Với mẫu mã số (n-1), trung bình của các pmùi hương không nên của tất cả mẫu-2-phần-tử có thể là: (0+2+8+2+0+2+8+2+0)/9 = 24/9 = 8/3, bằng với pmùi hương không nên của population.

Và đó là lý do tại sao buộc phải thực hiện (n-1) gắng vày n Khi tính phương thơm sai/độ lệch chuẩn cho sample. Ý tưởng là để kiểm soát và điều chỉnh cho những “thiên vị” (bias) khi lựa chọn chủng loại. Nếu tôi lấy 1 sample tất cả 30 quan tiền gần kề, rồi tính mean đến sample đó; tiếp nối đem tiếp 30 quan sát không giống, thì chỉ bao gồm 29 quan liêu tiếp giáp được phép tự do thay đổi nếu còn muốn sample mean không đổi. Nói biện pháp khác, sau khi đem thiên nhiên 29 quan lại cạnh bên trước tiên, chỉ tất cả tuyệt nhất 1 quý hiếm đến quan lại giáp sản phẩm 30 gửi lại quý hiếm sample mean nlỗi cũ. do đó, tôi đã không còn 1 bậc tự do (1 degree of freedom). Số 1 này đó là kiểm soát và điều chỉnh từ n thành (n-1).

(Nguồn tmê mệt khảo: http://nebula.deanza.edu/~bloom/math10/m10divideby_nminus1.pdf )

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *