Khoảng tin cậy
Trong thống kê, khoảng tin cậy (CI) là một loại ước tính được tính từ số liệu thống kê của dữ liệu được quan sát. Điều này đề xuất một loạt các giá trị hợp lý cho một tham số chưa biết (ví dụ: giá trị trung bình). Khoảng có một mức độ tin cậy liên quan rằng tham số thực nằm trong phạm vi đề xuất. Với các quan sát và mức độ tin cậy, khoảng tin cậy hợp lệ có xác suất chứa tham số cơ bản thực sự. Mức độ tự tin có thể được lựa chọn bởi điều tra viên. Nói chung, khoảng tin cậy cho một tham số chưa biết dựa trên việc lấy mẫu phân phối của một công cụ ước tính tương ứng.
Nói đúng hơn, mức độ tin cậy biểu thị tần số (nghĩa là tỷ lệ) của các khoảng tin cậy có thể có chứa giá trị thực của tham số dân số chưa biết. Nói cách khác, nếu các khoảng tin cậy được xây dựng bằng cách sử dụng một mức độ tin cậy nhất định từ một số lượng thống kê mẫu độc lập vô hạn, tỷ lệ của các khoảng đó chứa giá trị thực của tham số sẽ bằng với mức tin cậy. Ví dụ: nếu mức độ tin cậy (CL) là 90% thì trong việc thu thập dữ liệu không xác định giả thuyết, trong 90% các mẫu ước tính khoảng sẽ chứa tham số dân số thực.
Mức độ tin cậy được chỉ định trước khi kiểm tra dữ liệu. Thông thường nhất, mức độ tin cậy 95% được sử dụng. Tuy nhiên, mức độ tin cậy 90% và 99% cũng thường được sử dụng trong phân tích.
Các yếu tố ảnh hưởng đến độ rộng của khoảng tin cậy bao gồm kích thước của mẫu, mức độ tin cậy và độ biến thiên của mẫu. Một mẫu lớn hơn sẽ có xu hướng tạo ra ước tính tốt hơn về tham số dân số, khi tất cả các yếu tố khác đều bằng nhau. Mức độ tin cậy cao hơn sẽ có xu hướng tạo ra khoảng tin cậy rộng hơn.
Nhiều khoảng tin cậy có dạng :, trong đó việc thực hiện bộ dữ liệu, c là hằng số và là độ lệch chuẩn của bộ dữ liệu. Một cách khác để thể hiện hình thức của khoảng tin cậy:
(ước tính điểm – ràng buộc lỗi, ước tính điểm + ràng buộc lỗi)
hoặc biểu thị một cách tượng trưng, (- EBM, + EBM)
trong đó (ước tính điểm) đóng vai trò là ước tính cho m (trung bình dân số) và EBM là lỗi bị ràng buộc đối với trung bình dân số.
Biên độ sai số (EBM) phụ thuộc vào mức độ tin cậy.
Một định nghĩa kỹ lưỡng, chung chung:
Giả sử một tập dữ liệu được đưa ra, được mô hình hóa như là nhận ra các biến ngẫu nhiên Hãy là tham số quan tâm và một số từ 1 đến 0. Nếu có tồn tại thống kê mẫu và như vậy:
cho mọi giá trị của
Sau đó, ở đâu và, được gọi là khoảng tin cậy 100% cho. Con số được gọi là mức độ tin cậy.