Phân phối xác suất rời rạc: Tổng quan và ví dụ
Phân phối rời rạc là phân phối xác suất mô tả sự xuất hiện của các kết quả rời rạc (đếm được riêng lẻ), chẳng hạn như 1, 2, 3… hoặc 0 so với 1. Ví dụ:
Phân phối xác suất rời rạc: Tổng quan và ví dụ
Phân phối rời rạc là phân phối xác suất mô tả sự xuất hiện của các kết quả rời rạc (đếm được riêng lẻ), chẳng hạn như 1, 2, 3… hoặc 0 so với 1. Ví dụ: phân phối nhị thức là một phân phối rời rạc đánh giá xác suất của câu trả lời “có” hoặc ” không” xảy ra kết quả trong một số lần thử nhất định, với xác suất của sự kiện trong mỗi lần thử—chẳng hạn như tung đồng xu một trăm lần và có kết quả là “mặt ngửa”.
Phân phối thống kê có thể rời rạc hoặc liên tục. Phân phối liên tục được xây dựng từ các kết quả rơi vào một chuỗi liên tục, chẳng hạn như tất cả các số lớn hơn 0 (bao gồm các số có phần thập phân tiếp tục vô tận, chẳng hạn như pi = 3,14159265…). Nhìn chung, các khái niệm về phân phối xác suất rời rạc và liên tục và các biến ngẫu nhiên mà chúng mô tả là nền tảng của lý thuyết xác suất và phân tích thống kê.
Hiểu về phân phối rời rạc
Phân phối là một khái niệm thống kê được sử dụng trong nghiên cứu dữ liệu. Những người tìm cách xác định kết quả và xác suất của một nghiên cứu cụ thể sẽ lập biểu đồ các điểm dữ liệu có thể đo lường được từ một tập dữ liệu, dẫn đến biểu đồ phân phối xác suất. Có nhiều loại hình biểu đồ phân phối xác suất có thể là kết quả của nghiên cứu phân phối, chẳng hạn như phân phối chuẩn (“đường cong hình chuông”).
Các nhà thống kê có thể xác định sự phát triển của phân phối rời rạc hoặc liên tục theo bản chất của các kết quả cần đo lường. Không giống như phân phối chuẩn, là phân phối liên tục và tính đến mọi kết quả có thể xảy ra dọc theo trục số, một phân phối rời rạc được xây dựng từ dữ liệu chỉ có thể tuân theo một tập hợp kết quả hữu hạn hoặc rời rạc.
Do đó, các bản phân phối rời rạc biểu thị dữ liệu có số lượng kết quả có thể đếm được, có nghĩa là các kết quả tiềm ẩn có thể được đưa vào danh sách. Danh sách có thể là hữu hạn hoặc vô hạn. Ví dụ, khi nghiên cứu phân bố xác suất của một con súc sắc có sáu mặt được đánh số, danh sách là {1, 2, 3, 4, 5, 6}. Phân phối nhị thức có một tập hợp hữu hạn chỉ hai kết quả có thể xảy ra: không hoặc một—ví dụ: tung đồng xu sẽ cho bạn danh sách {Ngửa, sấp}. Phân phối Poisson là một phân phối riêng biệt tính tần suất xuất hiện dưới dạng số nguyên, có danh sách {0 , 1, 2, …} có thể là vô hạn.
Việc phân phối phải rời rạc hoặc liên tục.
Ví dụ về phân phối rời rạc
Các phân phối xác suất rời rạc phổ biến nhất bao gồm nhị thức, Poisson, Bernoulli và đa thức.< /p>
Phân phối Poisson cũng thường được sử dụng để lập mô hình dữ liệu đếm tài chính trong đó số liệu kiểm đếm nhỏ và thường bằng không. Ví dụ, trong lĩnh vực tài chính, nó có thể được sử dụng để lập mô hình số lượng giao dịch mà một nhà đầu tư điển hình sẽ thực hiện trong một ngày nhất định, có thể là 0 (thường xuyên), hoặc 1 hoặc 2, v.v. Một ví dụ khác, mô hình này có thể được sử dụng để dự đoán số lần “cú sốc” đối với thị trường sẽ xảy ra trong một khoảng thời gian nhất định, chẳng hạn như hơn một thập kỷ.
Một ví dụ khác mà cách phân phối riêng biệt như vậy có thể có giá trị đối với doanh nghiệp là quản lý khoảng không quảng cáo. Đang nghiên cứu tần suất bán khoảng không quảng cáo kết hợp với số lượng hữu hạn khoảng không quảng cáo có sẵn có thể cung cấp cho doanh nghiệp phân phối xác suất dẫn đến hướng dẫn phân bổ khoảng không quảng cáo hợp lý để sử dụng tốt nhất diện tích vuông.
Phân phối nhị thức được sử dụng trong các mô hình định giá quyền chọn dựa trên cây nhị thức. Trong mô hình cây nhị thức, nội dung cơ sở chỉ có thể có giá trị chính xác bằng một trong hai giá trị có thể có—với mô hình này, chỉ có hai kết quả có thể xảy ra với mỗi lần lặp lại—tăng hoặc giảm với xác suất đã xác định.
Hình ảnh của Sabrina Jiang © Investopedia 2020
Bạn cũng có thể thấy các bản phân phối rời rạc trong mô phỏng Monte Carlo. Mô phỏng Monte Carlo là một kỹ thuật mô hình xác định xác suất của các kết quả khác nhau thông qua công nghệ được lập trình. Nó chủ yếu được sử dụng để giúp dự báo các kịch bản và xác định rủi ro. Trong mô phỏng Monte Carlo, kết quả với các giá trị rời rạc sẽ tạo ra các bản phân phối rời rạc để phân tích. Những phân phối này được sử dụng để xác định rủi ro và sự đánh đổi giữa các mặt hàng khác nhau đang được xem xét.
Câu hỏi thường gặp về phân phối rời rạc
Các phân phối rời rạc phổ biến nhất được các nhà thống kê hoặc nhà phân tích sử dụng bao gồm phân phối nhị thức, Poisson, Bernoulli và đa thức. Các phân phối khác bao gồm phân phối nhị thức, hình học và siêu hình học âm.
Xác suất của các biến ngẫu nhiên phải có các giá trị rời rạc (trái ngược với liên tục) làm kết quả. Đối với phân phối tích lũy, xác suất của mỗi quan sát rời rạc phải nằm trong khoảng từ 0 đến 1; và tổng các xác suất phải bằng một (100%).
Nếu chỉ có một tập hợp các kết quả có thể xảy ra (ví dụ: chỉ có 0 hoặc một hoặc chỉ các số nguyên), thì dữ liệu là rời rạc.
Không giống như phân phối rời rạc, phân phối xác suất liên tục có thể chứa các kết quả có giá trị bất kỳ, kể cả phân số không xác định. Chẳng hạn, một phân phối chuẩn được mô tả bằng một đường cong hình chuông với một đường liền mạch bao phủ tất cả các giá trị trong hàm xác suất của nó.
Mô hình xác suất rời rạc là một công cụ thống kê lấy dữ liệu theo phân phối rời rạc và cố gắng dự đoán hoặc lập mô hình một số kết quả, chẳng hạn như giá hợp đồng quyền chọn hoặc khả năng xảy ra cú sốc thị trường trong 5 năm tới.
p>
Công cụ
Quản lý danh mục đầu tư
Phân tích tài chính
Công cụ
Công cụ
Quản lý rủi ro
Phân phối xác suất rời rạc: Tổng quan và ví dụ
Phân phối rời rạc là phân phối xác suất mô tả sự xuất hiện của các kết quả rời rạc (đếm được riêng lẻ), chẳng hạn như 1, 2, 3… hoặc 0 so với 1. Ví dụ: