$$ \def\argmax{\operatorname*{argmax}} \def\argmin{\operatorname*{argmin}} \def\as{\textrm{a.s.}} \def\Ber{\text{Ber}} \def\Betad#1{\text{Beta}\left(#1\right)} \def\Binom{\text{Binom}} \def\Geom{\text{Geom}} \def\Unif{\text{Unif}} \def\E#1{\mathbb{E}\left[#1\right]} \def\iid{\stackrel{iid}{\sim}} \def\is{\coloneqq} \def\Gauk#1#2{\mathcal{N}_{#1}\left(#2\right)} \def\Gaus#1{\Gauk{}{#1}} \def\indicator#1{\mathbb{1}\{#1\}} \def\tp{\intercal} \def\p{\vec{p}} \def\P{\mathbb{P}} \def\Poiss{\text{Poiss}} \def\R{\mathbb{R}} \def\X{\vec{X}} \def\Y{\vec{Y}} \def\XX{\mathbb{X}} \def\V#1{\mathbb{V}\left(#1\right)} \def\Cov#1{\V{#1}} \def\N{\mathbb{Z}_+} \def\TV{\textrm{TV}} \def\KL{\textrm{KL}} \def\vec#1{\boldsymbol{#1}} \def\toapd{\xrightarrow[n\to\infty]{\as/\P/(d)}} \def\toprob{\xrightarrow[n\to\infty]{\P}} \def\tosure{\xrightarrow[n\to\infty]{\as}} \def\todist{\xrightarrow[n\to\infty]{(d)}} $$

2  Phân phối

2.1 Phân phối Bernoulli

Định nghĩa 2.1 (Bernoulli distribution) \(X\sim\Ber(p)\)\[ \P(X=1) = p = 1-\P(X=0) \]\(\E{X} = p, \V{X} = p(1-p)\).

2.2 Phân phối nhị thức

Định nghĩa 2.2 (Binomial distribution) \(K\sim\Binom(n, p)\) với \(n\in\N, p\in(0,1)\) mô tả tổng số lần thành công của \(n\) thí nghiệm độc lập \(K_1,\ldots,K_n \iid \Ber(p).\) Ta có \[ \P(K=k) = \binom{n}{k}p^{k}(1-p)^{n-k} \]\(\E{K} = np, \V{K} = np(1-p)\).

2.3 Phân phối Poisson

Định nghĩa 2.3 (Phân phối Poisson) \(K\sim\Poiss(\lambda),\) \(\lambda > 0\) cố định, có \[ \P(K=k) = e^{-\lambda} \frac{\lambda^k}{k!}, \] \(k=0,1,2,\ldots\) là số lần phát sinh sự kiện trong một giới hạn cố định, các sự kiện phát sinh độc lập. \[\E{K} = \V{K} = \lambda .\]

Khi \(n\) đủ lớn và \(p\) đủ nhỏ thì \(\Poiss(np)\) gần với \(\Binom(n,p)\).

2.4 Phân phối hình học

Định nghĩa 2.4 (Geometric distribution) \(K\sim\Geom(p), p \in (0,1)\)\[ \P(K=k)=p(1-p)^{k-1}, k=1,2,\ldots \] là xác suất thành công đầu tiên xảy ra sau đúng \(k\) lần thực nghiệm \(\Ber(k).\) \[\E{K}=1/p,\V{K}=(1-p)/p^2.\]

2.5 Phân phối đều

Định nghĩa 2.5 (Uniform distribution) \(X\sim\Unif[a,b]\) có mật độ \[ f(x)\is \frac{x-a}{b-a} \textrm{ for } x\in[a,b]. \]

Remark. \[\E{X} = \frac{a+b}{2}, \V{X}=\frac{(b-a)^2}{12}.\]

Remark. Nếu biến \(X\) có cdf \(F\) (ĐN 1.2) khả nghịch thì \(F(X)\sim\Unif[0,1].\)

2.6 Phân phối mũ

Định nghĩa 2.6 (Exponential distribution) \(X\sim\text{Exp}(\lambda)\)\[ f(x)={\lambda}e^{-\lambda x},x\in\R_+, \] \(x\) ước lượng khoảng cách giữa hai lần phát sinh sự kiện trong quá trình \(\Poiss(\lambda).\) \[\E{X}=1/\lambda,\V{X}=1/\lambda^2.\]

2.7 Phân phối chuẩn

Định nghĩa 2.7 (Normal/Gaussian Distribution) Phân phối chuẩn \(X\sim\Gaus{\mu, \sigma^2}\) có mật độ \[ f(x) = \frac{1}{\sqrt{\pi 2\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), x\in\R. \]

Remark. \(\E{X}=\mu,\V{X}=\sigma^2\).

Định nghĩa 2.8 (Standard Normal Distribution) \(\Gaus{0,1}\)phân phối chuẩn tắc.

Định lý 2.1 (Cộng phân phối chuẩn) Nếu \(X_i \sim\Gaus{\mu_i, \sigma_i^2}, i=1,\ldots,n\) độc lập thì

\[\sum_{i=1}^n X_i\sim \Gaus{\sum_{i=1}^n \mu_i, \sum_{i=1}^n \sigma_i^2} .\]

Định nghĩa 2.9 (Vector phân phối chuẩn) Nếu mọi tổ hợp tuyến tính các yếu tố của vector \(\boldsymbol{v}\) đều thuộc phân phối chuẩn 1 biến thì \(\boldsymbol{v}\) được gọi là một vector phân phối chuẩn.

2.8 Phân phối \(\chi^2\)

Định nghĩa 2.10 (Phân phối \(\chi^2\)) \(X\sim\chi_k^2\) là tổng bình phương của \(X_1,\ldots,X_k\iid\Gaus{0, 1}\)

\[ X \is \sum_{i=0}^k X_i^2 \]

và có \(\E{X}=k,\V{X}=2k\).

2.9 Phân phối Student

Định nghĩa 2.11 (Student’s T distribution) Nếu có \(Z\sim\Gaus{0, 1}, V\sim \chi_k^2\) độc lập với nhau thì

\[ X \is \frac{Z}{\sqrt{V/k}} \]

tuân theo phân phối Student’s \(t_k\).

2.10 Phân phối Beta

Định nghĩa 2.12 (Beta distribution) \(X\sim\Betad{\alpha, \beta},\) tham số \(\alpha>0,\beta>0\) có mật độ trên \(x\in [0,1]\)\[ f(x) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)} , \] \(B(\alpha,\beta)\) là hằng số chuẩn hóa.

Remark. \[ \begin{split} \E{X}&=\frac{\alpha}{\alpha+\beta},\\ \V{X}&=\frac{\alpha \beta }{(\alpha +\beta )^2(\alpha + \beta + 1)},\\ \argmax f &= \frac{\alpha -1}{\alpha +\beta -2} \text { for } \alpha ,\beta > 1. \end{split} \]

Remark. Phân phối Beta có đồ thị rất linh hoạt trên khoảng \([0,1],\) phù hợp làm xác suất tiền nghiệm (ĐN 7.1).

Ví dụ 2.1 \(\Unif[0,1] = \Betad{1, 1}.\)

2.11 Phân phối Gamma

Định nghĩa 2.13 (Gamma distribution) với tham số \(q>0, \lambda>0,\) có mật độ là \[ f(x)\is\frac{\lambda^q x^{q-1} e^{-\lambda x}}{\Gamma(q)} \quad \forall x\in (0,\infty) , \] \(\Gamma\) là hàm Euler Gamma.