개인 공부

확률 및 통계 - 3. Permutations & Combinations

Beige00 2024. 3. 27. 02:15

Def 3.1. 

n개의 서로 다른 요소로부터 만들 수 있는 모든 순서화된 목록의 수는 n*(n-1)*(n-2)*...*1 로 계산이 가능하다.

이를 n! 이라고 하자. (Factorial)

단 0!=1 이다.

더보기

증명)

1...n 개의 숫자열이 있다고 할 때,

1을 배치할 때는 n 개의 경우의 수

2를 배치할 때는 n-1 개의 경우의 수

3을 배치할 때는 n-2 개의 경우의 수...

n을 배치할 때는 n-n+1 개의 경우의 수가 있다.

=> n*(n-1)*(n-2)*...*(1) 

 

Def 3.2.

A : n 개의 element set, K는 0~n까지로 정의된 정수 sample space의 element 일 시,

( A: n-element set, K ∈ [n] )

 

A의 k 순열은 A의 크기가 k인 부분집합의 순서화된 리스트이다.

간단히 말해, k-순열은 집합 A에서 임의의 k개 원소를 선택하고, 그 선택된 요소들로 만들 수 있는 모든 가능한 순서의 나열이다. k 순열의 총 개수는 n!/(n-k)! 로 계산된다.

더보기

증명)

A에서 k개의 원소를 뽑아 나열하면,

n(n-1)(n-2)...(n-k+1)의 경우의 수로 나열 가능 (접은글 참고)

=> n(n-1)(n-2)...(n-k+1) = n!/(n-k)!

 

더보기

* approx. of n!

=> ai,bi가 순열일 때, ai bi가 asymptotically equal이라는 것은 n이 무한대로 갈 때, lim(i->∞) ai/bi = 1이라는 뜻이다.

ex ) an = n + sqrt(n), bn = n. -> lim(n->∞) (1+1/sqrt(n)) = 1

 

* 스털링 근사식 : n! ~= (n^2)*(e^-n)*sqrt(2*PI*n) 이다.

=> 이는 매우 큰 n에 대해 n!의 값을 계산할 때 유용하다.

 

ex) Derangement (hat check prob)

정의 : 어떤 순열 p에서, element x가 fixed point인 경우는 f(x) = x임을 의미한다.

즉, fixed point는 순열 쌍에서 원래 있던 자리에 그대로 위치하게 된 원소를 의미한다.

 

Pk(n) = 집합 {1,2,...n}의 순열 중 정확히 k개의 fixed point를 가진 순열이 나올 확률이라고 정의하자.

따라서 P0(n)은 고정점이 하나도 없는 Derangement 순열이 나올 확률이다.

D(n)은 n개의 원소에서 Derangement 순열의 갯수라고 정의하자.

 

Q: P0(n) ? 

더보기

A :

i ) n이 1일때,

D(1) = 0 개

- 하나의 원소만 존재하므로 자리가 변할 수 없다.

 

ii ) n이 2일 때,

D(2) = 1 개

- (1,2),(2,1). 따라서 1/2

 

iii ) n>2

t = 생성된 derangement에서 첫번째 위치의 정수라고 가정.

 

case 1. 1이 t 포지션에 있을 때. (t와 1의 위치가 교환된 case)

(1...t...)->(t...1....) => 2개 원소의 위치가 결정되었으므로, 남은 원소는 n-2가지이다. 따라서, (n-1)*D(n-2)

 

case 2. 1이 t 포지션에 없을 때.(t와 무언가가 교환된 case)

(1...t...)->(t...?...) => t의 자리가 결정. (n-1)*D(n-1)

 

따라서 D(n)은 다음과 같이 재귀적으로 정의될 수 있다.

 

D(n) = (n-1)D(n-2) + (n-1)D(n-1)

 

=> P0(n) = 1/2! -1/3! + 1/4! - 1/5! +...(-1)^n/n! ~= e^-1 ~= 0.368 => 불일치 순열이 일어날 확률

(포함 배제 원리 이용) - 포함 배제 원리는 다음 포스팅에 추가 설명하겠음.

 


3.2. Combinations

 

Def ) n 크기 set에서 j개의 원소를 가진 고유한 부분 집합의 수는 n(C)j 로 나타낼 수 있다.

예를들어, U = {a,b,c}에서 3(C)0  = 1 = { }, 3(C)1 = 3 = {a},{b},{c}, 3(C)1=3={a,b},{b,c},{a,c}이다.

여기서, Permutation과 다른 점은 n개의 원소를 "나열"한다는 개념의 Permutation과 달리,

Combination은 "고유한" 부분 집합의 수만 따지므로, order의 개념이 없다.

즉, Combination에서 {a,b} = {b,a} 인 것이다.

 

* 파스칼의 정리

0<j<n의 n,j 정수에 대해, n(C)j = n-1(C)j + n-1(C)j-1

더보기

증명)

size n의 집합에서 임의의 원소 A를 선택했을 때

i) A가 j의 원소였을 경우 : 나머지 n-1 중 j-1개를 고르면 된다. => n-1(C)j-1

ii) 아닐 경우 : 나머지 n-1 중 j개를 고르면 된다. n-1(C)j

=> n(C)j = n-1(C)j-1 + n-1(C)j

(파스칼의 삼각형)

Thm ) n(C)j = n! / j! * (n-j)! (j-순열의 갯수에서 j!을 나눈 형태)

더보기

증명

nPj = size n의 set에서 j 개의 원소를 지닌 ordered list의 수 = j 순열

nPj = n(C)j * j! (ordered list이므로, 조합에서 순서 개념을 더해준다. 즉, n개 중 j개의 원소를 뽑고, 이들을 나열하는 경우의 수 j!을 곱해주는 것이다.)

따라서, n(C)j = nPj / j! = n! / j!(n-j)!


문제.

 

ex ) 13개의 값을 4개의 종류로 지닌 카드를 뽑을 때, 5장 중 4개의 값이 전부 같을 확률은

4개가 13개의 값 중 하나로 같을 경우는 13개 * 나머지 1장 남은거 뽑기 48

=> 13*48

-> 총 카드 5장 뽑을 확률은 52(C)5. 따라서 13*48/(52(C)5) = 0.0024

 

ex) 3장의 값이 같고 나머지 2장의 값이 같을 확률은

13 * (같은 value를 지닌 4개의 종류 카드 중 3장 뽑을 확률) + 12 * (같은 val.을 지닌 4개의 종류중 2장 뽑을 확률)

=> (13*4(C)3 + 12*4(C)2) / (52(C)5)


 

* Bernoulli trial

=> Bernoulli tiral은 단 두가지 결과(True or False)를 지닌 독립 확률 실험이다. (ex: 동전 던지기)

=> 따라서 T, F가 (p) (1-p) 의 확률로 구성된다. 보통 p,q로 표현하며 자연스럽게 q=1-p가 된다.

 

* Binomial Probabilited

=> n번의 베르누이 시행에서 정확히 k번 성공할 확률을 계산하는 것으로, 기호 b(n,p,j)로 나타낸다.

(n번의 시행중 p의 확률로 j번 성공할 확률)

더보기

ex) q=1-p

b(3,p,0) => q^3

b(3,p,1) => 3(C)1*p*q^2 (3번 중 1번이 성공할 것임)

b(3,p,2) => 3(C)2*p^2*q (3번 중 2번이 성공할 것임)

b(3,p,3) => p^3

* Binomial Distribution

Def 3.6)

n : positive integer, 0<=p<=1, n = 베르누이 시행에서 성공의 횟수

다음을 이항 분포라고 부른다. => b(n,p,k) = n(C)k * p^k * q^(n-k)

(n번의 시도 중 k번의 성공한 횟수를 뽑고, k번 성공확률 * 나머지 실패할 확률)

 

* Binomial Expansion

더보기

이항 정리 증명

(a+b)^n = (a+b)*(a+b)*...*(a+b) => 이 n개의 (a+b) 들은 a^j*b^(n-j) 들로 구성되고, 이게 몇 개있냐에 따라 계수가 결정됨.(n(C)j)

 

Special Case)

만약 a=b=1 일 시, 2^n

a=1, b=-1 일시 0

*  포함 배제 증명에 들어가서 더 자세히 표현하면 a = 1, b = -1의 식 표현은다음과 같다.

* Inclusion-Exclusion Principle

set of event A의 set {A1,A2...,An}

=> 이 set의 총합은 확률의 총합 - 이 확률들의 교집합들의 합+여러번 빠진 확률의 합이다.

출처 :&nbsp;https://iseulbee.com/archives/three-proofs-of-inclusion-exclusion-principle/

더보기

증명

임의의 원소 x가 모든 A set에 포함되는 outcome이라고 해보자.

이 원소는 위에 제시된 포함 배제 식의 좌변 합집합 크기를 딱 1만큼 늘릴 것이다. (전부에 포함되기 때문에)

그러면 우변에도 x가 1만큼만 보태주면 되는 문제인 것이다.

A들 중 x를 원소로 갖는 것들의 수를 k라고 하자. (A0~Ak).

이 때, 우변을 보면 k개 집합의 교집합에 (-1)^k-1를 곱하여 더해주므로 이 x가 우변에 더해줄 크기는

k(C)1 - k(C)2 +k(C)3 +...+ (-1)^(j-1)*k(C)k일 것이다.

 

 

 

그런데 이항 정리에서 a=1, b=-1일 때 위의 사진과 같이 식이 정리되며, 이 값은 0이다.

이를 전개해보면 다음과 같이 전개될 것이다.

여기서 k(C)0은 1이므로, 나머지 부분의 값이 1이 되어야 된단 것을 알 수 있다.

그런데 나머지 부분의 값은 k(C)1 - k(C)2 +k(C)3 +...+ (-1)^(j-1)*k(C)k 의 표현과 동등하다.

따라서 x가 보태어주는 크기는 1이다.

ex) derangement

A={a1,...an}에서

Ai : ai가 fixed point일 경우 라고 가정

P(Ai) = n개의 포인트 중 한자리를 ai가 가져감. = (n-1)! / n! = 1/n

 

=>  P(A1 U A2 U A3... U An)을 구해서 1에서 빼면 derangement 확률이 나올 것이다.

i) 각 자리가 개별로 고정점일 경우의 확률 합.

= 1/n * n = 1

(사실 이렇게 생각 안해도 모든 점이 기존의 자리를 유지하는 경우의 수는 한개이다.)

 

ii) 2개의 자리가 고정점일 경우의 확률 합

= 2개가 고정점일 확률 * 고정점 2개를 고를 확률

= (n-2)!/n! * n(C)2 = 1/n(n-1) * n(n-1)/2! = 1/2!

 

iii) 그 이상

=> 같은식으로 정리되어 (n-k!)/n! * n(C)k = 1/k!이다.

이 때, 포함 배제 원리에 의해

1 - 1/2! + 1/3! + ... = P(A1 U A2 U A3 U...U Ak)

따라서 1 - P(A1 U A2 U A3 U...U Ak) = 1/2! - 1/3! + 1/4! +.... ~= e^-1