# TP3 : Simulation de Variables Aléatoires

In [None]:
import numpy as np
import scipy.stats as stat
import matplotlib.pyplot as plt

## Exercice 1

In [None]:
mu = stat.randint(1,6)
m = mu.mean()

N = 1000
X = mu.rvs(size=N)
S = np.cumsum(X)
ntab = np.arange(1,N+1)
Xbar = S/ntab


plt.plot(ntab,Xbar,label='Sn/n')
plt.plot(ntab,m*np.ones((N,1)),label='Espérance')
plt.xlabel('n')
plt.legend()
plt.show()

In [None]:
a = 0.5
plt.plot(ntab,ntab**a*(Xbar-m),label='Sn/n')
plt.xlabel('n')
plt.show()

In [None]:
mu = stat.cauchy()

N = 10000
X = mu.rvs(size=N)
S = np.cumsum(X)
ntab = np.arange(1,N+1)
Xbar = S/ntab


plt.plot(ntab,Xbar,label='Sn/n')
plt.xlabel('n')
plt.show()

## Exercice 2

In [None]:
mu = stat.binom(10,0.2)
#mu = stat.expon(scale=1/0.5)

# Espérance et Variance
m = mu.mean()
s = mu.std()
print('E(X) =',m)
print('Var(X) =',s**2)

# Calcul de la variable renormalisée
N = 100
K = 10000
X = mu.rvs(size=(K,N))
ntab = np.tile(np.arange(1,N+1),(K,1))
Y = ntab**0.5 * (np.cumsum(X,1)/ntab - m)

# Illustration de la cv en loi avec les fonctions de répartition
Ys = np.sort(Y,0)
ordon = np.arange(1,K+1)/K
# Fdr limite
x = np.linspace(-3*s,3*s,1000)
norcdf = stat.norm.cdf(x,0,s)

# Figure
plt.figure(dpi=160)
plt.plot(Ys[:,3],ordon,color='r',label='FdREmp, N=3',linewidth=0.5)
plt.plot(Ys[:,20],ordon,color='g',label='FdREmp, N=20',linewidth=0.5)
plt.plot(Ys[:,99],ordon,color='b',label='FdREmp, N=99',linewidth=0.5)
plt.plot(x,norcdf,color='black',label='FdR limite')
plt.xlim(-3*s,3*s)
plt.legend()
plt.show()

In [None]:
# Avec les densités maintenant
x = np.linspace(-5*s,5*s,1000)
norpdf = stat.norm.pdf(x,0,s)
plt.figure(dpi=120)
plt.hist(Y[:,99],bins=30,density=True,label='Histogramme')
plt.plot(x,norpdf,label='Densité limite')
plt.legend()
plt.show()

## Exercice 3

In [None]:
K = 100000
N = 30
X = stat.bernoulli.rvs(1/2,size=(K,N))
p = np.tile(1/2**np.arange(1,N+1),(K,1))
U = np.cumsum(X*p,1)

# Convergence ps
plt.figure(dpi=120)
plt.plot(U[0,:],'black')
plt.plot(U[1,:],'r')
plt.plot(U[2,:],'g')
plt.plot(U[3,:],'b')
plt.show()

# Loi de U_N
plt.figure(dpi=120)
plt.hist(U[:,N-1],bins=30,density=True)
plt.show()

In [None]:
# Même chose avec un développement tryadique
K = 1000000
N = 30
X = 2*stat.bernoulli.rvs(1/2,size=(K,N))
p = np.tile(1/3**np.arange(1,N+1),(K,1))
U = np.cumsum(X*p,1)

# Convergence ps
plt.figure(dpi=120)
plt.plot(U[0,:],'black')
plt.plot(U[1,:],'r')
plt.plot(U[2,:],'g')
plt.plot(U[3,:],'b')
plt.show()

# Loi de U_N
plt.figure(dpi=120)
plt.hist(U[:,N-1],bins=3**4,density=True)
plt.show()

In [None]:
# Fonction de répartition empirique
Us = np.sort(U[:,N-1])
y = np.arange(1,K+1)/K
plt.figure(dpi=120)
plt.plot(Us,y)
plt.title('Approximation de l\'escalier du diable')
plt.show()

## Exercice 4

In [None]:
K = 10000
n = 5
lam = 2

X = stat.expon.rvs(scale=1/lam,size=(K,n))
Y = lam*np.max(X,1)-np.log(n)

plt.figure(dpi=120)
plt.hist(Y,bins=30,density=True)
plt.show()

## Exercice 5

### Approximation Poisson-Binomiale

In [None]:
# Comparer les distributions discrètes
n = 40
p = 0.1

x = np.arange(0,n+1)
y1 = stat.binom.pmf(x,n,p)
y2 = stat.poisson.pmf(x,n*p)
plt.figure(dpi=120)
plt.vlines(x-0.2,0,y1,'b',label="B(n,p)")
plt.vlines(x+0.2,0,y2,'r',label="P(n*p)")
plt.legend()
plt.show()

In [None]:
# Comparer les fonctions de répartition
n = 40
x = np.arange(0,n+1)

plt.figure(dpi=120)
p = 0.8
y1 = stat.binom.cdf(x,n,p)
y2 = stat.poisson.cdf(x,n*p)
plt.plot(x,y1,'k',label="B(n,p)")
plt.plot(x,y2,'k--',label="P(n*p)")
p = 0.5
y1 = stat.binom.cdf(x,n,p)
y2 = stat.poisson.cdf(x,n*p)
plt.plot(x,y1,'r')
plt.plot(x,y2,'r--')
p = 0.3
y1 = stat.binom.cdf(x,n,p)
y2 = stat.poisson.cdf(x,n*p)
plt.plot(x,y1,'g')
plt.plot(x,y2,'g--')
p = 0.1
y1 = stat.binom.cdf(x,n,p)
y2 = stat.poisson.cdf(x,n*p)
plt.plot(x,y1,'b')
plt.plot(x,y2,'b--')
plt.legend()
plt.show()

In [None]:
# Comparer avec un échantillon de la loi binomiale
n = 40
p = 0.1
K = 10000

x = np.arange(0,n+1)
y2 = stat.poisson.pmf(x,n*p)

X=stat.binom.rvs(n,p,size=K)
(Xc,_) = np.histogram(X,bins=np.arange(0,n+2))
Xc = Xc/K

plt.figure(dpi=120)
plt.vlines(x-0.2,0,Xc,'b',label="B(n,p) ech")
plt.vlines(x+0.2,0,y2,'r',label="P(n*p)")
plt.legend()
plt.show()

In [None]:
# Attention, utiliser directement un histogramme 
# avec des bins de largeur différente de 1 pose un problème de normalisation :

x = np.arange(0,n+1)

# Avec des bins mal ajustés :
plt.figure(dpi=120)
plt.hist(X,bins=30,density=True)
#plt.hist(X,bins=np.arange(0,n+2),density=True)
plt.vlines(x+0.2,0,stat.poisson.pmf(x,n*p),'r',label='limite')
plt.legend()
plt.show()

# Avec des bins bien ajustés :
plt.figure(dpi=120)
plt.hist(X,bins=np.arange(0,n+2),density=True)
plt.vlines(x+0.2,0,stat.poisson.pmf(x,n*p),'r',label='limite')
plt.legend()
plt.show()

### Approximation Binomiale-Normale

In [None]:
n = 30
p = 0.5
K = 10000
S = stat.binom.rvs(n,p,size=(K,1))
Z = (S-n*p)/np.sqrt(n*p*(1-p))
b = (np.arange(0,n+2)-n*p)/np.sqrt(n*p*(1-p))

x = np.linspace(-4,4,1000)
y = stat.norm.pdf(x)

plt.figure(dpi=120)
plt.hist(Z,bins=b,density=True,align='left')
plt.plot(x,y,label='N(O,1)')
plt.xlim(-4,4)
plt.show()

In [None]:
# Même chose avec les Fonctions de répartition
x = np.linspace(-4,4,1000)
plt.figure(dpi=120)
z1 = stat.norm.cdf(x)
plt.plot(x,z1,label='N(0,1)')

n = 200; p = 0.2
z2 = stat.binom.cdf(n*p+np.sqrt(n*p*(1-p))*x,n,p)
plt.plot(x,z2,label=f'B('+str(n)+','+str(p)+')')
plt.legend()
plt.show()

In [None]:
# Attention, là encore, utiliser des bins mal adaptés conduit
# à des problèmes de normalisation.
# Remarquez que ce problème n'apparaît pas lorsqu'on utilise 
# les fonctions de répartition (où il n'y a pas de bins à choisir)

n = 30
p = 0.5
K = 10000
S = stat.binom.rvs(n,p,size=(K,1))
Z = (S-n*p)/np.sqrt(n*p*(1-p))

x = np.linspace(-4,4,1000)
y = stat.norm.pdf(x)

plt.figure(dpi=120)
plt.hist(Z,bins=30,density=True,align='left')
plt.plot(x,y,label='N(O,1)')
plt.xlim(-4,4)
plt.show()