# Introduction à Python

L'objectif de ce TP est de vous présenter des bases de programmation en Python (et notamment les principaux types que nous rencontrerons pendant l'année), ainsi que de vous familiariser avec l'environnement de programmation Jupyter. Pour travailler ce TP, il s'agit d'exécuter les cellules de code une par une (avec Ctrl+Entrée ou avec Shift+Entrée pour passer à la suivante), d'observer les sorties qui s'affichent après chaque cellule, et de les comprendre en examinant finement le code qui les a généré. Certaines cellules ont été sciemment écrites pour produire des erreurs que vous devrez comprendre (bien lire les messages d'erreur !). Vous pouvez également modifier le contenu des cellules, les réexécuter, et observer l'impact sur les sorties produites.

Lorsque vous ouvrez ce notebook, une instance du logiciel python3 (un "noyau") est démarrée en fond, mais vous ne voyez pas la console python3 correspondante. Vous pourrez simplement observer les sorties des commandes que vous lancer ci-dessous.

Pour accompagner le travail sur ce TP, vous êtes invités à vous familiariser avec l'aide de Python (accessible via la barre de menus ci-dessus). Pour consolider vos bases, il est également conseillé de parcourir brièvement les parties 3 à 5 du tutoriel Python accessible au lien suivant : <br/>
https://docs.python.org/3.7/tutorial/index.html <br/>
Pour bien maîtriser l'environnement jupyter-notebook, vous pouvez parcourir la page "Aide Notebook" (accessible via la barre de menus ci-dessus), et en particulier les parties "Notebook basics" et "Running Code" : <br/>
https://nbviewer.jupyter.org/github/ipython/ipython/blob/3.x/examples/Notebook/Index.ipynb

## Variables, listes, tuples

In [None]:
a=4
print(a)

In [None]:
print(type(a))
b=2.
print(type(b))
q = 2/a
print(q)
print(type(q))

Dans la suite, nous aurons besoin de la librairie de calcul scientifique numpy. Par exemple, elle contient un grand nombre de fonctions usuelles, ainsi que les valeurs de nombres remarquables comme $\pi$.

In [None]:
import numpy as np
print(np.pi)
print(np.exp(3))
print(np.cos(2*np.pi))

À noter que numpy supporte également le calcul sur des nombres complexes. <br/>
Attention, `1j` représente le nombre complexe $i$ (racine carrée de -1) et non pas $j$ (racine cubique de 1).

In [None]:
print(1j**2)
a = (1-np.sqrt(3)*1j)/2
print(a.real, a.imag)
print(a**3, '\n')  # Le caractère \n permet de passer une ligne

print(type(a))
print(type(a**3))  # un type complexe alors que a**3 représente un nombre réel !
print('\n')

alpha = np.angle(a)
print(alpha)
print(np.cos(alpha))
print(np.sin(alpha))

**Python fait appel à un certain nombre de types de base à connaître. Nous ne les utiliserons pas systématiquement, mais il est important de les connaître pour bien comprendre les messages d'erreur que vous rencontrerez.**

**D'abord, le type "list" permet de représenter des collection d'objets.**

**NB: En Python, l'indexation commence par l'indice 0.**

In [None]:
A = [[1,2], [4,5,6]]
print(type(A))
print(A)
print(len(A))  # IMPORTANT : longueur de la liste

print('\n')
print(A[0])
print(type(A[0]))
print(A[1][2])

**Le type "tuple" est une collection d'objets séparés par des virgules. Si besoin, on peut le délimiter par des parenthèses.**

In [None]:
At = ((1,2),(4,5,6))
print(type(At))
print(At)
print(*At)  # unpack values of the tuple
print(At[0])
print(At[0][1])

En fait, un tuple est une collection d'objets séparés par des virgules (les parenthèses sont facultatives)

In [None]:
At0 = 1,2
At1 = 4,5,6
Att = At0,At1
print(Att)
Att2 = *At0,*At1
print(Att2)

La différence entre liste est tuple est que la liste est modifiable alors que le tuple ne l'est pas.

In [None]:
A[0] = [3,4]
print(A)
At[0] = [3,4]

De même, on peut facilement ajouter un élément à la fin d'une liste avec `append` (ou enlever le dernier élément avec `pop`), alors que cette fonction n'existe pas pour les tuples. Ainsi, le type liste est particulièrement utilisé pour stocker des valeurs d'un algorithme itératif, sans avoir à prévoir le nombre d'itérations à l'avance.

In [None]:
print(A)
A.append("blibla")
print(A)
print(A.pop())
print(A)
print('\n')

print(At)
At.append("blibla")

Ainsi, les tuples permettent d'écrire des données en lecture seule, et peuvent être parcourus plus vite que les listes.
Cela étant dit, ni les tuples, ni les listes ne permettent de définir de structure matricielle. On ne peut donc pas les parcourir avec des indices matriciels :

In [None]:
print(A[1,2])

## Numpy arrays (tableaux et matrices)

**Pour définir des matrices, on utilisera des Numpy arrays.** C'est sans doute le type que vous utiliserez le plus souvent dans vos simulations.

In [None]:
A = np.array([[1.,2.,3.], [4.,5.,6.]])
print(A,'\n')
print(A[0,0],'\n')
print(A[1,2],'\n')
print(A.T, '\n')

print(type(A))
print(type(A[0]))

On notera que l'attribut `shape` renvoie un tuple. En Python, les dimensions de tableaux sont généralement représentées par des tuples (d'où l'apparition de ce mot dans de nombreux messages d'erreur).

In [None]:
print(len(A))
print(A.shape)

In [None]:
# Si les nombres de ligne/colonne ne sont pas les mêmes à l'initialisation, alors on obtient un Numpy array qui contient des listes !
B = np.array([[1.,2.], [4.,5.,6.]])
print(type(B))
print(type(B[0]))
# Ce genre de construction est à éviter...

In [None]:
# On peut accéder aux élements de façon cyclique...
print(A[-1,-1])
print(A[-1,-2])
print(A[-1,-3])
# ... jusqu'à ce qu'on ait fait tout le tour
print(A[-1,-4])

In [None]:
# Voyons maintenant comment concaténer des numpy arrays. 
# Il y a plusieurs fonctions pour cela, et souvent plusieurs manières d'aboutir au même résultat.

A2 = np.array([[7,8,9],[10,11,12]])

B1 = np.block([A,A2])
print(B1,'\n')
B1t = np.hstack((A,A2))
print(B1t,'\n')

B2 = np.block([[A],[A2]])
print(B2,'\n')
B2t = np.vstack((A,A2))
print(B2t,'\n')

B3 = np.tile(A,(1,3))
print(B3,'\n')
B4 = np.tile(A,(3,1))
print(B4,'\n')

In [None]:
# Vous pouvez appeler l'aide d'une fonction directement dans le notebook.
help(np.block)

In [None]:
C = np.arange(0,10)
print(C)
print(type(C))

In [None]:
# Extraire une partie d'un numpy array
print(C[0:5])    
print(C[np.arange(0,5)])

In [None]:
print(C[2:])    # du troisième élément jusqu'à la fin
print(C[::2])   # de deux en deux
print(C[1::2])  # de deux en deux en partant du deuxième élément
print(C[::-1])  # à l'envers

In [None]:
# Mais attention, la syntaxe a:b ne permet pas de définir une variable (contrairement avec Scilab ou Matlab)
Ct = 0:10
print(Ct)

In [None]:
# Attention aussi à l'indexation cyclique qui s'arrête au bord du vecteur ! :
print(C[-4:])
print(C[-4:0])
print(C[-4:-1])

In [None]:
# Nombres uniformément répartis sur un intervalle :
D = np.linspace(0,1,100)
print(D)

In [None]:
print(D.shape)
print(D.T.shape)  # transposition
print(D.ndim)
D2 = D[:,np.newaxis]  # on ajoute une dimension ...
print(D2.ndim)
print(D2.shape)
print(D2.T.shape)     # ... qui permet de faire une vraie transposition de la matrice

## Opérations matricielles

In [None]:
A = np.array([[1.,2.,3.], [4.,5.,6.]])
print(A)

In [None]:
print(A[0])
print(A[:,1])

**⚠ Attention ⚠ Numpy assigne par référence.** Autrement dit, lors d'une affectation de numpy arrays, les données ne sont pas copiées en mémoire (les deux variables pointent donc vers la même case mémoire) :

In [None]:
B = A
B[0,0] = 0
print(B,'\n')
print(A)

Vous pouvez constater qu'en modifiant B, A a également été affectée.
C'est également le cas si vous extrayez une ligne ou une colonne :

In [None]:
a = A[1]
a[0] = 0
print(A)

En revanche...

In [None]:
print(A,'\n')
B = A.copy()
B[0,0] = 10
print(B,'\n')
print(A,'\n')

Les autres opérations matricielles ne posent pas spécialement de problèmes. 

In [None]:
A = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(type(A))
print(A.ndim)
print(A.shape)
print(A.size,'\n')
print(2*A,'\n')
print(1+A,'\n')

Z = np.zeros((5,4))
print(Z,'\n')
U = np.ones((5,4))
print(U,'\n')

In [None]:
print(A,'\n')
print(np.sum(A),'\n')
print(np.sum(A,0),'\n')
print(np.sum(A,1),'\n')
print(np.cumsum(A),'\n')          # sommes cumulatives (très important !)
print(np.cumsum(A,0),'\n')
print(np.cos(np.pi/2*A))

**⚠ Attention ⚠ à ne pas confondre la multiplication terme à terme avec la multiplication matricielle.**

In [None]:
I = np.eye(3)
print(I,'\n')
print(A@I,'\n')
print(A*I,'\n')

De même, les puissances sont par défaut effectuées terme à terme

In [None]:
print(A,'\n')
print(A**2)
# ne pas confondre avec l'accent circonflexe qui en Python correspond au "ou exclusif bit à bit"

In [None]:
a = np.arange(1,10)
print(a,'\n')
print(a**2,'\n')
print(1/a,'\n')
print(np.cumsum(1/a),'\n')

Numpy contient une librairie d'algèbre linéaire :

In [None]:
print(np.linalg.det(A),'\n')
[eigval,eigvect] = np.linalg.eig(I)
print(eigval,'\n')
print(eigvect,'\n')

## Conditions, Tests, et Boucles

In [None]:
a = np.arange(1,10)
print(a)
print(a>5)
a[a>5] = 0
print(a)
print(a==5)

In [None]:
x = np.random.rand()
if x>0.3:
    print("gagné!")
else:
    print("perdu")

**⚠ Attention ⚠ En Python, l'indentation est importante pour marquer l'entrée ou la sortie d'une boucle.**

In [None]:
for i in range(0,5):
    print(i)
print("La boucle est finie.")

Noter que la fonction range est spécialement conçue pour ce type d'itérateur (en fait, les éléments sont générés un par un à la volée sans stocker la liste globale). 
Mais on peut également itérer sur d'autres types de données :

In [None]:
a = np.arange(0,5)
print(type(a),'\n')
for i in a:
    print(i)

In [None]:
noms = ('sean','george','roger','timothy','pierce','daniel','lashana')
print(type(noms),'\n')
print(type(noms[0]),'\n')
for a in noms:
    print(a)

In [None]:
i = 0
while i<6:
    if i%2:
        print(i,'est impair')
    else:
        print(i,'est pair')
    i = i+1

## Graphes

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-1,1,1000)
y = np.exp(x)

plt.plot(x,y)
plt.show()

In [None]:
x = np.linspace(0,2*np.pi,1000)

plt.plot(x,np.sin(x),label="sin")
plt.plot(x,np.cos(x),label="cos")
plt.xlim(0,2*np.pi)
plt.ylim(-1,1)
plt.xlabel('angle en radians')
plt.title('Fonctions trigonométriques')
plt.legend()
plt.show()

In [None]:
# On peut également imposer un formattage de chaque courbe
x = np.linspace(0,2*np.pi,30)
plt.plot(x, np.sin(x), "r", linewidth=4)
plt.plot(x, np.sin(x)-0.2, "b:", linewidth=3)
plt.plot(x, np.sin(x)-0.4, "g--o", linewidth=2)
plt.plot(x, np.sin(x)-0.6, "m:.", linewidth=1)
plt.show()

## Tirages aléatoires, Histogrammes

In [None]:
# Vous pouvez générer des variables aléatoires avec les fonctions de np.random.
# Mais on peut aussi utiliser la sous-librairie scipy.stats qui est plus complète.
import scipy.stats as stat

In [None]:
# Nombres aléatoires uniformes sur (a,b)
a = -1
b = 2
X = a + (b-a)*stat.uniform.rvs(size=(100,10))
print(X[0:3,0:5],"\n")
X = stat.uniform.rvs(a,b-a,size=(100,10))
print(X[0:3,0:5],"\n")

In [None]:
# Nombres aléatoires entiers uniformes sur {0,...,4}
X = stat.randint.rvs(0,5,size=(10,20))
print(X)
# Bien noter que la borne supérieure est exclue !
X = stat.randint.rvs(0,5,size=10000)
plt.hist(X, density=True, bins=np.arange(0,6), align='left')
plt.show()

In [None]:
# TRES IMPORTANT !
# Si l'on veut tirer suivant une loi discrète non uniforme, on utilisera np.random.choice.
# (c'est la seule fois qu'on privilégiera np.random plutôt que scipy.stats)
p = [0.25, 0.2, 0.3, 0.05, 0.2]
X = np.random.choice(np.arange(0,5),10000,p=p)
plt.hist(X, density=True, bins=np.arange(0,6), align='left')
plt.show()

In [None]:
# Nombres aléatoires gaussiens N(0,1)
X = stat.norm.rvs(0,1,size=(100,1000))
print("mean =",np.mean(X))
print("std =",np.std(X))

In [None]:
import matplotlib.pyplot as plt

# Nombres aléatoires N(mu,s2)
m = 3
s = 2
X = stat.norm.rvs(m,s,size=(10000,1))
print(np.mean(X))
print(np.std(X))

# Comparer l'histogramme et la densité sous-jacente
plt.hist(X, bins=30, density=True)

x = np.linspace(m-5*s,m+5*s,1000)
y = np.exp(-(x-m)**2/(2*s*s))/np.sqrt(2*np.pi*s*s)
plt.plot(x, y, linewidth=2)
plt.savefig("densite_gaussienne.png")
plt.show();

In [None]:
# Nombres aléatoires de loi binomiale
n = 5
p = 0.5
X = stat.binom.rvs(n,p,size=(1000,1))

In [None]:
plt.hist(X, bins=np.arange(0,n+2), align='left', color='white', edgecolor='green', hatch='/')
plt.show()

In [None]:
# Nombres aléatoires de loi de Poisson
lam = 3   # Attention, lambda est un mot-clé réservé en Python
X = stat.poisson.rvs(lam,size=(100,10))
print(np.mean(X))
print(np.var(X))

In [None]:
# Pour retrouver la liste des fonctions relatives aux lois usuelles
help(stat)

In [None]:
#  Pour afficher l'aide associée à une loi en particulier
help(stat.expon)

## Fonctions

In [None]:
def fib(n):    # write Fibonacci series up to n
    a, b = 0, 1
    while a < n:
        print(a, end=' ')
        a, b = b, a+b

In [None]:
fib(100)

Vous pouvez constater que la fonction précédente n'a pas d'argument de sortie. On peut la modifier de façon à récupérer la liste des nombres générés.

In [None]:
def fib2(n):    # write Fibonacci series up to n
    a, b = 0, 1
    l = []
    while a < n:
        l.append(a)
        a, b = b, a+b
    return l

In [None]:
t = fib2(100)
print(t)

De même que pour les boucles, l'indentation est importante pour délimiter le corps de la fonction.
Par ailleurs, une fonction peut également avoir plusieurs arguments de sortie. Dans ce cas, la fonction renvoie un tuple.

In [None]:
def polar(x,y):
    r = np.sqrt(x*x+y*y)
    a = np.arctan2(x,y)
    return r,a

In [None]:
print(polar(0,1))
print(polar(1,0))
print(polar(0,-1))
print(polar(-1,0))

Si la fonction renvoie un tuple, vous pouvez récupérer les deux éléments en même temps dans un tuple, ou bien les récupérer séparément :

In [None]:
rp = polar(0,-1)
print(rp)
r,a = polar(0,-1)
print(r,a)

Vous pouvez aussi écrire des fonctions dans un autre fichier .py et l'importer dans le noyau du notebook :

In [None]:
from tp1_fonctions import *
mafonction()

**⚠ Attention ⚠ Si vous modifiez des fonctions dans le fichier annexe, et que vous réexécutez la commande import, alors ces fonctions ne seront pas réimportées !** <br/>
Pour vous en convaincre, essayez de modifier la fonction du fichier tp1_fonctions.py, réexécutez la cellule précédente. Vous constaterez que la sortie ne change pas.

Pour réimporter la fonction, il faut redémarrer le noyau Python, et relancer la commande import. Mais prenez garde, en redémarrant le noyau Python, vous perdez toutes les valeurs courantes de vos variables ! Nous vous conseillons donc de commencer à écrire vos fonctions directement dans des cellules du notebook. Vous pourrez alors déplacer vos fonctions dans un fichier annexe **une fois qu'elles sont terminées et que vous ne souhaitez plus les modifier**.

# That's all Folks !