# Gestion des fichiers avec Python

Pour ce notebook il faut placer dans le dossier **data** le fichier : **fable.txt**

*Objectifs :* 
 - ouvrir un fichier
 - lire son contenu
 - enregistrer un fichier

*Utilisation :* Ce notebook permet de découvrir la manipulation des fichiers avec Python. La quasi totalité des cellules de code sont fonctionnelles. Il s'agira essentiellement de les exécuter pour aller voir le résultat obtenu. Bien lire les commentaires associés.

## 1-"Ouvrir un fichier"

Lorsque l’on est **utilisateur** d’un logiciel, on rencontre essentiellement trois actions concernant un fichier : * Nouveau *, * Ouvrir * et *Enregistrer * et éventuellement * Enregistrer sous *.
L’option * Ouvrir * consiste alors à aller chercher un fichier déjà existant sur un périphérique de sauvegarde (disque dur, clé USB, serveur…) et en faire apparaître le contenu à l’intérieur du logiciel.

**En programmation** le terme ouvrir un fichier recouvre une signification plus large.
 En Python, la fonction native s’appelle **open( )** et elle peut prendre plusieurs paramètres (jusqu’à 8 !). 
 
 Dans une première approche, on n’utilisera que les deux premiers, pour l’utiliser sous la forme : 
 
 **open(‘chemin/nom_du_fichier’ , ‘mode d’ouverture’)**

 • ‘chemin/nom_du_fichier’ : chaîne de caractère qui permet de localiser le fichier. Si on ne donne que le nom du fichier,
 alors ce fichier devra se trouver dans le répertoire courant.
 
 • ‘mode d’ouverture’ : un ou plusieurs caractères selon le tableau suivant :

![mode_ouverture.png](images/mode_ouverture.png)

L’utilisation de la fonction open(), qui sera la première fonction à appeler, nécessite de **savoir par avance ce que l’on veut faire…**
Si on omet de renseigner le paramètre ‘mode d’ouverture’, alors par défaut on ouvrira le fichier spécifié en lecture et en mode texte.
Cette fonction **open()** renvoie un *objet fichier*, elle s’utilisera donc sous la forme :
```python
fichier = open(‘chemin/nom_du_fichier’ , ‘mode d’ouverture’)
```
dans laquelle *fichier* est le *nom de la variable* que l’on attribuera à cet ‘objet fichier’

Cet *objet fichier* pourra être manipulé ensuite avec différentes méthodes telles que :
 - read(),
 - readline()
 - readlines() 
 - write()
 
**IMPORTANT :** Une fois que l’on aura fini le traitement des différentes instructions liées au fichier il sera impératif de **fermer l’objet fichier** en utilisant la méthode **close()** de façon à libérer des ressources systèmes :
```python 
fichier.close()
```

## 2- Lire un fichier texte

On cherche ici à lire le contenu d’un fichier texte existant. Vérifier que le fichier **fable.txt** est présent dans le dossier **data**. Il s'agit d'un texte de Jean de La Fontaine bien connu…

### 2.1- La méthode read(size) :
Le paramètre size est optionnel.

In [None]:
# Utilisation de la méthode read(), le paramètre size étant omis :
fichier = open('data/fable.txt','r')
contenu = fichier.read()
# ne pas oublier :
fichier.close()

# ... et maintenant on travaille sur ce que l'on a récupéré :
print(type(contenu))
print(contenu) 


 - quel est le type de la variable *contenu* ? C'est important de le repérer pour savoir comment manipuler cette variable par la suite !
 - que renvoie la méthode *read()* lorsque le paramètre *size* est omis ?

In [None]:
# Utilisation de la méthode read(), le paramètre size étant réglé à la valeur 10 :
fichier = open('data/fable.txt','r')
contenu = fichier.read(10)
# ne pas oublier :
fichier.close()

# ... et maintenant on travaille sur ce que l'on a récupéré :
print(type(contenu))
print(contenu) 

- que renvoie la méthode *read(size)* lorsque le paramètre *size* est utilisé ? (modifier ce paramètre : par exemple l'augmenter de façon significative...)

### 2.2- La méthode readline(size) :

Elle permet de lire une ligne ou une partie d’une ligne d’un fichier texte

Le paramètre size est optionnel.

In [None]:
# Utilisation de la méthode readline(), le paramètre size étant omis :
fichier = open('data/fable.txt','r')
ligne = fichier.readline()
# ne pas oublier :
fichier.close()

print(type(ligne)) # cet affichage nous permet de savoir quel est le type de la variable 'ligne'
print(ligne) 

 - quel est le type de la variable *ligne* ? C'est important de le repérer pour savoir comment manipuler cette variable par la suite !
 - que renvoie la méthode *readline()* lorsque le paramètre *size* est omis ?

In [None]:
# Utilisation de la méthode readline(size), le paramètre size étant réglé à la valeur 10 :
fichier = open('data/fable.txt','r')
ligne = fichier.readline(10)
# ne pas oublier :
fichier.close()

print(type(ligne))
print(ligne) 

 - que renvoie la méthode *readline()* lorsque le paramètre *size* est utilisé ? (modifier ce paramètre : par exemple l'augmenter pour qu'il dépasse le nombre de caractères de la ligne *Maître Corbeau, sur un arbre perché,*)

*Remarque* : La fin d’une ligne dans un fichier texte est spécifiée par le caractère non imprimable **0x0A** (en hexadécimal). Dans le code ASCII il correspond à **LF** pour *Line Feed* (qui signifie passer à la ligne suivante)

Ce code est également noté **\n** en Python ( \ est le *caractère d’échappement* (pour signifier que le caractère suivant ne doit pas être pris dans son rôle habituel) et *n* est la symbolique pour *newline*).

Si on ouvre le fichier **fable.txt** avec un éditeur héxadécimal, on pourra repérer dedans cet octet (**0A**) à chaque de fin de ligne :

![fable_hexadec.png](images/fable_hexadec.png)


#### Lire l'intégralité du fichier avec readline() :

La méthode readline() renvoie une chaîne de caractères. Si cette chaîne est vide c’est que l’on a atteint la fin du fichier. En se basant sur cette propriété, modifier le programme pour lire l'intégralité du fichier **fable.txt** ligne par ligne à l’aide d’une boucle while :

In [None]:
# lecture de toutes les lignes du fichier avec readline():
fichier = open('data/fable.txt','r')
ligne = ' '
while ???
 ???
 ...
 ???
fichier.close()


Dans la cellule ci-dessous, reprendre le code précédent pour afficher la fable avec la numérotation des lignes.

Exemple de résultat :

1 	 Maître Corbeau, sur un arbre perché,

2 	 Tenait en son bec un fromage.

3 	 Maître Renard, par l'odeur alléché,

4 	 Lui tint etc ...


In [None]:
# lecture de toutes les lignes du fichier avec readline() et ajout de la numérotation :
fichier = open('data/fable.txt','r')
ligne = ' '
???
...
???

fichier.close()

#### Caractère itérable d'un objet fichier :

Remarque : l’objet fichier étant itérable, on peut le parcourir avec l’instruction for … in … .
Tester le code suivant, puis le modifier pour ajouter la numérotation des lignes

In [None]:
fichier = open('data/fable.txt','r')

for ligne in fichier:
 print(ligne, end='')
 
fichier.close()

### 2.3-La méthode readlines(size) :

**Bien remarquer la lettre 's' qui distingue cette méthode de la précédente ! ** 

Le 's' de readlines nous incite à penser que cette méthode permet de lire plusieurs lignes du fichier texte.

Le paramètre size est optionnel.

Mettre en oeuvre cette méthode en précisant ou pas une valeur pour le paramètre *size* :

In [None]:
fichier = open('data/fable.txt','r')
contenu = ???
fichier.close()

print(type(contenu))
print(contenu) 


 - on constate ici que readlines() renvoie une **liste**.
 - compléter le code ci-dessus pour afficher le type d'un élément de cette liste

** Remarque importante :** 
Les différentes méthodes de lecture à disposition **renvoient des types différents**. Cette *"préparation" initiale* des données aura une incidence sur le traitement à mettre en oeuvre par la suite. 

**Il est donc nécessaire de bien réfléchir à ce que l'on veut faire avec les données présentes dans le fichier avant d'envisager l'une ou l'autre de ces méthodes !**

## 3- Ecrire dans un fichier texte :

Pour écrire dans un fichier texte, il est nécessaire de l’ouvrir en choisissant le bon mode d’ouverture. 

Il faut aussi se poser la question : le fichier existe-t-il déjà ou bien allons nous le créer ?

### 3.1- Créer un fichier et écrire du texte dedans :

Le mode **‘w’** permet de *créer un fichier qui n’existe pas et d’écrire dedans*.
 
 Attention : s’assurer de donner au nom du fichier, un nom de fichier qui **n’existe pas** dans le répertoire de travail, **sinon il sera écrasé**. 
 
 Pour les essais qui sont proposés ci-dessous, on crée un fichier nommé **essai_ecriture.txt** dans le dossier **data**.
 On pourra garder successivement le même nom de fichier (en sachant que le contenu précédent sera perdu) sinon en changer le nom. 
 Observer le résultat obtenu en ouvrant ce fichier **essai_ecriture.txt** à l’aide d'un éditeur de texte (exemple *gedit* sous Linux) et noter vos observations.

In [None]:
# premier essai :
fichier = open('data/essai_ecriture.txt','w')
fichier.write('ok !')
fichier.close()

Pour voir le résultat de l'exécution de la cellule ci-dessus, ouvrir le dossier **data** : on doit y trouver le fichier créé. L'ouverture avec un éditeur de texte permet d'en vérifier le contenu :

![ecriture_fichier.png](images/ecriture_fichier.png)

In [None]:
# Deuxième essai d'écriture :
fichier = open('data/essai_ecriture.txt','w')
fichier.write('Première ligne')
fichier.write('Deuxième ligne')
fichier.close()

Ce deuxième essai ne donne pas ce que l'on souhaitait, à savoir l'écriture de deux lignes distinctes de texte :

![essai_ecriture2.png](images/essai_ecriture2.png)

Les deux écritures réalisées avec la méthode **write()** sont réaliséess l'une à la suite de l'autre.

L'observation dans un éditeur hexadécimal:

![essai_ecriture2_hexa.png](images/essai_ecriture2_hexa.png)

montre la raison : à la fin de la première ligne, le caractère ASCII de nouvelle ligne (LF, codé 0A en hexadécimal) n'est pas présent. On va l'ajouter (en Python : \n)

In [None]:
# Deuxième essai d'écriture CORRIGÉ:
fichier = open('data/essai_ecriture.txt','w')
fichier.write('Première ligne\n') # l'ajout de la séquence d'échappement \n permet le passage à la ligne
fichier.write('Deuxième ligne')
fichier.close()

On obtient bien le résultat attendu :

![essai_ecriture2_resultat.png](images/essai_ecriture2_resultat.png)

In [None]:
# Remarque : on peut simplifier le code avec une seule instruction write() :
fichier = open('data/essai_ecriture.txt','w')
fichier.write('Première ligne\nDeuxième ligne ???')
fichier.close()

### 3.2- Créer un fichier, écrire du texte dedans et lire son contenu :

*Remarque :* on utilise ici un nouveau nom de fichier pour chaque cellule **essai_ecriture_V2.txt** puis **essai_ecriture_V3.txt** ...

#### 3.2.1- Premiers essais :

*Remarque :* on utilise ici un nouveau nom de fichier pour chaque cellule **essai_ecriture_V2.txt** puis **essai_ecriture_V3.txt** 

Commençons par un programme qui ne va pas fonctionner... :
 - on ouvre le fichier avec le mode 'w' 
 - on écrit du texte dedans (méthode write())
 - puis on appelle la méthode readlines() pour relire le contenu 

In [None]:
# ce programme va générer une erreur. Pourquoi ?
fichier = open('data/essai_ecriture_V2.txt','w')
fichier.write('Première ligne\nDeuxième ligne')
contenu = fichier.readlines()
fichier.close()

print(contenu)

Le programme ci-dessous présente une petite modification qui va éviter cette erreur. Mais :
 - le contenu du fichier est-il affiché comme demandé ?
 - vérifier que le fichier **essai_ecriture_V3.txt** contient bien cependant le contenu écrit dedans

In [None]:
# le programme corrigé : remarquer la modification dans la première ligne (relire le tableau donné au paragraphe 1)
fichier = open('data/essai_ecriture_V3.txt','w+')
fichier.write('Première ligne\nDeuxième ligne')
contenu = fichier.readlines()
fichier.close()

print(contenu)
# ... mais le contenu du fichier est-il affiché ? 

#### 3.2.2 - Se positionner dans un fichier avec les méthodes tell() et seek()

L’objet fichier est un objet itérable : pour se déplacer dedans, on utilise **un index**. Cet index n’est pas spécifié en Python lors de l’utilisation de toutes les méthodes vues jusqu’à présent.

On dispose de deux autres méthodes :
 - La méthode **tell()** permet de connaître la valeur actuelle de l’index. Elle renvoie un entier. 
 - la méthode **seek(offset, origine)** permet de placer l’index en un endroit précis du fichier à l'aide des paramètres **offset** et **origine** :
 - offset : décalage 
 - origine : 
 - valeur par défaut : 0 le décalage est réalisé à partir du début du fichier
 - 1 : le décalage est réalisé à partir de la valeur actuelle de l’index
 - 2 : le décalage est réalisé à partir de la fin du fichier
 

In [None]:
fichier = open('data/essai_ecriture_V4.txt','w+')
fichier.write('Première ligne\nDeuxième ligne')
contenu = fichier.readllines()

print('index actuel = ',fichier.tell())

fichier.close()

Observer la valeur obtenue pour cet index (31) avec le contenu du fichier observé avec un éditeur hexadécimal :

![essai_ecriture_V4.png](images/essai_ecriture_V4.png)

...l'index *pointe* à la fin du fichier après l'octet de valeur 0x65, donc il n'y a rien à lire !

Pour corriger ce problème, **il faut remettre l'index à l'endroit désiré dans le fichier !**

Remettons le au début (= on veut donc mettre le paramètre *offset* à 0) :

In [None]:
fichier = open('data/essai_ecriture_V5.txt','w+')
fichier.write('Première ligne\nDeuxième ligne')

fichier.seek(0) # on met ici offset à 0 ; le paramètre origine garde sa valeur par défaut (0)
 # cela signifie que l'on décale de 0 (offset) l'index par rapport à une origine 0
print('index actuel = ',fichier.tell())
contenu = fichier.read()
print('index après lecture = ',fichier.tell(), '\n')

print('Contenu du fichier :')
print(contenu)

fichier.close()

Modifier dans le code ci-dessus la valeur de l'offset tout en gardant la valeur par défaut du paramètre *origine* pour bien comprendre le fonctionemment de la méthode seek().

### 3.3- Ecrire du texte dans un fichier existant

On suppose que le fichier **essai_ecriture_V5.txt** existe dans le répertoire **data**, et qu’il est dans l’état fourni par le dernier programme exécuté ci-dessus.

Dans la cellule ci-dessous, on utilise le **mode append (‘a’)** :

 - Quel en est l’effet :

 - Comment le programme précédent (celui qui créait les deux premières lignes de texte aurait du être modifié pour que l’aspect visuel du nouveau fichier créé soit correct (affichage de 4 lignes séparées) ?

**A RETENIR : Quand on écrit dans un fichier, penser à la terminaison du fichier !... **

 - peut-on lire le fichier dans ce mode append ?

 - proposer une modification du programme

**ATTENTION** : la méthode d'ouverture choisie *append* ajoute toujours les données à la fin du fichier (s'il existe déjà)... Si on exécute plusieurs fois la cellule, le contenu du fichier va devenir incohérent avec ce que l'on souhaite faire. Il faudra alors réexécuter la cellule précédente pour retrouver le fichier *essai_ecriture_V5.txt* dans son état d'origine

In [None]:
nom_fichier = 'essai_ecriture_V5.txt'
fichier = open('data/' + nom_fichier ,'a')
fichier.write('Troisième ligne \nQuatrième ligne')
fichier.close()

print('Ouvrir le fichier ',nom_fichier, 'dans un éditeur de texte pour vérifier le résultat obtenu')

**Expérimenter et expérimenter encore car le travail sur les fichiers n’est pas si simple… et attention aux fichiers utilisés pour ces expérimentations car on a vite fait de les détruire sans le vouloir ! Donc travailler dans un dossierspécialement créé pour ces expérimentations...**


## 4- Application : Retour sur la fable de La Fontaine :

Ecrire un programme en Python qui prend un fichier **fable.txt**, le **laisse intact**, et crée un fichier **fable_num.txt** contenant le **même texte** mais **avec la numérotation des lignes** :

![transformation_fable.png](images/transformation_fable.png)

S'entraîner à faire différentes numérotations... On numérote :
 - toutes les lignes 
 - seulement les lignes paires
 - la première ligne puis les lignes 5, 10, 15 

*Coup de pouce :* il faut *ouvrir* deux fichiers :
 - un fichier *source* (la fable) que l'on va ouvrir pour en lire le contenu
 - un fichier de *destination* qui n'existe pas encore (fable_num.txt) et dans lequel on va écrire

A la fin du travail sur ces fichiers, penser à appliquer la méthode **close()** dessus.



In [None]:
# le programme à écrire :
???
...
???