#include #include #include #include #include "gestion_des_fichiers/gestion_fichiers.h" #include "main_compress.h" #include "arbre_de_codage/arbre_binaire.h" #define ASCII_EXT 256 // main_compress.c [nom_du_fichier_a_compresser] /*#########################################################################################################*/ /* Partie Gestion de fichiers */ /*#########################################################################################################*/ Bin_file *Ouv_Bit(char *p,char mode) { /*Ouverture d'un fichier et initialisation de la structure Bin_file*/ Bin_file *A; A=malloc(sizeof(Bin_file)); //Libération de l'espace A->mode=mode; //Récupération du mode (ouverture ou écriture) if(mode=='r') { A->file=fopen(p,"rb"); //Ouverture en mode rb/wb. Le b est nécessaire sur windows là où les tests ont été effectués } else { A->file=fopen(p,"wb"); } A->record_length=0; //Initialisation du struct A->i_record=0; A->i_octet=0; A->nb_octets=0; return A; } void Ec_Bit(Bin_file *output,char bit) { /*Ecriture bit à bit dans un fichier*/ unsigned char octet,b; int i; output->octet[output->i_octet]=bit; //Stockage de bit dans le premier élément libre du tableau octet output->i_octet++; //Passage à l'élément suivant if (output->i_octet==8) //Ecriture dans record { octet=0; //octet et b vont permettre de passer les bits du tableau octet sous forme de chaine de caractères dans octet b=0x80; for(i=0;i<8;i++) { if(output->octet[i]=='1') { octet=octet|b; } b=b>>1; //Décalage de b à droite pour garder le 1 au bon endroit de la comparaison } output->i_octet=0; output->record[output->i_record]=octet; //Stockage de octet dans record output->i_record++; //Incrémentation de i_record (passage à l'élément suivant) et du nombre d'octet output->nb_octets++; if(output->i_record==BLOCK_SIZE) //Vérification de l'état du buffer (plein ou non). { fwrite(output->record,1,BLOCK_SIZE,output->file); //Ecriture de record dans le fichier et réinitialisation de i_record(retour au début du buffer) output->i_record=0; } } } char Lec_Bit(Bin_file*input) { /*Lecture d'un fichier bit par bit*/ char bit; unsigned char x, b=0x80; int i; if (input->record_length==0){ //Vérification de l'état du buffer input->record_length = fread(input->record,1,BLOCK_SIZE,input->file); //Lecture du fichier et récupération du nombre d'élément input->i_record=0; x = input->record[input->i_record] ; //Copie de l'élément à lire dans x for(i=0;i<8;i++) { if(x&b) input->octet[i]='1'; //Comparaison des bits de x à 1 et récupération de la valeur du bit else input->octet[i]='0'; b=b>>1; //Décalage b à droite (1 est conservé comme élément de comparaison) } input->octet[8]=0; //Mise à 0 du dernier élément du tableau octet (fin de chaine de caractère) input->i_record++; //Passage à l'élément suivant et réinitialisation de i_octet input->i_octet=0; input->nb_octets=input->nb_octets+input->record_length; //Mise à jour du nombre d'éléments } bit=input->octet[input->i_octet]; //Récupération de l'élément i_octet dans bit input->i_octet++; //Incrémentation de i_octet if(input->i_octet==8){ x = input->record[input->i_record] ; //Même fonctionnement qu'au dessus for(i=0;i<8;i++) { if(x&b) input->octet[i]='1'; else input->octet[i]='0'; b=b>>1; } input->octet[8]=0; //Actualisation des éléments du struct input->i_record++; input->i_octet=0;; if(input->i_record==BLOCK_SIZE){ //Vérification de l'état du buffer et réinitialisation input->record_length=0; } } return bit; //Récupération du bit lu } int Ferm_Bit(Bin_file *fichier) { /*Fermeture du fichier et écriture de la fin du buffer*/ unsigned char octet,b; int nb_octets=fichier->nb_octets; if(fichier->mode=='w') //Vérification du mode d'ouverture { if(fichier->i_octet!=0) //Ecriture du buffer (même principe que Ec_Bit) { octet=0; b=0x80; int i; for(i=0;ii_octet;i++) { if(fichier->octet[i]=='1') { octet=octet|b; } b=b>>1; } fichier->record[fichier->i_record]=octet; fichier->i_record++; nb_octets++; } if(fichier->i_record!=0) { fwrite(fichier->record,1,BLOCK_SIZE,fichier->file); } } fclose(fichier->file); //Fermeture du fichier et libération du sruct free(fichier); return nb_octets; } /*#########################################################################################################*/ /* Partie Arbre binaire */ /*#########################################################################################################*/ arbre creer_arbre_vide (void) { return NULL ; } arbre creer_arbre_huffman(Elt e, int p, arbre fg, arbre fd) { noeud * tmp = malloc(sizeof(noeud)); tmp->elt=e; tmp->poids=p; tmp->fils_gauche=fg; tmp->fils_droit=fd; return tmp; } arbre fils_gauche(arbre a) { assert(!est_arbre_vide(a)); return a->fils_gauche; } arbre fils_droit(arbre b) { assert(!est_arbre_vide(b)); return b->fils_droit; } Elt racine(arbre a) { assert(!est_arbre_vide(a)); return a->elt; } bool est_arbre_vide(arbre a) { return (a == NULL) ; } arbre creer_feuille(Elt e, int p) { return creer_arbre_huffman(e, p, creer_arbre_vide(), creer_arbre_vide()) ; } bool est_feuille(arbre a) { if (est_arbre_vide(a)) return 0 ; return (est_arbre_vide(a->fils_gauche) && est_arbre_vide(a->fils_droit)) ; } void free_noeud(arbre a) { assert(!est_arbre_vide(a)); free(a); } void free_arbre(arbre a) { if(!est_arbre_vide(a)){ free_arbre(fils_gauche(a)); free_arbre(fils_droit(a)); free(a); } } void arbre_rechercher(arbre a, Elt c, char s[], int s_len, int found[]){ /*recherche d'un élément du texte dans l'arbre et récupération de son codage*/ if(!est_arbre_vide(a)){ if((a->fils_gauche==NULL)&&(a->fils_droit==NULL)&&(racine(a)==c)){ found[0]=1; //Indication de la fin de recherche s[s_len]='\0'; //Ajout du caractère d'échappement en fin de chaîne return ; } if(!est_arbre_vide(fils_gauche(a))&&(found[0]==0)){ //Passage au fils gauche et ajout de '0' dans la chaîne de caractère s[s_len]='0'; arbre_rechercher(fils_gauche(a),c,s,s_len+1,found); //Appel récursif avec passage a l'élément suivant de la chaîne. } if(!est_arbre_vide(fils_droit(a))&&(found[0]==0)){ //Même principe mais en ajoutant '1' s[s_len]='1'; arbre_rechercher(fils_droit(a),c,s,s_len+1,found); } } } void serialisation(arbre a,FILE*file){ /*Création de la chaine de caractère qui permettra de décompresser le fichier*/ if(est_feuille(a)){ char s1[1],s2[64]; //Création des chaînes de caractère qui récupéreront l'élément de la racine et la valeur du poids en char s1[0]=a->elt; fwrite(s1,1,1,file); //écriture de l'élément sprintf(s2, "%d", a->poids); //récupération du poids sous forme de char int count = 0; //Recherche du nombre de char dans s2 while (a->poids != 0) { a->poids /= 10; ++count; } fwrite(s2,count,1,file); //Ecriture de s2 et de '|' fwrite("|",1,1,file); } if(!est_arbre_vide(a->fils_gauche)){ //Appels récursif sur fils droit et gauche serialisation(a->fils_gauche,file); } if(!est_arbre_vide(a->fils_droit)){ serialisation(a->fils_droit,file); } } void deserialisation(arbre T[], FILE*file){ /*Récupération de la chaîne de la caractère en début de fichier compréssé pour recreer le tableau de frequence*/ char c,b; rewind(file); //retour au début du fichier while((c=fgetc(file))!='|'&&(b=fgetc(file))!='|'){ //Recherche des caractères des ||| qui servent de carctère d'échappement char num[64]=""; int i; i=0; while(b!='|'){ //Incrementation de i tant que le troisième caractère n'est pas trouvé num[i]=b; b=fgetc(file); i++; } int poids; char *end; poids = strtol(num, &end, 10); //Récupération de la cahine de caractère et contruction du tableau printf(" %c%d%c\n",c,poids,b); T[c]->elt=c; T[c]->poids=poids; } b=fgetc(file); } /*#########################################################################################################*/ /* Partie Fonction pour compression */ /*#########################################################################################################*/ void init_tab(arbre T[], int n){ /*Initialisaion d'un tableau composé d'arbre*/ int i; for(i=0;ipoids!=-1){ //Vérification du poids, le caractère a t-il été trouvé ? T[c]->poids++; //Incrémentation du poids } else{ T[c]->elt=c; //Initialisation du poids à 1 T[c]->poids=1; } } } void tri_tab(arbre T[],int n){ /*Tri à bulle effectué sur les poids des éléments du tableau*/ int i,j; arbre tmp; for(i=0;ipoids>T[j]->poids){ tmp=T[i]; T[i]=T[j]; T[j]=tmp; } } } } void afficher_tab(arbre T[], int n){ /*Fonction de test. Affichage des éléments du tableau*/ printf("\n"); int i; for (i=0;ipoids,T[i]->elt); } } arbre huffman(arbre T[]){ /*Création de l'arbre de codage de Huffman en considérant une liste avec les fréquences d'apparition des caractères ordonnée croissante*/ arbre H = malloc(sizeof(arbre)); //Libération de l'espace mémoire pour un arbre H=creer_arbre_vide(); //Initialisation de l'arbre int i; i=0; while(T[i]->poids==-1){ //Recherche du nombre de caractères effectivement présents dans le tableau i++; } int Index; Index=i; //Initialisation de Index, début effectif du tableau while(Indexelt='0'; tmp->fils_gauche=T[Index]; tmp->fils_droit=T[Index+1]; tmp->poids=T[Index]->poids +T[Index+1]->poids; //Actualisation du poids de tmp. T[Index+1]=tmp; //Mise à jour de la valeur de T[Index+1] vers tmp printf("%d (%c | %c)\n",tmp->poids,tmp->fils_gauche->elt,tmp->fils_droit->elt); //Ligne de test Index++; // Incrémentation de Index car un élément doit être supprimé du tableau tri_tab(T,ASCII_EXT); //Nouveaux tri une fois les deux plus petites valeurs enlevées. tmp est mis a la bonne place } return T[Index]; //Renvoi du dernier élément du tableau correspondant à l'arbre final } void init_codage(plex Code[], int n){ /*Initialisation de la table récupérant les codes de chaque lettre*/ int i; int j; for(i=0;icode[j]='0'; } tmp->lettre='0'; Code[i]=tmp; } } void get_lexique(FILE *file, plex Code[], arbre huff){ /*Création du tableau des correspondances lettre/code */ int i; char c_char; rewind(file); //Reprise de la lecture du fichier au début i=0; char s[ASCII_EXT]=""; while((c_char=fgetc(file))!=EOF){ //Parcours du fichier jusqu'à la fin de ce dernier Code[i]->lettre=c_char; //Attribution de la lettre à une case. A chaque apparition, on stocke une lettre dans une nouvelle case int f[1]={0}; arbre_rechercher(huff,c_char,s,0,f); //Attribution du code associé à la lettre strcpy(Code[i]->code,s); printf("Code %c : %s\n",c_char,Code[i]->code); //Ligne de test i++; } } void compression(plex Code[],int n,arbre a){ /*Ecriture dans un nouveau fichier des lettres avec leurs nouveaux codes*/ Bin_file* cmp; cmp=Ouv_Bit("cmp.txt",'w'); //Ouverture d'un fichier différent en écriture (évite d'écraser le contenu) int i; int j; char tmp; serialisation(a,cmp->file); //Lancement de la sérialisation : écriture de l'arbre en début de fichier fwrite("||",2,1,cmp->file); // Mise en place de ||| qui serviront de délimitaion entre arbre et contenu for(i=0;icode[j]!='\0'){ //écriture des bits composant le code de chaque lettre tmp=Code[i]->code[j]; if (tmp=='0'){ Ec_Bit(cmp,'0'); }else if(tmp=='1'){ Ec_Bit(cmp,'1'); } j++; } } Ferm_Bit(cmp); // femeture du fichier compressé } void decompression(arbre a,Bin_file*input){ char bit='0'; //Initialisation de bit a une valur ne posant pas de conflit Bin_file*dest; //OUverture d'un fichier où écrire la version décompressé dest=Ouv_Bit("ucmp.txt",'w'); int i=0; char s[1]; //chaine de caractère contenant la lettre a écrire for(i=0;ipoids;i++){ arbre tmp=malloc(sizeof(arbre)); //Création d'un arbre temporaire, copie de a tmp=a; while(!est_feuille(tmp)){ //Parcours l'arbre tant tmp n'est pas une feuille bit=Lec_Bit(input); if(bit=='0'){ tmp=tmp->fils_gauche; }else if(bit=='1'){ tmp=tmp->fils_droit; } } s[0]=tmp->elt; //on écrit la valeur trouvé fwrite(s,1,1,dest->file); } Ferm_Bit(dest); } /*#########################################################################################################*/ /* Main */ /*#########################################################################################################*/ int main(int argc, char **argv){ Bin_file *p; char *filename = argv[1]; char mode= 'r'; // Vérification de l'existence du second argument (Nom du fichier à compresser) printf("Argc : %d\n",argc); if(argc != 2){ printf("\nErreur : Veuillez mettre en argument un nom de fichier à compresser (Ex: %s text.txt)\n",argv[0]); return -1; } // Vérification de l'ouverture du fichier en mode lecture binaire !! FONCTION A MODIFIER else if(!(p=Ouv_Bit(filename,mode))){ printf("\nErreur : Fichier %s inexistant\n",filename); return -2; } printf("Entrez C pour une compression ou D pour une décompression:"); char Mode; Mode='G'; while((Mode!='C')&&(Mode!='D')){ scanf("%c",&Mode); printf("Rentrez C ou D\n"); } if(Mode=='C'){ printf("\n"); printf("Tableau : \n"); arbre N[ASCII_EXT]; // Initialisation de l'arbre printf("Tableau initialisé -1: \n"); init_tab(N,ASCII_EXT); // On initialise l'arbre avec des poids de -1 printf("Tableau get freq : \n"); frequence(N,p->file); // On récupère la fréquence d'apparition des lettres du fichier printf("Tableau tri : \n"); tri_tab(N,ASCII_EXT); // On fait un tri à bulle sur ce tableau printf("Tableau affichage : \n"); afficher_tab(N,ASCII_EXT); //Ligne de test arbre huff; printf("Huffman : \n"); huff = huffman(N); //Création de l'arbre de Huffman printf("Arbre :\n"); int found[1]={0}; int taille=huff->poids; // Récupération du nombre d'éléments plex Codage[taille]; //Création de la table de codage init_codage(Codage,taille); printf("Lexique:\n"); get_lexique(p->file, Codage,huff); printf("Compression %s : \n",Codage[0]->code); compression(Codage,taille,huff); //Lancement de la compression printf("Fermeture:\n"); Ferm_Bit(p); //fermeture du fichier } else if(Mode=='D'){ printf("\n"); printf("Tableau : \n"); arbre D[ASCII_EXT]; init_tab(D,ASCII_EXT); // On initialise l'arbre avec des poids de -1 printf(" Tableau get freq FROM FILE : \n"); deserialisation(D, p->file); printf(" Tableau tri : \n"); tri_tab(D,ASCII_EXT); // On fait un tri à bulle sur ce tableau printf(" Tableau affichage : \n"); afficher_tab(D,ASCII_EXT); arbre huff; printf("Huffman : \n"); huff = huffman(D); //Reconstitution de l'abre printf("FIN\n"); decompression(huff,p); //Décompression et femeture du fichier Ferm_Bit(p); } return 0; }