This repository has been archived on 2026-05-01. You can view files and clone it, but you cannot make any changes to it's state, such as pushing and creating new issues, pull requests or comments.
Projet-C-Huffman/Compress.c

562 lines
No EOL
22 KiB
C

#include <stdio.h>
#include <string.h>
#include <assert.h>
#include<stdlib.h>
#include "gestion_des_fichiers/gestion_fichiers.h"
#include "main_compress.h"
#include "arbre_de_codage/arbre_binaire.h"
#define ASCII_EXT 256
// main_compress.c [nom_du_fichier_a_compresser]
/*#########################################################################################################*/
/* Partie Gestion de fichiers */
/*#########################################################################################################*/
Bin_file *Ouv_Bit(char *p,char mode)
{
/*Ouverture d'un fichier et initialisation de la structure Bin_file*/
Bin_file *A;
A=malloc(sizeof(Bin_file)); //Libération de l'espace
A->mode=mode; //Récupération du mode (ouverture ou écriture)
if(mode=='r')
{
A->file=fopen(p,"rb"); //Ouverture en mode rb/wb. Le b est nécessaire sur windows là où les tests ont été effectués
}
else
{
A->file=fopen(p,"wb");
}
A->record_length=0; //Initialisation du struct
A->i_record=0;
A->i_octet=0;
A->nb_octets=0;
return A;
}
void Ec_Bit(Bin_file *output,char bit)
{
/*Ecriture bit à bit dans un fichier*/
unsigned char octet,b;
int i;
output->octet[output->i_octet]=bit; //Stockage de bit dans le premier élément libre du tableau octet
output->i_octet++; //Passage à l'élément suivant
if (output->i_octet==8) //Ecriture dans record
{
octet=0; //octet et b vont permettre de passer les bits du tableau octet sous forme de chaine de caractères dans octet
b=0x80;
for(i=0;i<8;i++)
{
if(output->octet[i]=='1')
{
octet=octet|b;
}
b=b>>1; //Décalage de b à droite pour garder le 1 au bon endroit de la comparaison
}
output->i_octet=0;
output->record[output->i_record]=octet; //Stockage de octet dans record
output->i_record++; //Incrémentation de i_record (passage à l'élément suivant) et du nombre d'octet
output->nb_octets++;
if(output->i_record==BLOCK_SIZE) //Vérification de l'état du buffer (plein ou non).
{
fwrite(output->record,1,BLOCK_SIZE,output->file); //Ecriture de record dans le fichier et réinitialisation de i_record(retour au début du buffer)
output->i_record=0;
}
}
}
char Lec_Bit(Bin_file*input)
{
/*Lecture d'un fichier bit par bit*/
char bit;
unsigned char x, b=0x80;
int i;
if (input->record_length==0){ //Vérification de l'état du buffer
input->record_length = fread(input->record,1,BLOCK_SIZE,input->file); //Lecture du fichier et récupération du nombre d'élément
input->i_record=0;
x = input->record[input->i_record] ; //Copie de l'élément à lire dans x
for(i=0;i<8;i++) {
if(x&b) input->octet[i]='1'; //Comparaison des bits de x à 1 et récupération de la valeur du bit
else input->octet[i]='0';
b=b>>1; //Décalage b à droite (1 est conservé comme élément de comparaison)
}
input->octet[8]=0; //Mise à 0 du dernier élément du tableau octet (fin de chaine de caractère)
input->i_record++; //Passage à l'élément suivant et réinitialisation de i_octet
input->i_octet=0;
input->nb_octets=input->nb_octets+input->record_length; //Mise à jour du nombre d'éléments
}
bit=input->octet[input->i_octet]; //Récupération de l'élément i_octet dans bit
input->i_octet++; //Incrémentation de i_octet
if(input->i_octet==8){
x = input->record[input->i_record] ; //Même fonctionnement qu'au dessus
for(i=0;i<8;i++) {
if(x&b) input->octet[i]='1';
else input->octet[i]='0';
b=b>>1;
}
input->octet[8]=0; //Actualisation des éléments du struct
input->i_record++;
input->i_octet=0;;
if(input->i_record==BLOCK_SIZE){ //Vérification de l'état du buffer et réinitialisation
input->record_length=0;
}
}
return bit; //Récupération du bit lu
}
int Ferm_Bit(Bin_file *fichier)
{
/*Fermeture du fichier et écriture de la fin du buffer*/
unsigned char octet,b;
int nb_octets=fichier->nb_octets;
if(fichier->mode=='w') //Vérification du mode d'ouverture
{
if(fichier->i_octet!=0) //Ecriture du buffer (même principe que Ec_Bit)
{
octet=0;
b=0x80;
int i;
for(i=0;i<fichier->i_octet;i++)
{
if(fichier->octet[i]=='1')
{
octet=octet|b;
}
b=b>>1;
}
fichier->record[fichier->i_record]=octet;
fichier->i_record++;
nb_octets++;
}
if(fichier->i_record!=0)
{
fwrite(fichier->record,1,BLOCK_SIZE,fichier->file);
}
}
fclose(fichier->file); //Fermeture du fichier et libération du sruct
free(fichier);
return nb_octets;
}
/*#########################################################################################################*/
/* Partie Arbre binaire */
/*#########################################################################################################*/
arbre creer_arbre_vide (void)
{
return NULL ;
}
arbre creer_arbre_huffman(Elt e, int p, arbre fg, arbre fd)
{
noeud * tmp = malloc(sizeof(noeud));
tmp->elt=e;
tmp->poids=p;
tmp->fils_gauche=fg;
tmp->fils_droit=fd;
return tmp;
}
arbre fils_gauche(arbre a)
{
assert(!est_arbre_vide(a));
return a->fils_gauche;
}
arbre fils_droit(arbre b)
{
assert(!est_arbre_vide(b));
return b->fils_droit;
}
Elt racine(arbre a)
{
assert(!est_arbre_vide(a));
return a->elt;
}
bool est_arbre_vide(arbre a)
{
return (a == NULL) ;
}
arbre creer_feuille(Elt e, int p)
{
return creer_arbre_huffman(e, p, creer_arbre_vide(), creer_arbre_vide()) ;
}
bool est_feuille(arbre a)
{
if (est_arbre_vide(a))
return 0 ;
return (est_arbre_vide(a->fils_gauche) && est_arbre_vide(a->fils_droit)) ;
}
void free_noeud(arbre a)
{
assert(!est_arbre_vide(a));
free(a);
}
void free_arbre(arbre a)
{
if(!est_arbre_vide(a)){
free_arbre(fils_gauche(a));
free_arbre(fils_droit(a));
free(a);
}
}
void arbre_rechercher(arbre a, Elt c, char s[], int s_len, int found[]){
/*recherche d'un élément du texte dans l'arbre et récupération de son codage*/
if(!est_arbre_vide(a)){
if((a->fils_gauche==NULL)&&(a->fils_droit==NULL)&&(racine(a)==c)){
found[0]=1; //Indication de la fin de recherche
s[s_len]='\0'; //Ajout du caractère d'échappement en fin de chaîne
return ;
}
if(!est_arbre_vide(fils_gauche(a))&&(found[0]==0)){ //Passage au fils gauche et ajout de '0' dans la chaîne de caractère
s[s_len]='0';
arbre_rechercher(fils_gauche(a),c,s,s_len+1,found); //Appel récursif avec passage a l'élément suivant de la chaîne.
}
if(!est_arbre_vide(fils_droit(a))&&(found[0]==0)){ //Même principe mais en ajoutant '1'
s[s_len]='1';
arbre_rechercher(fils_droit(a),c,s,s_len+1,found);
}
}
}
void serialisation(arbre a,FILE*file){
/*Création de la chaine de caractère qui permettra de décompresser le fichier*/
if(est_feuille(a)){
char s1[1],s2[64]; //Création des chaînes de caractère qui récupéreront l'élément de la racine et la valeur du poids en char
s1[0]=a->elt;
fwrite(s1,1,1,file); //écriture de l'élément
sprintf(s2, "%d", a->poids); //récupération du poids sous forme de char
int count = 0; //Recherche du nombre de char dans s2
while (a->poids != 0) {
a->poids /= 10;
++count;
}
fwrite(s2,count,1,file); //Ecriture de s2 et de '|'
fwrite("|",1,1,file);
}
if(!est_arbre_vide(a->fils_gauche)){ //Appels récursif sur fils droit et gauche
serialisation(a->fils_gauche,file);
}
if(!est_arbre_vide(a->fils_droit)){
serialisation(a->fils_droit,file);
}
}
void deserialisation(arbre T[], FILE*file){
/*Récupération de la chaîne de la caractère en début de fichier compréssé pour recreer le tableau de frequence*/
char c,b;
rewind(file); //retour au début du fichier
while((c=fgetc(file))!='|'&&(b=fgetc(file))!='|'){ //Recherche des caractères des ||| qui servent de carctère d'échappement
char num[64]="";
int i;
i=0;
while(b!='|'){ //Incrementation de i tant que le troisième caractère n'est pas trouvé
num[i]=b;
b=fgetc(file);
i++;
}
int poids;
char *end;
poids = strtol(num, &end, 10); //Récupération de la cahine de caractère et contruction du tableau
printf(" %c%d%c\n",c,poids,b);
T[c]->elt=c;
T[c]->poids=poids;
}
b=fgetc(file);
}
/*#########################################################################################################*/
/* Partie Fonction pour compression */
/*#########################################################################################################*/
void init_tab(arbre T[], int n){
/*Initialisaion d'un tableau composé d'arbre*/
int i;
for(i=0;i<n;i++){
T[i]=creer_feuille(-1,-1); //Initialisation des poids à -1. Les poids des caractères présents étant forcément positifs
}
}
void frequence(arbre T[], FILE *file){
/*Recherche des caractères et de leurs fréquences dans le texte*/
int c;
while((c=fgetc(file))!=EOF){ //Boucle jusqu'à la fin du fichier
if(T[c]->poids!=-1){ //Vérification du poids, le caractère a t-il été trouvé ?
T[c]->poids++; //Incrémentation du poids
}
else{
T[c]->elt=c; //Initialisation du poids à 1
T[c]->poids=1;
}
}
}
void tri_tab(arbre T[],int n){
/*Tri à bulle effectué sur les poids des éléments du tableau*/
int i,j;
arbre tmp;
for(i=0;i<n-1;i++){
for(j=i+1;j<n;j++){
if(T[i]->poids>T[j]->poids){
tmp=T[i];
T[i]=T[j];
T[j]=tmp;
}
}
}
}
void afficher_tab(arbre T[], int n){
/*Fonction de test. Affichage des éléments du tableau*/
printf("\n");
int i;
for (i=0;i<n;i++){
printf("T[%d] = %d (%c)\n",i,T[i]->poids,T[i]->elt);
}
}
arbre huffman(arbre T[]){
/*Création de l'arbre de codage de Huffman en considérant une liste avec les fréquences d'apparition des caractères ordonnée croissante*/
arbre H = malloc(sizeof(arbre)); //Libération de l'espace mémoire pour un arbre
H=creer_arbre_vide(); //Initialisation de l'arbre
int i;
i=0;
while(T[i]->poids==-1){ //Recherche du nombre de caractères effectivement présents dans le tableau
i++;
}
int Index;
Index=i; //Initialisation de Index, début effectif du tableau
while(Index<ASCII_EXT-1){
arbre tmp=malloc(sizeof(noeud*)); //Initialisation d'un arbre tmp qui aura pour fils les plus petits éléments du tableau
tmp->elt='0';
tmp->fils_gauche=T[Index];
tmp->fils_droit=T[Index+1];
tmp->poids=T[Index]->poids +T[Index+1]->poids; //Actualisation du poids de tmp.
T[Index+1]=tmp; //Mise à jour de la valeur de T[Index+1] vers tmp
printf("%d (%c | %c)\n",tmp->poids,tmp->fils_gauche->elt,tmp->fils_droit->elt); //Ligne de test
Index++; // Incrémentation de Index car un élément doit être supprimé du tableau
tri_tab(T,ASCII_EXT); //Nouveaux tri une fois les deux plus petites valeurs enlevées. tmp est mis a la bonne place
}
return T[Index]; //Renvoi du dernier élément du tableau correspondant à l'arbre final
}
void init_codage(plex Code[], int n){
/*Initialisation de la table récupérant les codes de chaque lettre*/
int i;
int j;
for(i=0;i<n;i++){
lex * tmp = malloc(sizeof(lex));
for(j=0;j<ASCII_EXT;j++){
tmp->code[j]='0';
}
tmp->lettre='0';
Code[i]=tmp;
}
}
void get_lexique(FILE *file, plex Code[], arbre huff){
/*Création du tableau des correspondances lettre/code */
int i;
char c_char;
rewind(file); //Reprise de la lecture du fichier au début
i=0;
char s[ASCII_EXT]="";
while((c_char=fgetc(file))!=EOF){ //Parcours du fichier jusqu'à la fin de ce dernier
Code[i]->lettre=c_char; //Attribution de la lettre à une case. A chaque apparition, on stocke une lettre dans une nouvelle case
int f[1]={0};
arbre_rechercher(huff,c_char,s,0,f); //Attribution du code associé à la lettre
strcpy(Code[i]->code,s);
printf("Code %c : %s\n",c_char,Code[i]->code); //Ligne de test
i++;
}
}
void compression(plex Code[],int n,arbre a){
/*Ecriture dans un nouveau fichier des lettres avec leurs nouveaux codes*/
Bin_file* cmp;
cmp=Ouv_Bit("cmp.txt",'w'); //Ouverture d'un fichier différent en écriture (évite d'écraser le contenu)
int i;
int j;
char tmp;
serialisation(a,cmp->file); //Lancement de la sérialisation : écriture de l'arbre en début de fichier
fwrite("||",2,1,cmp->file); // Mise en place de ||| qui serviront de délimitaion entre arbre et contenu
for(i=0;i<n;i++){
j=0;
while(Code[i]->code[j]!='\0'){ //écriture des bits composant le code de chaque lettre
tmp=Code[i]->code[j];
if (tmp=='0'){
Ec_Bit(cmp,'0');
}else if(tmp=='1'){
Ec_Bit(cmp,'1');
}
j++;
}
}
Ferm_Bit(cmp); // femeture du fichier compressé
}
void decompression(arbre a,Bin_file*input){
char bit='0'; //Initialisation de bit a une valur ne posant pas de conflit
Bin_file*dest; //OUverture d'un fichier où écrire la version décompressé
dest=Ouv_Bit("ucmp.txt",'w');
int i=0;
char s[1]; //chaine de caractère contenant la lettre a écrire
for(i=0;i<a->poids;i++){
arbre tmp=malloc(sizeof(arbre)); //Création d'un arbre temporaire, copie de a
tmp=a;
while(!est_feuille(tmp)){ //Parcours l'arbre tant tmp n'est pas une feuille
bit=Lec_Bit(input);
if(bit=='0'){
tmp=tmp->fils_gauche;
}else if(bit=='1'){
tmp=tmp->fils_droit;
}
}
s[0]=tmp->elt; //on écrit la valeur trouvé
fwrite(s,1,1,dest->file);
}
Ferm_Bit(dest);
}
/*#########################################################################################################*/
/* Main */
/*#########################################################################################################*/
int main(int argc, char **argv){
Bin_file *p;
char *filename = argv[1];
char mode= 'r';
// Vérification de l'existence du second argument (Nom du fichier à compresser)
printf("Argc : %d\n",argc);
if(argc != 2){
printf("\nErreur : Veuillez mettre en argument un nom de fichier à compresser (Ex: %s text.txt)\n",argv[0]);
return -1;
}
// Vérification de l'ouverture du fichier en mode lecture binaire !! FONCTION A MODIFIER
else if(!(p=Ouv_Bit(filename,mode))){
printf("\nErreur : Fichier %s inexistant\n",filename);
return -2;
}
printf("Entrez C pour une compression ou D pour une décompression:");
char Mode;
Mode='G';
while((Mode!='C')&&(Mode!='D')){
scanf("%c",&Mode);
printf("Rentrez C ou D\n");
}
if(Mode=='C'){
printf("\n");
printf("Tableau : \n");
arbre N[ASCII_EXT]; // Initialisation de l'arbre
printf("Tableau initialisé -1: \n");
init_tab(N,ASCII_EXT); // On initialise l'arbre avec des poids de -1
printf("Tableau get freq : \n");
frequence(N,p->file); // On récupère la fréquence d'apparition des lettres du fichier
printf("Tableau tri : \n");
tri_tab(N,ASCII_EXT); // On fait un tri à bulle sur ce tableau
printf("Tableau affichage : \n");
afficher_tab(N,ASCII_EXT); //Ligne de test
arbre huff;
printf("Huffman : \n");
huff = huffman(N); //Création de l'arbre de Huffman
printf("Arbre :\n");
int found[1]={0};
int taille=huff->poids; // Récupération du nombre d'éléments
plex Codage[taille]; //Création de la table de codage
init_codage(Codage,taille);
printf("Lexique:\n");
get_lexique(p->file, Codage,huff);
printf("Compression %s : \n",Codage[0]->code);
compression(Codage,taille,huff); //Lancement de la compression
printf("Fermeture:\n");
Ferm_Bit(p); //fermeture du fichier
}
else if(Mode=='D'){
printf("\n");
printf("Tableau : \n");
arbre D[ASCII_EXT];
init_tab(D,ASCII_EXT); // On initialise l'arbre avec des poids de -1
printf(" Tableau get freq FROM FILE : \n");
deserialisation(D, p->file);
printf(" Tableau tri : \n");
tri_tab(D,ASCII_EXT); // On fait un tri à bulle sur ce tableau
printf(" Tableau affichage : \n");
afficher_tab(D,ASCII_EXT);
arbre huff;
printf("Huffman : \n");
huff = huffman(D); //Reconstitution de l'abre
printf("FIN\n");
decompression(huff,p); //Décompression et femeture du fichier
Ferm_Bit(p);
}
return 0;
}