178 lines
No EOL
4.1 KiB
C
178 lines
No EOL
4.1 KiB
C
#include <stdio.h>
|
|
#include <string.h>
|
|
#include <assert.h>
|
|
#include <stdlib.h>
|
|
#include "gestion_des_fichiers/gestion_fichiers.h"
|
|
#include "main_compress.h"
|
|
#include "arbre_de_codage/arbre_binaire.h"
|
|
|
|
#define ASCII_EXT 256
|
|
|
|
// main_compress.c [nom_du_fichier_a_compresser]
|
|
int main(int argc, char **argv){
|
|
Bin_file *p;
|
|
char *filename = argv[1];
|
|
char mode= 'r';
|
|
// Vérification de l'existance du second argument (Nom du fichier à compresser)
|
|
printf("Argc : %d\n",argc);
|
|
if(argc != 2){
|
|
printf("\nErreur : Veuillez mettre en argument un nom de fichier à compresser (Ex: %s text.txt)\n",argv[0]);
|
|
return -1;
|
|
}
|
|
// Vérification de l'ouverture du fichier en mode lecture binaire !! FONCTION A MODIFIER
|
|
else if(!(p=Ouv_Bit(filename,mode))){
|
|
printf("\nErreur : Fichier %s inexistant\n",filename);
|
|
return -2;
|
|
}
|
|
printf("Tableau : \n");
|
|
arbre N[ASCII_EXT]; // Initialisation de l'arbre
|
|
printf("Tableau initialisé -1: \n");
|
|
init_tab(N,ASCII_EXT); // On initialise l'arbre avec des poids de -1
|
|
printf("Tableau get freq : \n");
|
|
frequence(N,p->file); // On récupère la fréquence d'apparition des lettres du fichiers
|
|
printf("Tableau tri : \n");
|
|
tri_tab(N,ASCII_EXT); // On fait un tri à bulle sur ce tableau
|
|
printf("Tableau affichage : \n");
|
|
afficher_tab(N,ASCII_EXT);
|
|
arbre huff;
|
|
printf("Huffman : \n");
|
|
huff = huffman(N);
|
|
printf("Arbre :\n");
|
|
int found[1]={0};
|
|
int taille=huff->poids;
|
|
plex Codage[taille];
|
|
init_codage(Codage,taille);
|
|
printf("Lexique:\n");
|
|
get_lexique(p->file, Codage,huff);
|
|
printf("Compression %s : \n",Codage[0]->code);
|
|
compression(Codage,taille,huff);
|
|
printf("Fermeture:\n");
|
|
Ferm_Bit(p);
|
|
return 0;
|
|
}
|
|
|
|
void init_tab(arbre T[], int n){
|
|
int i;
|
|
for(i=0;i<n;i++){
|
|
T[i]=creer_feuille(-1,-1);
|
|
}
|
|
}
|
|
|
|
void frequence(arbre T[], FILE *file){
|
|
int c;
|
|
while((c=fgetc(file))!=EOF){
|
|
if(T[c]->poids!=-1){
|
|
T[c]->poids++;
|
|
}
|
|
else{
|
|
T[c]->elt=c;
|
|
T[c]->poids=1;
|
|
}
|
|
}
|
|
}
|
|
|
|
void tri_tab(arbre T[],int n){
|
|
int i,j;
|
|
arbre tmp;
|
|
for(i=0;i<n-1;i++){
|
|
for(j=i+1;j<n;j++){
|
|
if(T[i]->poids>T[j]->poids){
|
|
tmp=T[i];
|
|
T[i]=T[j];
|
|
T[j]=tmp;
|
|
}
|
|
}
|
|
}
|
|
}
|
|
|
|
int compteur_tab(arbre T[], int n){
|
|
int i,compteur;
|
|
compteur=0;
|
|
for(i=0;i<n;i++){
|
|
if(T[i]->poids != -1){
|
|
compteur++;
|
|
}
|
|
}
|
|
return compteur;
|
|
}
|
|
|
|
void afficher_tab(arbre T[], int n){
|
|
printf("\n");
|
|
int i;
|
|
for (i=0;i<n;i++){
|
|
printf("T[%d] = %d (%c)\n",i,T[i]->poids,T[i]->elt);
|
|
}
|
|
}
|
|
|
|
arbre huffman(arbre T[]){
|
|
// Création de l'arbre de codage de Huffman en considérant une liste avec les fréquences d'apparition des caractères ordonnée croissante
|
|
arbre H = malloc(sizeof(arbre));
|
|
H=creer_arbre_vide();
|
|
int i;
|
|
i=0;
|
|
while(T[i]->poids==-1){
|
|
i++;
|
|
}
|
|
int Index;
|
|
Index=i;
|
|
while(Index<ASCII_EXT-1){
|
|
arbre tmp=malloc(sizeof(noeud*));
|
|
tmp->elt=0;
|
|
tmp->fils_gauche=T[Index];
|
|
tmp->fils_droit=T[Index+1];
|
|
tmp->poids=T[Index]->poids +T[Index+1]->poids;
|
|
T[Index+1]=tmp;
|
|
printf("%d (%c | %c)\n",tmp->poids,tmp->fils_gauche->elt,tmp->fils_droit->elt);
|
|
Index++;
|
|
tri_tab(T,ASCII_EXT);
|
|
}
|
|
return T[Index];
|
|
}
|
|
|
|
void init_codage(plex Code[], int n){
|
|
int i;
|
|
int j;
|
|
for(i=0;i<n;i++){
|
|
lex * tmp = malloc(sizeof(lex));
|
|
for(j=0;j<ASCII_EXT;j++){
|
|
tmp->code[j]=0;
|
|
}
|
|
tmp->lettre=0;
|
|
Code[i]=tmp;
|
|
}
|
|
}
|
|
|
|
void get_lexique(FILE *file, plex Code[], arbre huff){
|
|
int i;
|
|
char c_char;
|
|
rewind(file);
|
|
i=0;
|
|
char s[ASCII_EXT]="";
|
|
while((c_char=fgetc(file))!=EOF){
|
|
Code[i]->lettre=c_char;
|
|
int f[1]={0};
|
|
arbre_rechercher(huff,c_char,s,0,f);
|
|
strcpy(Code[i]->code,s);
|
|
printf("Code %c : %s\n",c_char,Code[i]->code);
|
|
i++;
|
|
}
|
|
}
|
|
|
|
void compression(plex Code[],int n, arbre H){
|
|
Bin_file* cmp;
|
|
cmp=Ouv_Bit("cmp.txt",'w');
|
|
serialisation(H,cmp->file);
|
|
fwrite("123",3,1,cmp->file);
|
|
int i;
|
|
int j;
|
|
char tmp;
|
|
for(i=0;i<n;i++){
|
|
j=0;
|
|
while(Code[i]->code[j]!='\0'){
|
|
printf(" %s %c\n",Code[i]->code,Code[i]->code[j]);
|
|
Ec_Bit(cmp,Code[i]->code[j]);
|
|
j++;
|
|
}
|
|
printf("\n");
|
|
}
|
|
} |