Macsim's Mind

fdupes pour supprimer les doublons

tux!! EDIT !!

En raison d’un bug sur les images de mon blog, j’ai voulu verrouiller ce post pour fixer les images, je pensais que les posts protégés par mot de passe n’étaient pas envoyés dans les flux, malheureusement si, c’est la raison pour laquelle certains d’entre vous sont tombés sur ce billet, je m’excuse pour le désagrément, à l’avenir je mettrai les tags à la fin pour éviter que cela se reproduise. Bonne lecture.

!!FIN!!

J’ai beaucoup de documentation sur mon ordinateur et j’ai un gros problème à cause des doublons, au début j’étais parti pour faire une recherche manuelle, mais mon stagiaire actuel (Encore meric Damien ;) ) m’a dit de faire un tri des doublons grâce aux md5sum des fichiers. Je me suis donc lancé dans une bonne commande à l’aide de l’ami find et lors d’une recherche sur l’ami google je tombe sur le man du packet fdupes, qui réalise exactement ce que je veux.

Pour Ubuntu et Debian c’est comme d’abitude : sudo aptitude install fdupes

Une fois installé l’utilisation est extremement facile.

$fdupes /mon_repertoire/

l’option -d propose de garder un des fichiers et supprimer les doublons.

Alors, pour l’exemple j’ai pris le chapitre 1 du très bon livre « Simple comme Ubuntu »  et l’excellent pdf sur l’installation de débian et j’ai créé 2 doublons des deux, j’ai rajouté un simple fichier texte en plus

Donc voici le contenu du dossier

Dossier avec doublon

Dossier avec les doublons

Maintenant un petit coup de md5sum pour constater que l’on a bien 2 doublons des deux pdf (for i in `ls`;do md5sum $i;done)

Le md5sum

Le md5sum des fichiers

Maintenant on lance fdupes et on constate qu’il nous affiche bien les doublons

Affichage des doublons

Affichage des doublons

On lance fdupes . -d pour avoir la suppression

Suppression finie

Suppression finie

Une fois les fichiers supprimés voici notre dossier débarrassé des fichiers dupliqués ou l’on retrouve le fichier texte qui lui n’avait aucun doublon.

Plus de doublons

Plus de doublons

VN:F [1.9.2_1090]
Rating: 0.0/10 (0 votes cast)

4 commentaires

  • At 2010.01.08 08:52, lolovroom said:

    Alors là, protéger par un mot de passe un article publié sur le planet-libre, c’est fort de café.
    Et en plus il est pas dur à deviner le mot de passe, on se demande vraiment des fois.

    • At 2010.01.08 14:00, Macsim said:

      J’ai édité le post pour expliquer ce qui c’est passé, désolé pour le désagrément.

    • [...] Introduction: Ce petit screencast  montre la suppression de doublons dans un dossier à l’aide de fdupes, ce screencast est lié au billet suivant : http://macsim.labolinux.net/2010/01/08/fdupes-pour-supprimer-les-doublons/ [...]

      • At 2010.01.09 15:45, Dd said:

        Pas mal, j’ai presque recodé un truc du genre pour enlever les doublons d’images car supprimer beaucoup de doublons avec GThumb c’est assez long… ;)

        (Required)
        (Required, will not be published)
        Uses wordpress plugins developed by www.wpdevelop.com