Mogens Kjaer wrote:
Hvis man hurtigt (uden at skulle lave en test, der vokser
med n^2) vil se, hvor mange gengangere
man har i sine directories, kan følgende anbefales:
cd /et/passende/startsted
find . -type f -exec md5sum {} \;
Gem output i en fil, og brug sort og uniq til at
finde filer, der er ens.
Ja - md5 kan bruges til mange ting.
Min algoritme er følgende
1. kør "du" på alle directories i /et/passende/startsted
2. sorter på faldende størrelse
3. hvis der er 2 directories med samme størrelse lav 2 "ls" og smmenlig dem
4. hvis "ls" er ens - så kør "cmp" på alle filerne og eventuelle under
directories.
5. husk resultatet - så hvis de er ens kan alle "paralelle" under
directories springes over.
Så det bliver knap nok n^2 ;-)