ADVERTISEMENT
電腦裡最容易出現的重覆檔案是什麼?數位相片絕對是最多的,因為大家都有「寧可複製一份、也不要錯殺一張」的「捨不得」心態,久而久之就造成了相片管理的困難。要怎麼在電腦裡找出重覆的相片?一張一張的比對圖像內容嗎?別傻了!不必那麼累,比對相片可以從幾個條件來著手,而且都是系統裡最基本、容易取得的檔案資訊,跟本就不必動用到什麼複雜的圖像比對演算法:
一、比「大小」
數位相機所產生的每張照片,其體積重覆的機率「非常低」,就算是用高速連拍所產生的圖像,也會因為物體或光影的細微差異而有小幅變動,差距小至Bytes,所以「比大小」可以當作照片比對過濾的第一關,如果兩張照片的體積一樣、那麼九成以上絕對就是同一張照片。
二、比「拍攝日期」
這裡的拍攝日期,其實是指「拍攝時間」。數位照片都會有EXIF,EXIF的拍攝日期小至以秒計錄,除非是高速連拍的照片,不然很少有會在同一秒所拍攝的照片。
三、比「檔案名稱」
比對檔案名稱是比較不嚴謹的作法。因為多數的相機都有「重新計數」功能,而且一台電腦裡很可能會放置好幾台不同相機所拍攝的照片,很可能會出現「檔名相同、內容卻不同」的情況出現。
四、比「雜湊值」
「雜湊值」通常指的是一個檔案的「MD5 Checksum」,什麼是MD5這裡就不多介紹,總之它可以說是每個檔案獨一無二的「指紋」,而且還是依照檔案內容所計算出的「胎記」。兩個內容不同的檔案、要有相同雜湊值的機率是非常非常小的,比剛才介紹的第一種比對法所發生的可能性還低。
要用這幾種方法來找出垃圾拷貝,Windows上相關的軟體還不少,筆者用的最順手的就是這款「Duplicate Cleaner」。不但可以找相片、任何你唸得出來的檔案類型它都能找,怕了吧!
以下,就是它的使用方式:
一、到這裡下載Duplicate Cleaner。有一個類似的軟體叫做「Duplicate File Cleaner」,會出現在Google搜尋的榜首,這兩個是不一樣的東西。
二、執行程式後,「第一步」先決定你要找尋哪種類型的檔案。以數位相片為例,使用最普遍的副檔案就是JPG、TIFF或者是NEF、CR2之類的相機RAW檔,按下「Select File Type」可以自動列出常用的副檔名。要不然你也可以自行在文字方塊內增刪屬意的目標。
三、再來,就是要決定「搜尋條件」啦!Duplicate Cleaner的搜尋速度非常快,就算你把所有的條件都勾選了,在筆者的高階雙核心平台上搜尋一萬張相片不到30秒,所以就全勾吧!不必花多少時間、又能達到最高的正確率。
四、接著,請依照圖中決定搜尋的目錄,可以一次加入好幾個,最後按下「Go!」就會開始搜尋。
五、然後……就等吧!
六、搜索完畢之後,你就可以看到藍紅相間的檔案列表。顏色的區分並不帶特殊意義,很純粹的只是要區分出相同檔案的集合而已。這時候,先別急著在檔案前的方框打勾,如果一次有幾千張照片要處理怎麼辦?請先點擊「Selection Assistant」,叫出輔助工具來選取要處理的檔案。
七、輔助工具提供的選項很多,不過我們只要點擊左下角的「Select all but one file in group」即可。這個選項的意思,是「把所有重覆出現的檔案刪掉、只留下一個」。勾選完後按下Select及右邊的Close,即見成果。
八、最後點擊「Remove Selected」,叫出刪除工具,點擊「Delete to Recycle Bin」以防萬一,然後就可以進行刪除了。需要注意的是,如果目的檔案的權限是設定成唯讀、或者是你本來就沒有更動權限,還是資源回收筒的功能跟本就沒有打開,程式並不會主動提示,是需加以留意之處。
就這樣,Duplicate Cleaner基本上並沒有什麼特殊的使用技巧。如果你覺得功能還不夠的話,也可以拉下「File」功能表,選擇把搜尋結果匯出成CSV檔再做後續處理,比如做更進階的照片分類管理等等的。
ㄎㄎ~b
是編輯頭腦故障還是系統容量不足
至少也要1024*768以上才行阿
編輯應該提供一個比較正常些的圖片~~
最後一張得要伸手一下XD~~
極度推薦你們使用 Tineye.com
XD
http://bbs.meizu.com/attachments/month_0910/20091030_68455376ebcbd688b2f0hvu8BY2yH_JSp.jpg
http://www.chinasmack.com/wp-content/uploads/2009/11/elly-tran-ha-vietnamese-model-01-560x746.jpg
http://farm3.static.flickr.com/2722/4055101609_82984e3431.jpg
讚啦~
可以自此下載得到,放於語系檔目錄下開啟程式,選「正體中文」即生效:
http://www.sendspace.com/file/vnhicq
小的於 Dupluicate Cleaner 官方論壇的發帖:
http://www.digitalvolcano.co.uk/forum/viewtopic.php?forum=2&topic=124
英文破破的,不好咩!
不敢期望被採用,但諸君可自上面連結自行取用。
http://www.sendspace.com/file/pf8twt
:)
文章中第一個英文多了一個u