トップページへ戻る

DupChecker: 複製ファイル検出ツール

内容が同一と思われるファイルを列挙するためのツールです. 比較には,ファイルサイズとMD5ハッシュ値を使用しています.

使い方

java -jar DupChecker.jarで起動します. Windows の場合,ファイルの関連付けを特に変更していなければ, ファイルのダブルクリックだけで起動すると思います.

次の画像は,DupChecker の持つ GUI です.

画面最上部の[Folder Name]欄に探索したいディレクトリ名を入力し, [Add Target]ボタンを押してリストに追加してください. 複数のディレクトリを指定することができます. もし,入力した値に誤りがあった場合は,[Remove Target]で取り除いてください.

ディレクトリを設定したら,[start search]ボタンを押してください. 次のように,発見されたファイルがツリービューに表示されます.

1つのノードは,同一であると認識されたファイル群を格納しています. こうして発見されたファイルを削除したい場合には, ノードを選択し,ウィンドウの一番下にある 「delete selected files」というボタンをクリックしてください.

コンソール版の使い方

"-console" オプションを使って起動してください. "-r" オプションで,ディレクトリの中身を 再帰的に探索するかどうかを選択することができます. ディレクトリ名やファイル名は,複数指定することができます.

java -jar DupChecker.jar -console [-r] files...

ファイルごとに,グルーピングされてテキスト形式で出力されます. 各グループの先頭にはファイルの数とサイズ,MD5シグネチャが出力され, ファイルのフルパスのリストが出力された後,"<" で終了します.

2 files. each file size = 7 bytes. MD5 = e167f451df401b0280ed8e0da6e4ba31.
C:\java\workspaceRSG\DupChecker\testdata\a1.txt
C:\java\workspaceRSG\DupChecker\testdata\a2.txt
<

ダウンロード

DupChecker2.0.jar (2006/2/15) 対応するソースコードは DupChecker2.0src.zip です.

必要な環境

J2SE 5.0 で動作します.

インストール

JAR ファイル単体で動作しますので, ダウンロード後,好きなディレクトリに設置してください.

ソースコード

公開しています. ライセンスは,アーカイブ内に明記していませんが, BSD ライセンス(何かに流用した場合は著作権表示のみ要求)として 取り扱ってください.

もし,何か必要な機能拡張などを施した場合で,かつ,その成果を公開される場合, ご連絡いただければ,このサイトにも情報を掲載したいと思います.

ソースコードを調べたい人向けの情報: パッケージ構成

だいたい次のようなパッケージ構成になっています.

疑問,質問,コメントなど

機能についての疑問,改良のためのご意見など,フィードバックは常に歓迎しています. 掲示板ないしメールにてご連絡ください.

Copyright

Copyright (C) Takashi Ishio, 2006, All Rights Reserved.