内容が同一と思われるファイルを列挙するためのツールです. 比較には,ファイルサイズとMD5ハッシュ値を使用しています.
java -jar DupChecker.jar
で起動します.
Windows の場合,ファイルの関連付けを特に変更していなければ,
ファイルのダブルクリックだけで起動すると思います.
次の画像は,DupChecker の持つ GUI です.
画面最上部の[Folder Name]欄に探索したいディレクトリ名を入力し, [Add Target]ボタンを押してリストに追加してください. 複数のディレクトリを指定することができます. もし,入力した値に誤りがあった場合は,[Remove Target]で取り除いてください.
ディレクトリを設定したら,[start search]ボタンを押してください. 次のように,発見されたファイルがツリービューに表示されます.
1つのノードは,同一であると認識されたファイル群を格納しています. こうして発見されたファイルを削除したい場合には, ノードを選択し,ウィンドウの一番下にある 「delete selected files」というボタンをクリックしてください.
"-console" オプションを使って起動してください. "-r" オプションで,ディレクトリの中身を 再帰的に探索するかどうかを選択することができます. ディレクトリ名やファイル名は,複数指定することができます.
java -jar DupChecker.jar -console [-r] files...
ファイルごとに,グルーピングされてテキスト形式で出力されます. 各グループの先頭にはファイルの数とサイズ,MD5シグネチャが出力され, ファイルのフルパスのリストが出力された後,"<" で終了します.
2 files. each file size = 7 bytes. MD5 = e167f451df401b0280ed8e0da6e4ba31. C:\java\workspaceRSG\DupChecker\testdata\a1.txt C:\java\workspaceRSG\DupChecker\testdata\a2.txt <
J2SE 5.0 で動作します.
JAR ファイル単体で動作しますので, ダウンロード後,好きなディレクトリに設置してください.
公開しています. ライセンスは,アーカイブ内に明記していませんが, BSD ライセンス(何かに流用した場合は著作権表示のみ要求)として 取り扱ってください.
もし,何か必要な機能拡張などを施した場合で,かつ,その成果を公開される場合, ご連絡いただければ,このサイトにも情報を掲載したいと思います.
だいたい次のようなパッケージ構成になっています.
機能についての疑問,改良のためのご意見など,フィードバックは常に歓迎しています. 掲示板ないしメールにてご連絡ください.
Copyright (C) Takashi Ishio, 2006, All Rights Reserved.