【現場で使う】Excel重複削除でミスをゼロにするデータ検証術

【ゼロからはじめる】Excel
スポンサーリンク

こんにちは!ぐーです。

いつもブログをご覧いただき、ありがとうございます!

突然ですが、こんな経験はありませんか?

  • Excelの「重複の削除」機能を使ったけど、本当に正しくできているか自信がない…
  • 必要なデータまで消してしまっていないか、ボタンを押すたびに心臓がキュッとなる。
  • 確認作業に時間を取られすぎて、気づけばいつも残業している。
  • 過去にデータミスで上司に報告した時の、あの気まずい空気が忘れられない…

お心あたりのある人は、ぜひ読んでみてほしいです!

なぜ「検証」が重要なのか?

「重複の削除」ボタンは、確かに便利です。しかし、そこにはいくつかの落とし穴が存在します。

  • 見えない敵「スペース」: 山田 太郎 と 山田 太郎(半角と全角スペース)。人間には同じに見えても、Excelは別のデータとして認識します。
  • 全角と半角の罠: ABC と ABC。これも別人扱いです。
  • まさかの選択ミス: 削除対象の列をうっかり間違えて選択してしまうヒューマンエラー。

データを整えるのは、地味で大変ですが、正しくて当たり前と思われています。

上司の重要な意思決定に使用されるため、たった1つのデータミスが、時には事業に大きな影響を与えます。

だからこそ、私たちは「作業」と同じくらい、いや、それ以上に「検証」に力を注ぐ必要があります。

検証は、自分の仕事と会社の信用を守るために、とても重要なのです。

【基本編】明日から使える!鉄壁のデータ検証3ステップ

重要性は理解していただけたと思いますが、難しく考えすぎる必要はありません。

3つのステップで、作業を完璧なものにしていきましょう。

ステップ1:【件数比較】で全体の整合性をチェック(所要時間:1分)

これは最も基本的で、かつ最も重要な検証です。料理で言えば、レシピ通りの材料が揃っているかを確認するようなもの。

やり方は簡単。

  1. 重複削除前の総行数をメモしておく。 (例:1000行)
  2. 重複削除を実行する。
  3. 削除時に「〇個の重複する値が見つかり、削除されました。△個の一意の値が残ります。」というメッセージが表示されます。この数値を必ず確認・メモしてください。 (例:100個の重複を削除)
  4. 計算する。

削除前の行数−削除された重複件数=削除後の行数

1000行−100件=900行

この計算結果(900行)と、Excelが示した一意の値の数(△個)が一致するか、そして実際のシートの行数が一致するかを確認します。

たったこれだけです。

しかし、この一手間をかけるだけで、「大規模な削除ミス」は99%防ぐことができます。もし数値が合わなければ、その時点で何かがおかしいと気づけます。

ステップ2:【COUNTIF関数】で重複の残党をあぶり出す(所要時間:2分)

件数が合っていることを確認したら、次は「本当に重複がすべて消えているか?」を確かめます。

「重複の削除機能を使ったんだから、消えてるに決まってるじゃん」

そう思った人は危険信号です。前述した「見えないスペース」や「全角/半角」の違いによって、重複が見逃されている可能性はゼロではありません。

ここで活躍するのがCOUNTIF関数です。

  1. 重複を削除したデータの隣に、新しい列(仮に「作業列」とします)を追加します。
  2. 作業列の1行目に、以下の数式を入力します。(ここではA列の重複を確認する場合) =COUNTIF($A$2:$A$901, A2)
  • $A$2:$A$901: データの範囲全体を絶対参照で指定します。
  • A2: 検査したいセルを指定します。
  1. 数式をデータの最終行までオートフィルでコピーします。
  2. 作業列にフィルターをかけ、「1」以外の数値がないか確認します。

もし、ここに「2」や「3」といった数値が表示されたら、それは重複削除機能が見逃した「隠れ重複」です。すぐさま原因(スペース、全角/半角など)を特定し、対処しましょう。

このCOUNTIFによる検問を設けることで、あなたのデータは一点の曇りもない、完璧な状態に近づきます。

ステップ3:【差分チェック】で“消しすぎ”ていないか最終確認(所要時間:2分)

これは「削除してはいけない大事なデータを、誤って消してしまっていないか」を確認する作業です。

一番確実なのは、重複削除を行う前に、必ず元のデータを別のシートにコピーしておくことです。バックアップは、あなたの命綱です。

そして、削除後のデータと、元のデータを比較します。

「え、でも一つ一つ見比べるなんて時間が…」

大丈夫です。ここでも関数を使いましょう。少し応用的に聞こえるかもしれませんが、VLOOKUP関数やMATCH関数を使えば、機械的にチェックできます。

ここでは、もっと直感的にわかりやすい方法を紹介します。

それは、元のデータ(バックアップ)と削除後のデータを並べて、条件付き書式で比較する方法です。

  1. 新しいシートに、元のデータ(バックアップ)のキー列(例:顧客ID)と、削除後のデータのキー列を並べて貼り付けます。
  2. 2つの列を選択し、[ホーム]タブ → [条件付き書式] → [セルの強調表示ルール] → [重複する値] を選択します。
  3. ダイアログで「重複」ではなく「一意」を選択し、OKを押します。

もし、削除後のデータ側に色が付いたセルがあれば、それは「元のデータには存在するのに、削除後のデータには存在しない」ことを意味します。つまり、それが「意図せず消してしまった可能性のあるデータ」です。

この3ステップを踏むだけで、基本的なデータ検証の精度は劇的に向上します。

最初は少し面倒に感じるかもしれませんが、慣れれば5分もかかりません。

今回の内容は以上です。
最後まで読んでいただき、ありがとうございました!

この記事を書いた人

生活を豊かにしたくて、高配当株投資で年間配当金60万円をめざしています。
手取り15万円でも年100万円以上節約しています。
コツコツ投資して、今は年間配当金25万円以上になりました!

株歴15年以上&FX歴5年以上です。
新NISAとiDeCoをフル活用してます。

よろしくお願いします!

ぐーをフォローする
【ゼロからはじめる】Excel 【実務で使う】Excel関数
スポンサーリンク
ぐーをフォローする
ぐー@節約&高配当株ブログ

コメント