データ分析を行う上で、「同じデータが重複している」状態は正確な集計を妨げます。
Power Queryを使えば、重複を削除したり、逆に重複しているデータだけを抽出したりといった操作が簡単に行えます。
この記事では、重複データ処理の基本をわかりやすく解説します。
この記事でわかること
- 重複データを削除する方法
- 重複データだけを抽出する方法
- 複数列を基準に重複判定する方法
- Power Queryでの自動クレンジングの考え方
重複データを削除する方法
最もよく使う操作が「重複行を削除する」です。Excelの「重複の削除」と同じような結果を、Power Queryでは自動化して実行できます。
手順①:対象列を選択
- Power Queryエディターを開く
- 重複を判定したい列を選択(例:「商品コード」)
手順②:「行の削除」メニューを使う
- 上部リボンの「ホーム」タブをクリック
- 「行の削除」→「重複の削除」を選択
これだけで、同じ値を持つ行が自動的にまとめられ、1つだけ残るようになります。
処理は「ステップ」として記録されるため、次回以降も自動で重複が除去されます。
複数列を基準に重複を判定
- Ctrlキーで複数列を選択(例:「商品コード」と「日付」)
- 「行の削除」→「重複の削除」を実行
この場合、すべての列の組み合わせが一致している行だけが重複と判定されます。
重複データだけを抽出する方法
重複データを削除するのではなく、「重複しているものを確認したい」場合もあります。
手順①:「グループ化」機能を使う
- 重複を判定したい列を選択
- リボンの「変換」→「グループ化」をクリック
- 「操作」を「行の数のカウント」に設定
手順②:重複のみフィルター
- 生成された「カウント」列で、値が「2以上」の行をフィルター
- これで、重複しているデータだけが抽出されます
必要に応じて、元データと結合することで「重複の詳細」も確認できます。
実践例:商品マスターでの重複検出
| 商品コード | 商品名 | 価格 |
|---|---|---|
| A001 | りんご | 100 |
| A001 | りんご | 100 |
| A002 | みかん | 120 |
上のように「A001」が2回登場している場合、
Power Queryで「商品コード」列を基準に重複を削除すれば、1行だけが残ります。
逆に「カウント列」を使えば、重複している「A001」だけを抽出可能です。
自動更新に強いクレンジング
- 重複削除ステップを1回設定すれば、次回以降も自動で実行される
- 更新ボタンを押すだけで、常にクリーンなデータを維持
- Excel関数よりも安定して動作する
これにより、手動での「重複チェック作業」を完全に自動化できます。
まとめ:Power Queryでデータを常にきれいに保とう
- 重複削除は「行の削除」→「重複の削除」から実行
- 重複抽出は「グループ化」+「カウント列」で実現
- 複数列を基準に判定することで精度が上がる
- 一度設定すれば、次回以降も自動クレンジング
これで、Power Queryの基礎シリーズは完結です!
ここまでの10回を通して、Excelでのデータ整形・自動化の基礎を体系的に学ぶことができました。
次のステップでは、関数やPower BIとの連携など、より高度な自動化にも挑戦してみましょう。




