19. Menghapus Duplikasi Data

Tutorial Belajar MySQL Part 28: Menghapus Duplikasi Data dengan Query DISTINCT

Pada Tutorial Belajar MySQL kali ini kita akan membahas tentang query DISTINCT. Query ini bisa digunakan untuk menghapus atau mengeliminasi duplikasi dari hasil tampilan SELECT.

Sama seperti query AS, ORDER BY, dan LIMIT, query DISTINCT ini digunakan sebagai tambahan dari query utamanya, yakni SELECT.


Mempersiapkan Tabel Sample: daftar_dosen

Dikarenakan keperluan contoh tabel, saya akan mengupdate tabel daftar_dosen dengan data yang baru. Isi tabel daftar_dosen sekarang adalah:

Tabel daftar_dosen ver.2

NIPNama DosenNo HPAlamat
0160436012Sabrina Sari0812349900Pekanbaru
0260432002Maya Ari Putri0812342342Palembang
0275430005Susi Indriani0812656532Bogor
0480432066Tia Santrini0812451177Padang
0576431001M. Siddiq0812979005Jakarta
0770435006Rubin Hadi0812567678Papua
0869437003Mustalifah0812338877Aceh
1080432007Arif Budiman0812456345Makasar
0785531001Siswanto0852878006Padang
0867221006Rudi Arwana0823987598Jakarta
0173551078Aria Sulistya0880743523Jakarta
0360432014Suci Syuhada0812341122Palembang

Jika anda ingin memakai data tabel yang sama, silahkan input ke dalam tabel_daftar dosen secara manual, atau bisa juga menggunakan query LOAD DATA INFILE di bawah ini. Untuk file txt dapat diperoleh dari sample data tabel dari link berikut: daftar_dosen ver.2.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
mysql> TRUNCATE daftar_dosen;
Query OK, 0 rows affected (0.05 sec)
 
mysql> LOAD DATA INFILE 'D:\\MySQL\\daftar_dosen.txt'
INTO TABLE daftar_dosen
FIELDS TERMINATED BY ','  LINES TERMINATED BY '\r\n';
Query OK, 12 rows affected (0.04 sec)
Records: 12  Deleted: 0  Skipped: 0  Warnings: 0
 
mysql> SELECT * FROM daftar_dosen;
+------------+----------------+------------+-----------+
| NIP_dosen  | nama_dosen     | no_hp      | alamat    |
+------------+----------------+------------+-----------+
| 0160436012 | Sabrina Sari   | 0812349900 | Pekanbaru |
| 0173551078 | Aria Sulistya  | 0880743523 | Jakarta   |
| 0260432002 | Maya Ari Putri | 0812342342 | Palembang |
| 0275430005 | Susi Indriani  | 0812656532 | Bogor     |
| 0360432014 | Suci Syuhada   | 0812341122 | Palembang |
| 0480432066 | Tia Santrini   | 0812451177 | Padang    |
| 0576431001 | M. Siddiq      | 0812979005 | Jakarta   |
| 0770435006 | Rubin Hadi     | 0812567678 | Papua     |
| 0785531001 | Siswanto       | 0852878006 | Padang    |
| 0867221006 | Rudi Arwana    | 0823987598 | Jakarta   |
| 0869437003 | Mustalifah     | 0812338877 | Aceh      |
| 1080432007 | Arif Budiman   | 0812456345 | Makasar   |
+------------+----------------+------------+-----------+
12 rows in set (0.00 sec)

Cara Menggunakan Query DISTINCT Untuk Menghapus Duplikasi

Penekanan untuk judul diatas, query DISTINCT digunakan hanya untuk memanipulasi tampilan hasil dari tabel. Duplikasi yang dihapus adalah untuk tampilan data, bukan data asli yang ada di MySQL.

Misalkan dari tabel daftar_dosen kita ingin menampilkan asal kota dari seluruh dosen yang ada. Maka querynya adalah sebagai berikut:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
mysql> SELECT alamat FROM daftar_dosen ORDER BY alamat;
+-----------+
| alamat    |
+-----------+
| Aceh      |
| Bogor     |
| Jakarta   |
| Jakarta   |
| Jakarta   |
| Makasar   |
| Padang    |
| Padang    |
| Palembang |
| Palembang |
| Papua     |
| Pekanbaru |
+-----------+
12 rows in set (0.00 sec)

Saya menambahkan perintah ORDER BY alamat agar tampilan lebih rapi (diurutkan berdasarkan alamat).

Dari hasil query, dapat dilihat bahwa nama kota yang sama akan tampil lebih dari sekali. Ini terjadi karena terdapat beberapa dosen yang beralamat di kota yang sama. Jika kita ingin setiap kota hanya muncul 1 kali saja, bisa menggunakan query DISTINCT.


Cara Penulisan Query DISTINCT MySQL

Berikut format dasar penulisan query DISTINCT:

SELECT DISTINCT nama_kolom FROM nama_tabel;
  • nama_kolom adalah nama kolom yang akan ditampilkan.
  • nama_tabel adalah nama tabel dari kolom yang akan ditampilkan.

Sehingga untuk menampilkan seluruh kota 1 kali saja bisa menggunakan query:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
mysql> SELECT DISTINCT alamat FROM daftar_dosen ORDER BY alamat;
+-----------+
| alamat    |
+-----------+
| Aceh      |
| Bogor     |
| Jakarta   |
| Makasar   |
| Padang    |
| Palembang |
| Papua     |
| Pekanbaru |
+-----------+
8 rows in set (0.00 sec)

Dengan penambahan perintah DISTINCT di awal query SELECT, maka hanya data yang unik saja yang akan tampil. Seandainya hasil query terdapat data yang sama lebih dari 1 kali tampil, perintah DISTINCT hanya akan menampilkannya 1 kali saja.

Namun jika kita menambah kolom nama_dosen, efeknya menjadi berbeda:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
mysql> SELECT DISTINCT nama_dosen,alamat FROM daftar_dosen
ORDER BY alamat;
+----------------+-----------+
| nama_dosen     | alamat    |
+----------------+-----------+
| Mustalifah     | Aceh      |
| Susi Indriani  | Bogor     |
| Aria Sulistya  | Jakarta   |
| M. Siddiq      | Jakarta   |
| Rudi Arwana    | Jakarta   |
| Arif Budiman   | Makasar   |
| Siswanto       | Padang    |
| Tia Santrini   | Padang    |
| Maya Ari Putri | Palembang |
| Suci Syuhada   | Palembang |
| Rubin Hadi     | Papua     |
| Sabrina Sari   | Pekanbaru |
+----------------+-----------+
12 rows in set (0.06 sec)

Terlihat MySQL tetap menampilkan seluruh isi tabel tanpa ada yang dieliminasi. Ini disebabkan query DISTINCT hanya mengeliminasi query yang unik secara baris per baris (per record).

Dengan mengombinasikan nama_dosen dengan alamat, maka setiap baris dianggap unik, kecuali terdapat nama dosen dan alamat yang persis sama.


Query SELECT … DISTINCT yang kita pelajari kali ini cocok dipakai untuk laporan atau menampilkan sebagian data dari tabel MySQL.

Tutorial selanjutnya akan membahas tentang pengelolaan user, yang dimulai dari Mengenal Superuser root dan Pengertian Privileges MySQL.