14. Regular Expressio

Tutorial Belajar MySQL Part 23: Pencarian Data MySQL dengan Regular Expression (REGEXP)

Untuk pencarian sederhana, query SELECT..LIKE seperti yang telah kita bahas pada Tutorial Belajar MySQL: Pencarian Data dari Tabel MySQL (SELECT..LIKE) sebelumnya sudah mencukupi.

Namun untuk teknik pencarian yang lebih rumit, MySQL menyediakan query SELECT..REGEXP untuk pencarian menggunakan Regular Expression dari tabel MySQL.


Mempersiapkan Tabel Sample: daftar_dosen

Sebagai tabel sample untuk tutorial ini saya akan menggunakan tabel dari Tutorial Belajar MySQL: Menampilkan Data dari Tabel MySQL (SELECT). Jika anda ingin mencoba langsung query yang akan dibahas, silahkan mengikuti petunjuk pembuatan tabel sample yang ada di tutorial tersebut.

Tabel kita akan terdiri dari tabel mata_kuliah dan tabel daftar_dosen. Dalam tutorial kali ini kita hanya akan memakai tabel daftar_dosen saja. Berikut isi dari tabel tersebut:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
mysql> SELECT * FROM daftar_dosen;
+------------+----------------+------------+-----------+
| NIP        | nama_dosen     | no_hp      | alamat    |
+------------+----------------+------------+-----------+
| 0160436012 | Sabrina Sari   | 0812349900 | Pekanbaru |
| 0260432002 | Maya Ari Putri | 0812345234 | Palembang |
| 0275430005 | Susi Indriani  | 0812656532 | Bogor     |
| 0480432066 | Tia Santrini   | 0812451177 | Padang    |
| 0576431001 | M. Siddiq      | 0812979005 | Jakarta   |
| 0770435006 | Rubin Hadi     | 0812567678 | Papua     |
| 0869437003 | Mustalifah     | 0812338877 | Aceh      |
| 1080432007 | Arif Budiman   | 0812456345 | Makasar   |
+------------+----------------+------------+-----------+
8 rows in set (0.266 sec)

Pengertian Regular Expression

Bagi yang sudah pernah mengenal bahasa pemrograman lain, mungkin sudah mengenal Reguler Expression yang kadang disingkat dengan RexExp, atau hanya RE saja.

Dalam bahasa sederhana, Regular Expression adalah kumpulan huruf atau karakter yang digunakan untuk pencocokan pola (pattern matching). Pola disini contohnya ‘pola untuk kata yang diawali dengan huruf a dan diakhiri dengan huruf j’, atau yang sedikit rumit seperti ‘pola untuk kata yang diawali huruf a,b, c dengan panjang maksimal 5 huruf, mengandung minimal sebuah angka’.

Cakupan Regular Expression cukup luas dan tidak terbatas hanya pada MySQL saja. Hampir semua bahasa pemrograman komputer menyediakan fungsi khusus untuk regular expression. Dalam tutorial ini saya hanya membahas sebagian kecil dari RegExp.

Jika pada query SELECT..LIKE kita menggunakan pola ‘s%’ sebagai kata kunci yang berarti ‘kata yang diawali dengan huruf s dan memiliki banyak huruf 1 atau lebih’ dalam regular expression, penulisannya menjadi ‘^S.*’. Terlihat sedikit rumit, tapi mari kita pelajari aturan penulisan RegExp:

  • . : tanda titik dalam RegExp berarti sebuah karakter apa saja
  • [ … ]: tanda kurung siku ini berarti kumpulan karakter. Misalkan [abc] akan cocok dengan ‘a’, ‘b’, atau ‘c’. kita bisa juga menggunakan jangkauan (range), contohnya [a-z] akan cocok dengan seluruh huruf, [0-9] akan cocok dengan seluruh angka.
  • *: tanda bintang ini akan cocok dengan 0 atau lebih karakter sebelumnya. Misalkan ‘a*’ berarti akan cocok dengan seluruh kata yang mengandung 0 atau lebih a.
  • ^: tanda pangkat atau topi ini menandakan berada di awal kata.
  • $: tanda dollar ini berarti bahwa pola berada di akhir kata.

Berikut contoh penerapan dari pola RegExp ini:

  • ab*’: Pola ini berarti akan cocok dengan seluruh kata yang mengandung a dan diikuti oleh b atau tidak sama sekali. Contohnya: ‘a’, ‘ab’, ‘abbbbbb’, dan juga ‘kebab’, karena untuk RegExp, kita harus menyatakan dimana karakter itu muncul.
  • ^ab*’: Pola ini sama artinya dengan ‘ab*’ seperti diatas, namun tanda ^ menyatakan bahwa pola ini harus berada di awal kata, sehingga ‘kebab’ tidak akan cocok.
  • ^s..i$’: Pola ini akan cocok dengan seluruh kata yang diawali dengan s, dan diakhiri dengan i, terdiri dari 4 huruf. Contohnya: susi, sapi, dan siti.

Pencarian Data Tabel MySQL Menggunakan SELECT..REGEXP

Format dasar dari query pencarian menggunakan Regular Expression adalah:

SELECT nama_kolom_tampil FROM nama_tabel
WHERE nama_kolom_cari REGEXP keyword_reguler_expression
  • nama_kolom_tampil adalah nama dari kolom yang akan kita tampilkan, bisa semua kolom dalam tabel, atau hanya kolom tertentu saja.
  • nama_tabel adalah nama tabel dimana nama_kolom_tampil berada.
  • nama_kolom_cari adalah kolom yang akan kita gunakan untuk pencarian.
  • keyword_regular_expression adalah kata kunci dalam bentuk regular expression yang digunakan untuk pencarian.

Sebagai perbandingan dengan query SELECT..LIKE yang telah kita pelajari pada Tutorial Belajar MySQL: Pencarian Data dari Tabel MySQL (SELECT..LIKE), jika menggunakan Regular Expression pencarian nama_dosen yang diawali dengan huruf ‘s’ adalah sebagai berikut:

1
2
3
4
5
6
7
8
mysql> SELECT * FROM daftar_dosen WHERE nama_dosen REGEXP '^s.*';
+------------+---------------+------------+-----------+
| NIP        | nama_dosen    | no_hp      | alamat    |
+------------+---------------+------------+-----------+
| 0160436012 | Sabrina Sari  | 0812349900 | Pekanbaru |
| 0275430005 | Susi Indriani | 0812656532 | Bogor     |
+------------+---------------+------------+-----------+
2 rows in set (0.00 sec)

Penggunaan Regular Expression diperlukan jika kita butuh pencarian yang lebih rumit. Contohnya jika ingin mencari nama_dosen yang diawali dengan huruf ‘m’ atau ’s’, dan diakhiri dengan huruf vocal.

Pencarian seperti ini bisa saja dilakukan dengan SELECT..LIKE, namun butuh operator OR yang cukup banyak. Karena untuk huruf vocal berarti nama_dosen dapat berakhir dengan huruf a, i, u, e dan o.

Dalam Regular Expression, pola huruf vokal tersebut akan berbentuk ‘^[ms].*[aiueo]$‘ seperti contoh berikut:

1
2
3
4
5
6
7
8
9
10
mysql> SELECT * FROM daftar_dosen
WHERE nama_dosen REGEXP '^[ms].*[aiueo]$';
+------------+----------------+------------+-----------+
| NIP        | nama_dosen     | no_hp      | alamat    |
+------------+----------------+------------+-----------+
| 0160436012 | Sabrina Sari   | 0812349900 | Pekanbaru |
| 0260432002 | Maya Ari Putri | 0812345234 | Palembang |
| 0275430005 | Susi Indriani  | 0812656532 | Bogor     |
+------------+----------------+------------+-----------+
3 rows in set (0.00 sec)

Perhatikan bahwa dosen Mustalifah dan M. Siddiq walaupun berawalan M, namun tidak diakhiri dengan huruf vocal.

RegExp dalam MySQL akan bersifat case insensitif untuk tipe data CHARVARCHAR atau TEXT, dan bersifat case sensitif untuk tipe data tabel BINARYVARBINARY, atau BLOB.

Untuk pemakaian database sederhana, memakai query SELECT..LIKE untuk metode pencarian sudah mencukupi. Namun MySQL juga menyediakan Regular Expression untuk pencarian tingkat lanjut.

Dalam tutorial belajar MySQL selanjutnya kita akan membahas cara menggabungkan tabel MySQL dengan query JOIN.