Pembersihan dan Persiapan Data Spreadsheet: Tabel Andal untuk Analisis

Artikel

Pembersihan dan Persiapan Data Spreadsheet: Tabel Andal untuk Analisis

Pilih tahap

Panduan workflow spreadsheet. Tahap 4: Pembersihan dan persiapan data

Pembersihan data adalah jembatan antara input mentah dan analisis yang bisa dipercaya. Jika tabel berantakan, formula dan dashboard bisa terlihat rapi padahal hasilnya tetap salah.

Modul ini memberi kamu alur kerja yang bisa diulang untuk menyiapkan data spreadsheet sebelum dianalisis.

Konsep: Kenapa Pembersihan Data Penting

Data mentah biasanya memiliki ketidakkonsistenan kecil:

  • Baris duplikat
  • Spasi berlebih pada text
  • Nama kategori campur
  • Tanggal dengan format berbeda
  • Angka tersimpan sebagai text
  • Banyak nilai ditaruh dalam satu kolom

Pembersihan mengubah input yang tidak konsisten menjadi tabel yang bisa dipahami formula, pivot, dan chart.

Langkah 1: Buat Salinan untuk Dibersihkan

Jangan membersihkan langsung pada satu-satunya dataset mentah.

Struktur sheet yang disarankan:

  • Raw_Data: sumber data yang tidak disentuh
  • Clean_Data: salinan kerja yang sudah dibersihkan
  • Analysis: pivot table dan metrik
  • Dashboard: presentasi akhir

Simpan sheet mentah sebagai referensi jika suatu saat ada data yang perlu dicek lagi.

Langkah 2: Hapus Duplikat dengan Hati-Hati

Duplikat tidak selalu salah. Beberapa baris mungkin terlihat mirip tetapi sebenarnya mewakili transaksi berbeda.

Sebelum menghapus duplikat:

  1. Tentukan kolom mana yang mendefinisikan duplikat
  2. Cek apakah ID, tanggal, dan nilai uang benar-benar sama
  3. Catat berapa banyak baris yang dihapus

Contoh key duplikat yang umum:

  • Transaction ID
  • Alamat email
  • Nomor invoice
  • Kombinasi tanggal + pelanggan + jumlah

Langkah 3: Rapikan dan Bersihkan Text

Masalah pada text sering merusak filter, lookup, dan pivot.

Tindakan pembersihan yang berguna:

  • Hapus spasi di awal dan akhir
  • Standarkan huruf besar-kecil
  • Ganti label yang tidak konsisten
  • Hapus karakter tak terlihat

Formula yang membantu:

=TRIM(A2)
=CLEAN(A2)

Gunakan formula pembersihan di helper column, lalu paste as values saat hasilnya sudah benar.

Langkah 4: Split atau Merge Kolom dengan Sengaja

Split kolom ketika satu field berisi beberapa informasi.

Contoh:

  • Nama lengkap menjadi nama depan dan nama belakang
  • Alamat menjadi kota dan provinsi
  • Kode SKU menjadi keluarga produk dan varian

Merge kolom ketika kamu membutuhkan key gabungan yang stabil.

Contoh:

=A2&"-"&B2

Gunakan separator yang konsisten agar key gabungan tetap mudah dibaca.

Langkah 5: Tambahkan Aturan Validasi dan Dropdown

Validasi mencegah data baru yang berantakan masuk ke file.

Gunakan validasi untuk:

  • Field status
  • Field kategori
  • Batas rentang tanggal
  • Batas nilai angka
  • Field input yang wajib diisi

Contoh daftar status:

  • Open
  • In Progress
  • Done
  • Blocked

Dropdown sangat membantu ketika satu spreadsheet diedit oleh beberapa orang.

Langkah 6: Pisahkan Data Berulang ke Master Table

Kalau produk, pelanggan, departemen, atau status yang sama muncul terus-menerus, jangan kelola semuanya sebagai text bebas di banyak tempat.

Pisahkan data berulang menjadi:

  • Tabel transaksi: baris aktivitas utama
  • Lookup table atau master table: daftar nilai berulang yang disetujui

Contoh susunan:

  • Sales_Transactions: Order ID, Date, Customer ID, Product SKU, Qty
  • Products: Product SKU, Product Name, Category, Price
  • Customers: Customer ID, Customer Name, Region
  • Lists: opsi status, nama tim, atau pilihan kategori untuk dropdown

Kenapa ini penting:

  • Nama produk cukup diubah di satu tempat
  • Dropdown tetap sinkron dengan daftar yang terkontrol
  • Lookup menjadi lebih stabil
  • Laporan lebih mudah mengelompokkan nilai berulang

Ini adalah versi spreadsheet dari relasi satu-ke-banyak yang sederhana.

Langkah 7: Standarkan Aturan Penamaan

Nama yang konsisten membuat laporan lebih mudah dikelompokkan dan difilter.

Buat aturan untuk:

  • Header kolom
  • Label kategori
  • Nama produk
  • Nama region
  • Nama pemilik tugas

Contoh header yang baik:

  • Order Date
  • Customer Name
  • Total Amount
  • Payment Status

Hindari header yang terlalu samar seperti Data, Info, Value, atau Notes 2 kecuali artinya sudah terdokumentasi.

Tugas Latihan

Unduh sample CSV dari /assets/data/spreadsheet-sample-sales.csv, lalu sengaja buat atau identifikasi masalah berikut untuk latihan:

  • Baris duplikat
  • Spasi berlebih pada nama pelanggan
  • Label status campur seperti done, Done, dan DONE
  • Nama lengkap dalam satu kolom
  • Field wajib yang kosong

Lalu kerjakan tugas berikut:

  1. Salin data mentah ke Clean_Data
  2. Hapus duplikat yang benar-benar terkonfirmasi
  3. Rapikan spasi dengan TRIM
  4. Standarkan label status
  5. Pisahkan nama lengkap menjadi dua kolom
  6. Tambahkan validasi dropdown untuk status
  7. Pindahkan opsi kategori berulang ke lookup list kecil
  8. Pastikan tabel bersih tidak memiliki field wajib yang kosong

Kesalahan yang Umum

Perhatikan hal berikut:

  • Menghapus duplikat tanpa memastikan key yang benar
  • Membersihkan data mentah tanpa menyimpan backup
  • Mengganti text terlalu luas
  • Mencampur formula dan edit manual dalam helper column yang sama
  • Membuat opsi dropdown yang tidak cocok dengan nama kategori yang sudah ada
  • Mengulang label deskriptif secara manual alih-alih memakai ID atau lookup key
  • Lupa mengubah helper column hasil pembersihan menjadi values saat diperlukan

Checklist Audit Cepat

Sebelum analisis, pastikan:

  1. Data mentah masih tersimpan
  2. Aturan duplikat didokumentasikan
  3. Field text sudah dirapikan dan distandarkan
  4. Tanggal dan angka memakai format yang konsisten
  5. Dropdown tersedia untuk kategori berulang
  6. Entitas berulang dikelola lewat lookup table jika memang perlu
  7. Field wajib sudah lengkap

Kalau checklist ini selesai, data kamu siap dipakai untuk formula, pivot, dan dashboard.

Langkah berikutnya

Bangun setup yang lebih tepat tanpa asal beli

Lihat rekomendasi tools, catatan perangkat, dan resource digital yang membantu kamu mengambil keputusan lebih cepat.