Disclaimer!
Halaman ini adalah proyek yang saya mulai sebagai alumni di kelas.work .
Overview
Secara bahasa, timeseries berasal dari bahasa Inggris Time; waktu dan Series; deretan atau urutan, yang dapat diartikan sebagai kumpulan data yang tersusun berdasarkan urutan waktu dalam interval waktu (tertentu) yang sama, seperti perjam, harian, mingguan atau tahunan. Adapun timeseries sering digunakan untuk memahami harga pasar saham harian, jumlah produk penjualan perbulan atau suhu udara kota perjam.
Timeseries memiliki beberapa karakteristik yang dapat membedakannya dari data lain, seperti:
Metodologi
Umumnya, timeseries terbagi menjadi dua pendekatan utama, yakni Timeseries Analysis dan Timeseries Forecasting. Kedua pendekatan tersebut merupakan dua tahapan yang saling melengkapi dan berkesinambungan. Dimana untuk menghasilkan prediksi dan nilai yang akurat, hasil analisis yang baik harus didapatkan terlebih dahulu. Untuk itu, jika dilakukan penyederhanaan, maka dua pendekatan tersebut merupakan langkah atau metode yang dapat digunakan secara sistematis, dimana Timeseries Analysis ialah seluruh tahapan dari data mining hingga EDA, sedangkan Forecasting adalah tahap lanjutannya, yakni pemodelan (modelling) hingga prediction.
Adapun metodelogi yang digunakan adalah sebagai berikut:
- Businesses Understanding
- Data Understanding
- Data Preparation
- Modelling
- Evaluation
- Deployment
CRISP-DM (Cross Industry Standard Process for Data Mining) dipilih karena merupakan salah satu metodologi yang paling banyak digunakan dalam data science. Metode ini menggunakan kerangka kerja yang terstruktur dan sesuai dengan standar industri, sehingga penggunaannya fleksibel dan dapat digunakan di hampir seluruh bidang pekerjaan, tidak kaku dan dapat dikombinasikan dengan metodologi atau pendekatan lain seperti dalam timeseries.
Dalam metodologi adapun rinciannya sebagai berikut:
- Timeseries Analysis
- Businesses Understanding
- Data Understanding
- Eksplorasi dan Visualisasi Data
- Statistical Checking Stationary Data
- Data Preparation
- Decomposition Analysis (Checking Multiplikative dan Additive)
- transformasi/pre-processing
- Timeseries Forecasting
- Modelling
- Evaluation
- Deployment
Dengan menggunakan pendekatan ini, hasil yang diharapkan akan berjalan dengan optimal.
Timeseries Analysis
a. Businesses Understanding
Perusahaan farmasi Kim Pharma adalah salah satu produsen utama obat anti-diabetes yang didistribusikan ke berbagai rumah sakit dan apotek. Permintaan obat ini cenderung fluktuatif karena faktor musiman, tren kesehatan, dan regulasi pemerintah.
Agar produksi dan distribusi berjalan optimal, perusahaan perlu menganalisis pola penjualan serta memprediksi permintaan agar stok tetap terjaga tanpa mengalami kekurangan atau kelebihan.
Dataset ini terdiri dari 204 entri yang merepresentasikan volume penjualan obat anti-diabetes. Data tersusun dengan dua kolom utama:
date
: merepresentasikan waktu dalam format bulanan
value
: jumlah unit distribusi obat dalam bentuk desimal
Setiap nilai pada kolom
value
merepresentasikan jumlah unit (box) yang di distribusikan oleh Kim Pharma. Dalam konteks ini, satu unit distribusi dapat didefinisikan sebagai: 1 box = 10 strip 1 strip = 10 tablet Maka: 1 unit = 1 box = 10 strip = 100 tablet
Format angka desimal muncul karena data telah dirata-ratakan dari berbagai lokasi distribusi. Nilai ini bukan jumlah mentah, tetapi representasi tren pergerakan kuantitas yang penting untuk analisis permintaan dan perencanaan logistik.
- Business Problem
- Penjualan obat yang berubah-ubah: Permintaan obat yang cenderung fluktuatif karena dipengaruhi oleh faktor musiman, tren kesehatan dan regulasi pemerintah. Sehingga perusahaan kesulitan dalam memperkirakan pola permintaan dan jumlah produksi yang optimal.
- Kurangnya pengendalian ketersediaan stok: Stok yang berlebih (Overload) menyebabkan pemborosan produksi dan anggaran, sementara kurangnya stok produksi (Stokout) membuat distribusi obat di pasaran melambat.
- Kurangnya prediksi (berbasis data) yang akurat: Perusahaan masih menggunakan prediksi manual tanpa model untuk membuat keputusan bisnis terkait produksi dan distribusi.
Beberapa masalah yang dihadapi oleh Kim Pharma:
- Analysis Objective Dari permasalahan yang dihadapi oleh Kim Pharma, manajemen perusahaan ingin mencapai beberapa hal sebagai berikut:
- Menganalisis faktor penyebab dan pola fluktuasi penjualan obat.
- Mengoptimalkan strategi rantai pasokan agar stok tetap efisien.
- Membuat model untuk memprediksi penjualan di masa depan.
- Key Questions
- Apa penyebab fluktuasi penjualan obat:
- Apakah fluktuasi lebih dominan di beberapa faktor tertentu?
- Apakah terdapat perilaku pelanggan yang signifikan pada periode fluktuasi?
- Apakah penjualan meningkat atau menurun dalam beberapa tahun terakhir?
- Bagaimana cara mengendalikan rantai stok obat di perusahaan:
- Bagaimana cara memprediksi penjualan obat dalam 12 bulan (setahun) ke depan?
- Berapa jumlah stok yang harus disiapkan untuk bulan-bulan mendatang?
- Bagaimana (hasil) prediksi dapat digunakan untuk perencanaan produksi dan distribusi obat di masa mendatang:
- Bagaimana cara mengubah prediksi menjadi keputusan bisnis actionable?
- Pendekatan (model) apa yang digunakan?
Berdasarkan gambaran yang didapat melalui permasalahan bisnis dan tujuan perusahaan, maka pertanyaan kunci yang harus dijawab untuk mencapai pemahaman tersebut ialah:
Dari pertanyaan berlapis (utama dan turunan) yang dinyatakan, pemahaman tidak hanya berfokus pada hasil model prediksi, tetapi juga implikasi bisnis-nya.
- Analytical Approach
- Eksplorasi dan visualisasi data: digunakan untuk memahami pola fluktuasi (tren dan musim penjualan).
- Checking Stationary: digunakan untuk mengecek apakah data stationary atau tidak, jika tidak maka perlu transformasi.
- Decomposition: memisahkan data menjadi beberapa komponen utama untuk memahami karakteristik dan pola yang ada.
- Transformation/Pre-processing: Mempersiapkan data yang tidak stationary agar siap untuk tahap modelling.
Untuk menjawab pertanyaan di atas, pendekatan analisis yang digunakan ialah (timeseries) yang meliputi Analysis dan Forecasting. Dengan rinciannya sebagai berikut:
Sehingga didapatkan model Auto Arima sebagai model (machine learning) yang digunakan untuk timeseries.
b. Data Understanding
i. Eksplorasi dan Visualisasi Data
Pada tahap ini, akan dilakukan eksplorasi awal untuk memahami gambaran umum dari data, seperti tipe data, informasi statistik hingga variasi dalam penjualan.
ii. Statistical Checking Stationary Data
c. Data Preparation
i. Decomposition Analysis (Checking Multiplikative dan Additive)
ii. Transformation/Pre-processing
Timeseries Forecasting
a. Modelling
b. Evaluation
c. Deployment
Memiliki saran, kritik atau pertanyaan? Tinggalkan pesan Anda pada form yang disediakan 💬
Atau hubungi saya di profile