B- SPLINE DALAM MODEL REGRESI NONPARAMETRIK
1. Latar Belakang
Regresi adalah suatu bentuk hubungan di antara dua jenis peubah yakni peubah X dan peubah Y, di mana Y sebagai peubah terikat dan X sebagai peubah penjelas. Untuk menjelaskan hubungan kedua jenis peubah X dan peubah Y digunakanlah sebuah kurva regresi. Pendekatan yang dipakai dalam menentukan kurva regresi ada dua jenis, yakni pendekatan parametrik dan nonparametrik. Apabila kurva regresi diasumsikan telah membentuk pola hubungan tertentu misal bentuk linier, kuadratik dan kubik, maka hal ini disebut pendekatan parametrik. Asumsi tersebut bisa diperoleh dari teori dan informasi ataupun pengetahuan dari masa yang telah lalu. Kurva regresi tersebut secara matematis diwakili oleh suatu bentuk model. Namun, model dengan pendekatan parametrik mempunyai keterbatasan untuk menduga perubahan pola data yang tidak diharapkan (Sasmitoadi, 2005).
Apabila asumsi model dengan pendekatan parametrik tidak terpenuhi dan tidak ada informasi apapun tentang bentuk dari fungsi regresi, maka pendekatan yang digunakan adalah pendekatan nonparametrik. Pendekatan nonparametrik merupakan metode pendugaan model yang dilakukan berdasarkan pendekatan yang tidak terikat asumsi bentuk kurva regresi tertentu, sehingga memberikan fleksibilitas yang lebih besar (Haerdle, 1990). Kurva regresi berdasarkan pendekatan nonparametrik ini, diwakili oleh model yang disebut model regresi nonparametrik.
Salah satu model regresi dengan pendekatan nonparametrik yang dapat digunakan untuk menduga kurva regresi adalah regresi spline. Regresi spline adalah suatu pendekatan ke arah pengepasan data dengan tetap memperhitungkan kemulusan kurva. Spline merupakan model polinomial yang tersegmen atau terbagi. Sifat tersegmen atau terbagi inilah yang memberikan fleksibilitas yang lebih baik daripada model polinomial biasa. Sifat ini memungkinkan model regresi spline menyesuaikan diri secara efektif terhadap karakteristik lokal dari data. Pendekatan spline mempunyai suatu basis fungsi. Namun spline mempunyai kelemahan pada saat orde spline tinggi, knot yang banyak dan knot yang terlalu dekat akan membentuk matrik dalam perhitungan yang hampir singular, sehingga persamaan normal tidak dapat diselesaikan. Knot diartikan sebagai suatu titik fokus dalam fungsi spline, sehingga kurva yang dibentuk tersegmen pada titik tersebut. Basis lain yang yang dapat mengatasi kelemahan ini adalah basis B-spline (Lyche dan Morken, 2004).
2. Rumusan Masalah
Permasalahan yang akan dibahas dalam penelitian ini adalah bagaimana cara untuk memodelkan dan memilih model regresi nonparametrik terbaik melalui estimasi B-spline menggunakan kriteria Mean Squared Error (MSE) dan R-Square.
3. Pembatasan Masalah
Masalah yang dibahas dalam penelitian ini dibatasi pada memodelkan dan memilih model regresi nonparametrik terbaik melalui estimasi B-spline menggunakan kriteria Mean Squared Error (MSE) dan R-Square terkecil untuk semua kemungkinan banyaknya knot menggunakan B-spline dengan derajat yang telah ditentukan, yakni derajat 2 (Linier), derajat 3 (Kuadratik) dan derajat 4 (Kubik).
4. Tujuan Penelitian
Dengan memperhatikan perumusan masalah di atas, maka tujuan dari penelitian ini adalah untuk mempelajari penggunaan regresi B-spline dan memperoleh model terbaik dari regresi nonparametrik dengan B-spline.
5. Manfaat Penelitian
Manfaat yang diharapkan dari penelitian ini adalah memperdalam pengetahuan serta wawasan pemikiran mengenai B-spline pada regresi nonpametrik.
6. Metodologi Penelitian
Metodologi penelitian yang digunakan adalah study literature yaitu cara mempelajari buku-buku, jurnal-jurnal dan bahan-bahan literatur yang berhubungan dengan permasalahan untuk kemudian dianalisis secara matematis, kemudian diterapkan untuk menyelesaikan suatu contoh permasalahan.
Contoh kasus yang akan diambil dalam penelitian ini adalah mengenai percobaan untuk mengukur nilai serapan larutan baku (Absorbansi) Fenol 1 x 10-4 M pada bermacam panjang gelombang Ultra Violet dalam nano meter (nm) yang berbeda (λ) Wahyuni (1996). Wahyuni dalam penelitiannya, menentukan panjang gelombang optimal berdasarkan nilai amatan yang sebenarnya, tanpa memodelkannya terlebih dahulu. Akibatnya, panjang gelombang optimal yang didapatkan kemungkinan besar berbeda dari nilai yang sesungguhnya. Untuk mendapatkan model hubungan antara panjang gelombang dan nilai absorbansi, maka akan digunakan model regresi B-Spline.
Untuk memudahkan dalam hal komputasi, khususnya dalam hal menentukan banyaknya kombinasi knot yang mungkin, digunakan paket software statistika, Minitab 16.0
Daftar Pustaka
Andersen, B. 2005. Regression III: Advanced Methods, lecture 15: Regression Spline. http://socserv.mcmaster.ca/andersen/15.spline.pdf.
Botella, O. and Shariff, K., 2003, “B-Spline Methods in Fluid Dynamics”. International
Journal of Computational Fluid Dynamics, 17 (2), 133-149.
Daniel,W.W. 1989. Statistika Nonparametrik Terapan, Gramedia, Jakarta.
Eubank, R. 1988. Spline Smoothing and Nonparametric Regression. Marcel Dekker. New York.
Fahrmeir, L. dan Tuhtz, G. 1994. Multivariate Statistical Modelling Based on Generalized Linier Models. Springer-Verlag. New York.
Hamilton, L.C. 1992. Regression with Graphics: A Second Course in Applied Statistics. Duxbury Press. Belmont, California.
Lee, T. C. M. 2002. On Algorithms for Ordinary Least Squares Regression Spline Fitting: A Comparative Study. Journal Statist. Comput. Simul., Vol. 72(8):647–663.
Sasmitoadi, D. 2005. Kajian Penggunaan Knot Dan Orde Pada Regresi Spline. doclines.files.wordpress.com/2008/10/kajian-penggunaan-knot-dan-orde-pada-regresi-spline.doc (2 Januari 2009 pukul 16.00).
Soemantri, 2008, Regresi Linear Non Parametrik Melalui Metoda Theil, UNPAD: Bandung.http://resources.unpad.ac.id/unpadcontent/uploads/publikasi_dosen/theil's%20method.pdf (5 januari 2009 pukul 13.00).
Wand, M. P. 2000. A Comparison of Regression Spline Smoothing Procedures. Computational Statistics (15): 443–462.
