Analisis Pengaruh Penggunaan Data Atribut Rumah, Fitur Visual, dan Fitur Tekstual terhadap Akurasi Prediksi Harga Rumah
ADAM YOGISYAH PUTRA, Drs. Janoe Hendarto, M.I.Kom.
2025 | Skripsi | ILMU KOMPUTER
Pengembangan Automated Valuation Model untuk mengestimasi harga suatu properti dapat membantu pembeli, penjual, dan juga investor di sektor properti. Model AVM umumnya dilatih menggunakan atribut rumah seperti luas bangunan dan jumlah kamar. Namun, pendekatan ini belum mampu menghasilkan nilai estimasi yang optimal karena model belum mampu memahami faktor-faktor non-structural yang mempengaruhi harga rumah.
Penelitian ini mengeksplorasi penggunaan gabungan fitur visual dan tekstual dengan atribut rumah untuk melihat apakah penggunaan ketiga fitur tersebut dapat meningkatkan performa model prediksi harga rumah. Digunakan beberapa model, yaitu XGBoost untuk memprediksi harga, ResNet50, VGG16, dan CLIP untuk ekstraksi fitur visual pada gambar, dan SBERT untuk ekstraksi fitur tekstual pada teks deskripsi. Penelitian dilakukan dalam dua skenario, yaitu melatih model dengan atribut data lokasi, dan tanpa atribut data lokasi.
Hasil pengujian menunjukkan bahwa penggunaan fitur visual, tekstual, dan atribut secara bersamaan dapat meningkatkan performa model diatas baseline yang hanya dilatih menggunakan atribut rumah. Pada data dengan atribut lokasi, kombinasi fitur terbaik didapatkan menggunakan model ResNet50 dan SBERT dengan peningkatan nilai RMSE sebesar 3.9% lebih baik dan R-Squared 2.65% lebih baik. Pada data tanpa atribut lokasi, kombinasi fitur terbaik didapatkan menggunakan model CLIP dan SBERT dengan peningkatan nilai MAE sebesar 29.5% lebih baik, nilai RMSE sebesar 24.6% lebih baik dan R-Squared 98% lebih baik dibandingkan baseline. Penelitian ini menunjukkan bagaimana penggunaan fitur visual, tekstual, dan atribut rumah dapat meningkatkan performa model yang dilatih baik dengan atau tanpa data lokasi. Penelitian ini juga menunjukkan model CLIP dapat digunakan untuk ekstraksi fitur visual dan dapat bersaing dengan model CNN yang umum digunakan pada penelitian sebelumnya.
The development of Automated Valuation Models (AVM) to estimate property prices can assist buyers, sellers, and investors in the property sector. AVMs are generally trained using house attributes such as building area and the number of rooms. However, this approach is unable to produce optimal estimation values as the models cannot comprehend the non-structural factors that influence house prices.
This research explores the usage of visual and textual features with house attributes to investigate whether the combination of these three features can improve the performance of a house price prediction model. Several models were utilized: XGBoost for price prediction; ResNet50, VGG16, and CLIP for visual feature extraction from images; and SBERT for textual feature extraction from descriptive text. The research was conducted under two scenarios: training the model with location data attributes, and without location data attributes.
The test results indicate that the usage of visual, textual, and attribute features improves model performance over a baseline trained using only house attributes. On the dataset including location attributes, the best feature combination was achieved using the ResNet50 and SBERT models, yielding a 3.9% improvement in RMSE and a 2.65% improvement in R-Squared. On the dataset without location attributes, the best feature combination was achieved using the CLIP and SBERT models, resulting in a 29.5% improvement in MAE, a 24.6% improvement in RMSE, and a 98% improvement in R-Squared compared to the baseline. This study demonstrates how the usage of visual, textual, and attribute features can enhance the performance of models trained both with and without location data. This research also shows that the CLIP model can be utilized for visual feature extraction and can compete with the CNN models commonly used in previous studies.
Kata Kunci : Prediksi Harga Rumah, Multi Modal Input, CLIP, BERT, Convolutional Neural Network