Laporkan Masalah

Klasifikasi Kualitas Teh Berdasarkan Aroma Ampas Daun Teh Hitam dengan Algoritma Random Forest dan Extreme Gradient Boosting

RATIH SUCI LESTARI, Dr. Dyah Aruming Tyas, S.Si. ; Dr. Danang Lelono, S.Si., M.T

2025 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI

Teh merupakan minuman olahan yang berasal dari daun Camellia sinensis dan merupakan komoditas perkebunan unggulan di Indonesia. Sehingga menjaga kualitas dan mutu teh menjadi faktor utama dalam industri. Penilaian kualitas teh masih mengandalkan indra manusia, yang bersifat subjektif dan bervariasi, terutama dalam menilai kualitas berdasarkan aroma. Masalah tersebut dapat diatasi dengan menerapkan sistem electronic nose (e-nose) dan algoritma pembelajaran mesin untuk mengidentifikasi serta membedakan kualitas teh secara lebih objektif. Namun, pembacaan aroma oleh e-nose sering kali terganggu oleh kondisi lingkungan maupun ketidakstabilan sensor, yang menghasilkan data menyimpang (outlier). Outlier ini berdampak pada penurunan performa sistem dalam mengklasifikasikan kualitas teh. Oleh karena itu, diperlukan pengembangan sebuah model klasifikasi yang mampu mengatasi outlier pada kualitas teh ke supaya konsisten dengan akurasi yang baik.

Perancangan sistem dilakukan dengan mempertimbangkan kebutuhan penelitian dengan memastikan bahwa setiap langkah menghasilkan sistem sesuai yang diharapkan. Tahapan perancangan sistem dimulai dengan pre-processing, yang berupa data cleaning, ektraksi fitur, seleksi fitur, kemudian pemodelan algoritma Random Forest dan XGBoost, serta pengujian sistem. Model dibandingkan dengan model tanpa proses seleksi fitur untuk mengetahui kinerja algoritma.

Hasil akurasi model Random Forest dengan seleksi fitur memiliki akurasi terbaik yaitu 85,83%, tanpa seleksi fitur dengan akurasi 84,83%, sedangkan akurasi model XGBoost dengan seleksi fitur yaitu 84,67%, tanpa seleksi fitur 83,50%. Berdasarkan penelitian ini, selain mengatasi outlier, tahapan seleksi fitur juga berpengaruh terhadap peningkatan akurasi model.

Tea is a processed beverage derived from the leaves of Camellia sinensis and is a leading plantation commodity in Indonesia. Therefore, maintaining the quality and standards of tea is a key factor in the industry. The assessment of tea quality still relies on human senses, which are subjective and vary, especially when evaluating quality based on aroma. This issue can be addressed by implementing an electronic nose (e-nose) system and machine learning algorithms to identify and differentiate tea quality more objectively. However, aroma readings by the e-nose are often disrupted by environmental conditions or sensor instability, resulting in deviating data (outliers). These outliers negatively impact the system’s performance in classifying tea quality. Therefore, it is necessary to develop a classification model capable of handling outliers in tea quality data to ensure consistent and accurate results.

The system design is carried out by considering the research needs and ensuring that each step produces the expected system outcome. The system design stages begin with pre-processing, which includes data cleaning, feature extraction, feature selection, followed by modeling using the Random Forest and XGBoost algorithms, and finally, system evaluation. The models are compared with those without the feature selection process to assess algorithm performance.

The accuracy results show that the Random Forest model with feature selection achieves the highest accuracy of 85.83%, while without feature selection it achieves 84.83%. The XGBoost model achieves 84.67% with feature selection and 83.50% without. Based on this study, in addition to handling outliers, the feature selection stage also contributes to improving model accuracy.

Kata Kunci : Teh Hitam, Random Forest, XGBoost

  1. S1-2025-456556-abstract.pdf  
  2. S1-2025-456556-bibliography.pdf  
  3. S1-2025-456556-tableofcontent.pdf  
  4. S1-2025-456556-title.pdf