ANALISIS SENTIMEN DENGAN PENDEKATAN ENSEMBLE LEARNING DAN WORD EMBEDDING PADA TWITTER
DOI:
https://doi.org/10.24076/joism.2023v4i2.973Keywords:
Ensemble Learning, Sentiment Analysis, Word Embedding, TwitterAbstract
Twitter merupakan media sosial yang sering digunakan dimana mencapai 284 juta pengguna aktif dan setiap harinya lebih dari 500 juta tweet per hari. Hari ini menjadikan peluang emas bagi perusahaan dan individu untuk meningkatkan relasi sosial, politik, dan ekonomi yang kuat demi meningkatkan reputasi. Pada kumpulan tweet tersebut memuat opini yang berasal dari berbagai pengguna. Hal ini sangat potensial bagi perusahaan untuk menggali dan mendapatkan informasi mengenai jenis tweet ini. Selanjutnya, ekstrasi data yang disusun dalam bentuk Bag Of Word ini terdapat kekurangan. Fitur yang dihasilkan cukup banyak sehingga berpengaruh dalam waktu proses untuk pelatihan data. Metode Word2Vec memiliki keunggulan dalam menangkap hubungan sintaksis dan semantik antar kata. Pada penelitian ini berusaha untuk meningkatkan akurasi yang dicapai dengan penggunaan word embedding sebagai representasi teks dan ensemble learning dari pengklasifikasi yang digunakan. Hasil penelitian ini mampu menunjukkan tngkat akurasi yang lebih tinggi dalam penggunaan algoritma Adaboost dan Word2Vec.
Kata Kunci :
Ensemble Learning, Sentiment Analysis, Word Embedding, Twitter.
Downloads
References
J. Zhao, “Combing semantic and prior polarity features for boosting twitter sentiment analysis using ensemble learning,” Proc. - 2016 IEEE 1st Int. Conf. Data Sci. Cyberspace, DSC 2016, pp. 709–714, 2017, doi: 10.1109/DSC.2016.124.
M. Rathi, A. Malik, D. Varshney, R. Sharma, and S. Mendiratta, “Sentiment Analysis of Tweets Using Various Machine Learning Techniques,” 2018 Int. Conf. Adv. Comput. Telecommun. ICACAT 2018, pp. 2–4, 2018, doi: 10.1109/ICACAT.2018.8933612.
X. Ye, H. Dai, L. an Dong, and X. Wang, “Multi-view ensemble learning method for microblog sentiment classification,” Expert Syst. Appl., vol. 166, p. 113987, 2021, doi: 10.1016/j.eswa.2020.113987.
S. M. Rezaeinia, R. Rahmani, A. Ghodsi, and H. Veisi, “Sentiment analysis based on improved pre-trained word embeddings,” Expert Syst. Appl., vol. 117, pp. 139–147, 2019, doi: 10.1016/j.eswa.2018.08.044.
I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining Practical Machine Learning Tools and Techniques Fourth Edition, 4th ed. Montreal, Canada: Morgan Kaufman, 2011. doi: 10.1016/C2009-0-19715-5.
C. Dedhia and J. Ramteke, “Ensemble model for Twitter sentiment analysis,” Proc. Int. Conf. Inven. Syst. Control. ICISC 2017, pp. 1–5, 2017, doi: 10.1109/ICISC.2017.8068711.
L. Chen and H. Deng, “Predicting User Retweeting Behavior in Social Networks with a Novel Ensemble Learning Approach,” IEEE Access, vol. 8, pp. 148250–148263, 2020, doi: 10.1109/ACCESS.2020.3015397.
N. Alami, M. Meknassi, and N. En-nahnahi, “Enhancing unsupervised neural networks based text summarization with word embedding and ensemble learning,” Expert Syst. Appl., vol. 123, pp. 195–211, 2019, doi: 10.1016/j.eswa.2019.01.037.
U. Pasupulety, A. Abdullah Anees, S. Anmol, and B. R. Mohan, “Predicting stock prices using ensemble learning and sentiment analysis,” Proc. - IEEE 2nd Int. Conf. Artif. Intell. Knowl. Eng. AIKE 2019, pp. 215–222, 2019, doi: 10.1109/AIKE.2019.00045.
K. A. Rokhman, B. Berlilana, and P. Arsi, “Perbandingan Metode Support Vector Machine Dan Decision Tree Untuk Analisis Sentimen Review Komentar Pada Aplikasi Transportasi Online,” J. Inf. Syst. Manag., vol. 3, no. 1, pp. 1–7, Jan. 2021, doi: 10.24076/JOISM.2021v3i1.341.
Z. Alhaq, A. Mustopa, S. Mulyatun, and J. D. Santoso, “Penerapan Metode Support Vector Machine Untuk Analisis Sentimen Pengguna Twitter,” J. Inf. Syst. Manag., vol. 3, no. 2, pp. 44–49, Jul. 2021, doi: 10.24076/joism.2021v3i2.558.
S. Sumathi and S. N. Sivanandam, Introduction to Data Mining and its Applications, vol. 29. 2006. doi: 10.1007/978-3-540-34351-6.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Journal of Information System Management (JOISM)
This work is licensed under a Creative Commons Attribution 4.0 International License.