Deteksi Bot Spammer pada Twitter Berbasis Sentiment Analysis dan Time Interval Entropy

Main Authors: Aditya, Christian Sri Kusuma, Hani’ah, Mamluatul, Fitrawan, Alif Akbar, Arifin, Agus Zainal, Purwitasari, Diana
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Universitas Atma Jaya Yogyakarta , 2016
Online Access: http://ojs.uajy.ac.id/index.php/jbi/article/view/656
http://ojs.uajy.ac.id/index.php/jbi/article/view/656/676
ctrlnum article-656
fullrecord <?xml version="1.0"?> <dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><title lang="en-US">Deteksi Bot Spammer pada Twitter Berbasis Sentiment Analysis dan Time Interval Entropy</title><creator>Aditya, Christian Sri Kusuma</creator><creator>Hani&#x2019;ah, Mamluatul</creator><creator>Fitrawan, Alif Akbar</creator><creator>Arifin, Agus Zainal</creator><creator>Purwitasari, Diana</creator><description lang="en-US">Abstract. Spam is an abuse of messaging undesired by recipients. Those who send spam are called spammers.&#xA0; Popularity of Twitter has attracted spammers to use it as a means to disseminate spam messages. The spams are characterized by a neutral emotional sentiment or no particular users&#x2019; preference perspective. In addition, the regularity of tweeting behavior periodically shows automation performed by bot. This study proposes a new method to differentiate between bot spammer and legitimate user accounts by integrating the sentiment analysis (SA) based on emotions and time interval entropy (TIE). The combination of knowledge-based and machine learning-based were used to classify tweets with positive, negative and neutral sentiments. Furthermore, the collection of timestamp is used to calculate the time interval entropy of each account. The results show that the precision and recall of the proposed method reach up to 83% and 91%. This proves that the merging SA and TIE can optimize overall system performance in detecting Bot Spammer.Keywords: bot spammer, twitter, sentiment analysis, polarity, entropy&#xA0;Abstrak. Spam merupakan penyalahgunaan pengiriman pesan tanpa dikehendaki oleh penerimanya, orang yang mengirimkan spam disebut spammer. Ketenaran Twitter mengundang spammer untuk menggunakannya sebagai sarana menyebarluaskan pesan spam. Karakteristik dari tweet yang dikategorikan spam memiliki sentimen emosi netral atau tidak ada preferensi tertentu terhadap suatu perspektif dari user yang memposting tweet. Selain itu keteraturan waktu perilaku saat memposting tweet secara periodik menunjukkan otomatisasi yang dilakukan bot. Pada penelitian ini diusulkan metode baru untuk mendeteksi antara bot spammer dan legitimate user dengan mengintegrasikan sentimen analysis berdasarkan emosi dan time interval entropy. Pendekatan gabungan knowledge-based dan machine learning-based digunakan untuk mengklasifikasi tweet yang memiliki sentimen positif, negatif dan tweet netral. Selanjutnya kumpulan timestamp digunakan untuk menghitung time interval entropy dari tiap akun. Hasil percobaan menunjukan bahwa precision dan recall dari metode yang diusulkan mencapai 83% dan 91%. Hal ini membuktikan penggabungan Sentiment Analysis (SA) dan Time Interval Entropy (TIE) dapat mengoptimalkan performa sistem secara keseluruhan dalam mendeteksi Bot Spammer.Kata Kunci:&#xA0; bot spammer, twitter, sentiment analysis,&#xA0; polarity, entropy</description><publisher lang="en-US">Universitas Atma Jaya Yogyakarta</publisher><contributor lang="en-US"/><date>2016-07-17</date><type>Journal:Article</type><type>Other:info:eu-repo/semantics/publishedVersion</type><type>Other:</type><type>File:application/pdf</type><identifier>http://ojs.uajy.ac.id/index.php/jbi/article/view/656</identifier><identifier>10.24002/jbi.v7i3.656</identifier><source lang="en-US">Jurnal Buana Informatika; Vol 7, No 3 (2016): Jurnal Buana Informatika Volume 7 Nomor 3 Juli 2016</source><source>2089-7642</source><source>2087-2534</source><language>eng</language><relation>http://ojs.uajy.ac.id/index.php/jbi/article/view/656/676</relation><rights lang="en-US">Copyright (c) 2016 Jurnal Buana Informatika</rights><recordID>article-656</recordID></dc>
language eng
format Journal:Article
Journal
Other:info:eu-repo/semantics/publishedVersion
Other
Other:
File:application/pdf
File
Journal:eJournal
author Aditya, Christian Sri Kusuma
Hani’ah, Mamluatul
Fitrawan, Alif Akbar
Arifin, Agus Zainal
Purwitasari, Diana
title Deteksi Bot Spammer pada Twitter Berbasis Sentiment Analysis dan Time Interval Entropy
publisher Universitas Atma Jaya Yogyakarta
publishDate 2016
url http://ojs.uajy.ac.id/index.php/jbi/article/view/656
http://ojs.uajy.ac.id/index.php/jbi/article/view/656/676
contents Abstract. Spam is an abuse of messaging undesired by recipients. Those who send spam are called spammers. Popularity of Twitter has attracted spammers to use it as a means to disseminate spam messages. The spams are characterized by a neutral emotional sentiment or no particular users’ preference perspective. In addition, the regularity of tweeting behavior periodically shows automation performed by bot. This study proposes a new method to differentiate between bot spammer and legitimate user accounts by integrating the sentiment analysis (SA) based on emotions and time interval entropy (TIE). The combination of knowledge-based and machine learning-based were used to classify tweets with positive, negative and neutral sentiments. Furthermore, the collection of timestamp is used to calculate the time interval entropy of each account. The results show that the precision and recall of the proposed method reach up to 83% and 91%. This proves that the merging SA and TIE can optimize overall system performance in detecting Bot Spammer.Keywords: bot spammer, twitter, sentiment analysis, polarity, entropy Abstrak. Spam merupakan penyalahgunaan pengiriman pesan tanpa dikehendaki oleh penerimanya, orang yang mengirimkan spam disebut spammer. Ketenaran Twitter mengundang spammer untuk menggunakannya sebagai sarana menyebarluaskan pesan spam. Karakteristik dari tweet yang dikategorikan spam memiliki sentimen emosi netral atau tidak ada preferensi tertentu terhadap suatu perspektif dari user yang memposting tweet. Selain itu keteraturan waktu perilaku saat memposting tweet secara periodik menunjukkan otomatisasi yang dilakukan bot. Pada penelitian ini diusulkan metode baru untuk mendeteksi antara bot spammer dan legitimate user dengan mengintegrasikan sentimen analysis berdasarkan emosi dan time interval entropy. Pendekatan gabungan knowledge-based dan machine learning-based digunakan untuk mengklasifikasi tweet yang memiliki sentimen positif, negatif dan tweet netral. Selanjutnya kumpulan timestamp digunakan untuk menghitung time interval entropy dari tiap akun. Hasil percobaan menunjukan bahwa precision dan recall dari metode yang diusulkan mencapai 83% dan 91%. Hal ini membuktikan penggabungan Sentiment Analysis (SA) dan Time Interval Entropy (TIE) dapat mengoptimalkan performa sistem secara keseluruhan dalam mendeteksi Bot Spammer.Kata Kunci: bot spammer, twitter, sentiment analysis, polarity, entropy
id IOS1312.article-656
institution Universitas Atma Jaya Yogyakarta
institution_id 70
institution_type library:university
library
library Perpustakaan Universitas Atma Jaya Yogyakarta
library_id 276
collection Jurnal Buana Informatika
repository_id 1312
subject_area Program Komputer dan Teknologi Informasi
city SLEMAN
province DAERAH ISTIMEWA YOGYAKARTA
repoId IOS1312
first_indexed 2017-02-25T12:19:03Z
last_indexed 2017-02-25T12:19:03Z
recordtype dc
_version_ 1560307457815740416
score 16.32796