PERBANDINGAN ALAT PENGEKSTRAKAN DATA TEKS JANAAN PENGGUNA
Abstract
Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini amat bernilai sekiranya digunakan untuk tujuan penyelidikan. Namun begitu, bagaimanakah untuk mengekstrak bilangan data teks dalam jumlah yang banyak dengan mudah? Terdapat alat-alat pengesktrakan data teks yang telah dicipta untuk menyelesaikan masalah ini. Malah, banyak kajian terdahulu yang menggunakan data teks sebagai data utama dalam kajiannya tetapi tiada penerangan jelas tentang cara menggunakan alat pengekstrakan data teks tersebut. Oleh itu, kajian ini membincangkan berkenaan lima alat pengesktrakan data teks, ciri-ciri alat pengekstrakan data teks dan perbandingan terhadap 5 alat tersebut. Kajian ini telah melalui fasa penerokaan penting iaitu pemasangan perisian, pengujianan dan hasil output bagi setiap alat tersebut. Hasil kajian ini mendapati bahawa, setiap penggunaan alat pengekstrakan data teks mempunyai ciri istimewa yang tersendiri iaitu jenis perisian, tahap penggunaan, asas pengetahuan pengguna dan jenis laman sesawang yang boleh diekstrak. Selepas melalui proses pengujian bagi setiap alat, kajian ini mendapati bahawa alat pengekstrakan data teks ini sangat memudahkan pengguna untuk mendapatkan data teks dalam kuantiti yang banyak secara sistematik. Oleh itu, semoga kajian ini dimanfaatkan sepenuhnya bagi membolehkan para penyelidik berinteraksi dan berkongsi idea dengan ramai orang serta menjadi rujukan untuk penyelidikan akan datang.
Full Text:
PDFRefbacks
- There are currently no refbacks.
-
_________________________________________________
eISSN 1823-884x
Faculty of Social Sciences & Humanities
Universiti Kebangsaan Malaysia
43600 UKM Bangi, Selangor Darul Ehsan
MALAYSIA
© Copyright UKM Press, Universiti Kebangsaan Malaysia