دورية أكاديمية

AFND: Arabic fake news dataset for the detection and classification of articles credibility ... : AFND: مجموعة بيانات الأخبار المزيفة العربية للكشف عن مصداقية المقالات وتصنيفها ...

التفاصيل البيبلوغرافية
العنوان: AFND: Arabic fake news dataset for the detection and classification of articles credibility ... : AFND: مجموعة بيانات الأخبار المزيفة العربية للكشف عن مصداقية المقالات وتصنيفها ...
المؤلفون: Ashwaq Khalil, Moath Jarrah, Monther Aldwairi, Manar Jaradat
بيانات النشر: OpenAlex
سنة النشر: 2022
المجموعة: DataCite Metadata Store (German National Library of Science and Technology)
مصطلحات موضوعية: The Spread of Misinformation Online, Sociology and Political Science, Social Sciences, Detection and Prevention of Phishing Attacks, Information Systems, FOS Computer and information sciences, Computer Science, Physical Sciences, Characterization and Detection of Android Malware, Signal Processing, Online Credibility, Credibility, Arabic, Computer science, Scripting language, Social media, Python programming language, Information retrieval, Focus optics, World Wide Web, Data science, Political science, FOS Political science, Philosophy, FOS Philosophy, ethics and religion, Linguistics, FOS Languages and literature, Physics, Optics, Law
الوصف: The news credibility detection task has started to gain more attention recently due to the rapid increase of news on different social media platforms. This article provides a large, labeled, and diverse Arabic Fake News Dataset (AFND) that is collected from public Arabic news websites. This dataset enables the research community to use supervised and unsupervised machine learning algorithms to classify the credibility of Arabic news articles. AFND consists of 606912 public news articles that were scraped from 134 public news websites of 19 different Arab countries over a 6-month period using Python scripts. The Arabic fact-check platform, Misbar, is used manually to classify each public news source into credible, not credible, or undecided. Weak supervision is applied to label news articles with the same label as the public source. AFND is imbalanced in the number of articles in each class. Hence, it is useful for researchers who focus on finding solutions for imbalanced datasets. The dataset is available in ... : بدأت مهمة الكشف عن مصداقية الأخبار في اكتساب المزيد من الاهتمام مؤخرًا بسبب الزيادة السريعة في الأخبار على منصات التواصل الاجتماعي المختلفة. تقدم هذه المقالة مجموعة كبيرة ومتنوعة من البيانات الإخبارية العربية المزيفة (AFND) التي يتم جمعها من المواقع الإخبارية العربية العامة. تمكن مجموعة البيانات هذه مجتمع البحث من استخدام خوارزميات التعلم الآلي الخاضعة للإشراف وغير الخاضعة للإشراف لتصنيف مصداقية المقالات الإخبارية العربية. تتكون AFND من 606912 مقالة إخبارية عامة تم سحبها من 134 موقعًا إخباريًا عامًا من 19 دولة عربية مختلفة على مدى 6 أشهر باستخدام نصوص بايثون. تُستخدم منصة التحقق من الحقائق العربية، مسبر، يدويًا لتصنيف كل مصدر من مصادر الأخبار العامة إلى مصدر موثوق به أو غير موثوق به أو متردد. يتم تطبيق الإشراف الضعيف على تصنيف المقالات الإخبارية بنفس تصنيف المصدر العام. AFND غير متوازن في عدد المقالات في كل فصل. وبالتالي، فهي مفيدة للباحثين الذين يركزون على إيجاد حلول لمجموعات البيانات غير المتوازنة. تتوفر مجموعة البيانات بتنسيق JSON ويمكن الوصول إليها من مستودع بيانات مندلي. ...
نوع الوثيقة: text
اللغة: English
العلاقة: https://dx.doi.org/10.60692/7jqa1-sqb28Test
DOI: 10.60692/kyjcm-ar235
الإتاحة: https://doi.org/10.60692/kyjcm-ar23510.60692/7jqa1-sqb28Test
حقوق: cc-by
رقم الانضمام: edsbas.80E08633
قاعدة البيانات: BASE