دورية أكاديمية

A new phishing-website detection framework using ensemble classification and clustering ... : إطار جديد للكشف عن موقع التصيد الاحتيالي باستخدام تصنيف المجموعة والتجميع العنقودي ...

التفاصيل البيبلوغرافية
العنوان: A new phishing-website detection framework using ensemble classification and clustering ... : إطار جديد للكشف عن موقع التصيد الاحتيالي باستخدام تصنيف المجموعة والتجميع العنقودي ...
المؤلفون: Mohammad A. Alsharaiah, Ahmad Adel Abu-Shareha, Mosleh Abualha, Laith H. Baniata, Omar Adwan, Adeeb Al-saaidah, Majdi Oraiqat
بيانات النشر: OpenAlex
سنة النشر: 2023
المجموعة: DataCite Metadata Store (German National Library of Science and Technology)
مصطلحات موضوعية: Detection and Prevention of Phishing Attacks, Information Systems, FOS Computer and information sciences, Computer Science, Physical Sciences, The Spread of Misinformation Online, Sociology and Political Science, Social Sciences, Sentiment Analysis and Opinion Mining, Artificial Intelligence, Phishing, Spam Detection, Bot Detection, URL Filtering, Random forest, Ensemble learning, Computer science, Cluster analysis, Classifier UML, Artificial intelligence, Machine learning, Data mining, Feature linguistics, Ensemble forecasting, Pattern recognition psychology, The Internet, World Wide Web, Linguistics, FOS Languages and literature, Philosophy
الوصف: Phishing websites are characterized by distinguished visual, address, domain, and embedded features, which identify and defend such threats. Yet, phishing website detection is challenged by overlapping these features with legitimate websites' features. As the inter-class variance between legitimate and phishing websites becomes low, commonly utilized machine learning algorithms suffer from low performance in overlapping feature cases. Alternatively, ensemble learning that combines multiple predictions intending to address low inter-class variations in the classified data improves the performance in such cases. Ensemble learning utilizes multiple classifiers of similar or different types with multiple deviations of the training data. This paper develops a framework based on random forest ensemble techniques. The limitations of the random forest are the inability to capture the high correlation between features and their join dependency on the label. The random forest is combined with k-means clustering to ... : تتميز مواقع التصيد الاحتيالي بميزات مرئية وعنوان ونطاق وميزات مضمنة مميزة، والتي تحدد هذه التهديدات وتدافع عنها. ومع ذلك، فإن اكتشاف موقع التصيد الاحتيالي يواجه تحديًا من خلال تداخل هذه الميزات مع ميزات مواقع الويب المشروعة. نظرًا لأن التباين بين الفئات بين مواقع الويب الشرعية ومواقع التصيد الاحتيالي يصبح منخفضًا، فإن خوارزميات التعلم الآلي شائعة الاستخدام تعاني من انخفاض الأداء في حالات الميزات المتداخلة. وبدلاً من ذلك، فإن التعلم الجماعي الذي يجمع بين تنبؤات متعددة تهدف إلى معالجة الاختلافات المنخفضة بين الفئات في البيانات المصنفة يحسن الأداء في مثل هذه الحالات. يستخدم التعلم الجماعي مصنفات متعددة من أنواع متشابهة أو مختلفة مع انحرافات متعددة لبيانات التدريب. تضع هذه الورقة إطارًا يعتمد على تقنيات فرقة الغابات العشوائية. تتمثل قيود الغابة العشوائية في عدم القدرة على التقاط الارتباط العالي بين الميزات واعتمادها المشترك على الملصق. يتم دمج الغابة العشوائية مع تجميع k - means لالتقاط ارتباط الميزة. يتم تقييم الإطار للكشف عن التصيد الاحتيالي باستخدام مجموعة بيانات مكونة من 5000 عينة. أظهرت النتائج أن الإطار ...
نوع الوثيقة: text
اللغة: English
العلاقة: https://dx.doi.org/10.60692/jncga-86460Test
DOI: 10.60692/x7010-thq57
الإتاحة: https://doi.org/10.60692/x7010-thq5710.60692/jncga-86460Test
حقوق: cc-by
رقم الانضمام: edsbas.D8D6FEF4
قاعدة البيانات: BASE