Comparative Analysis of Filter Methods for Gene Selection

المؤلفون

  • Abdelhamid Elwaer Faculty of Information Technology, University of Tripoli, Libya المؤلف
  • Abdeladeem Dreder Faculty of Physical Therapy, University of Tripoli, Libya المؤلف

DOI:

https://doi.org/10.35778/jazu.i56.a648

الكلمات المفتاحية:

التعبير الجيني، اختيار الميزات، طرق الترشيح، اختبار T، كسب المعلومات، اختبار ويلكوكسون، (Chi2)، ارتباط بيرسون، معامل جيني، المصفوفات الدقيقة لسرطان الثدي.

الملخص

تطرح بيانات التعبير الجيني تحديات جسيمة نظراً لأبعادها العالية؛ مما يستلزم وجود طرق فعالة لاختيار الجينات لضمان دقة التحليل واكتشاف المؤشرات الحيوية. أجرينا في هذه الورقة البحثية دراسة مقارنة شاملة باستخدام تسع تقنيات لاختيار الجينات تعتمد على أسلوب الترشيح (Filter-based)، وهي: كسب المعلومات (Information Gain)، والمعلومات المتبادلة (Mutual Information)، واختيار الميزات القائم على الارتباط (CFS)، وخوارزمية (Relief-F)، واختبار (T-Test)، واختبار ويلكوكسون (Wilcoxon)، واختبار كاى تربيع (Chi2)، وارتباط بيرسون (Pearson)، ومعامل جيني (Gini index). وقد استخدمت مجموعة بيانات المصفوفات الدقيقة (Microarray) لسرطان الثدي لتقييم هذه الطرق بناء على دقة التصنيف، والكفاءة الحسابية، واستقرار مجموعات الجينات المختارة. أظهرت النتائج أن معظم الطرق تحقق دقة تنبؤية عالية واستقرارا تاما، إلا أنها تفاوتت في التكلفة الحسابية. تهدف هذه الدراسة إلى تقديم رؤى عملية لاختيار طرق الترشيح المناسبة بناءً على توازن الأداء والكفاءة في تحليل التعبير الجيني.

التنزيلات

تنزيل البيانات ليس متاحًا بعد.

المراجع

1. H. Liu and H. Motoda, Feature Selection for Knowledge Discovery and Data Mining. Boston, MA: Kluwer Academic Publishers, 1998.

2. I. Guyon and A. Elisseeff, "An introduction to variable and feature selection," J. Mach. Learn. Res., vol. 3, pp. 1157–1182, Mar. 2003.

3. J. R. Quinlan, C4.5: Programs for Machine Learning. San Mateo, CA: Morgan Kaufmann, 1993.

4. T. M. Cover and J. A. Thomas, Elements of Information Theory, 2nd ed. Hoboken, NJ: Wiley-Interscience, 2006.

5. G. H. John, R. Kohavi, and K. Pfleger, "Irrelevant features and the subset selection problem," in Proc. 11th Int. Conf. Mach. Learn., 1994, pp. 121–129.

6. D. G. Altman, Practical Statistics for Medical Research, 1st ed. London, U.K.: Chapman and Hall/CRC, 1990.

7. F. Wilcoxon, "Individual comparisons by ranking methods," Biometrics Bull., vol. 1, no. 6, pp. 80–83, 1945.

8. K. Pearson, "On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling," Philos. Mag. Ser. 5, vol. 50, no. 302, pp. 157–175, 1900.

9. L. Breiman, J. Friedman, R. Olshen, and C. Stone, Classification and Regression Trees. Belmont, CA: Wadsworth, 1984.

10. K. Kira and L. A. Rendell, "The feature selection problem: Traditional methods and a new algorithm," in Proc. 9th Natl. Conf. Artif. Intell., 1992, pp. 129–134.

11. M. A. Hall, "Correlation-based feature selection for machine learning," Ph.D. dissertation, Univ. Waikato, Hamilton, New Zealand, 1999.

12. N. Pudjihartono, T. Fadason, A. W. Kempa-Liehr, and J. M. O'Sullivan, "A review of feature selection methods for machine learning-based disease risk prediction," Front. Bioinform., 2022.

التنزيلات

منشور

2025-12-31

كيفية الاقتباس

Elwaer, A., & Dreder, A. (2025). Comparative Analysis of Filter Methods for Gene Selection. مجلة جامعة الزيتونة , 56, 101-111. https://doi.org/10.35778/jazu.i56.a648

المؤلفات المشابهة

11-20 من 99

يمكنك أيضاً إبدأ بحثاً متقدماً عن المشابهات لهذا المؤلَّف.