Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-7244
Main Title: Shaping the selection of fields of study in Afghanistan through educational data mining approaches
Translated Title: Gestaltung der Auswahl von Studiengebieten in Afghanistan durch Educational Data Mining Ansätze
Author(s): Sherzad, Abdul Rahman
Advisor(s): Nestmann, Uwe
Referee(s): Nestmann, Uwe
Pinkwart, Niels
Bab, Sebastian
Peroz, Nazir
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
Language Code: en
Abstract: Every year around 250000 high school graduates participate in ‘Kankor’, the Afghan national university entrance exam, while the seating capacity of the country’s 36 public universities is one-fourth of that number. Currently, public and private sectors lack advisory systems to guide the increasing number of participants to choose their fields of study. This is further exacerbated by the fact that the Afghan high school education system and the Kankor are non-specialized and participants have only two chances to take the exam in their lifetime. Thus, participants make uninformed choices. This research is an effort to introduce a data-oriented system to support Afghan policymakers to reshape the education system and to empower advisors to recommend disciplines to test takers based on their skills and interests. This is the first such attempt in Afghanistan. The findings of this research are mainly based on 1.5 million records of Kankor candidates (2003-2015), 6000 records of high school students’ marks, more than 3000 questionnaires and interviews, author’s observations as well as empirical studies. The research findings show that high school marks alone cannot be a reliable data to replace Kankor for university admission. These research findings suggest strategic solutions for Kankor itself: an extensive model to introduce data culture in the core of the Afghan education system. The solutions offered create an evolving opportunity for the educational institutions to standardize testing approaches by considering the actual capacities and interests of test takers. This research proposes and develops the following three methods to better understand the interests, preferences and competences of applicants: (1) ‘assessment test’ to better understand the interest and tendency of Kankor applicants (2) ‘predictive models using data mining algorithms on Kankor data’ and (3) ‘recommender systems approach using high school marks’ to identify disciplines which are closest to Kankor candidates’ knowledge set, skills and preferences. The ‘e-Kankor’ is proposed to simulate the ‘actual Kankor exam’ allowing candidates to learn the importance of timeliness, methods and techniques through exam cram and to estimate the candidates’ scores prior to taking the actual Kankor. The scores are then used in the ‘prediction models’ as input data. The models proposed and developed in this research, if executed systematically, will on average support 250000 Kankor participants every year in choosing their fields of study judiciously. Moreover, they will support nearly 1000000 students who are currently in high school. That would shape and transform the selection of careers for generations to come. The developed models provide a roadmap for systematic student advising to become an integral part of the education structures. This research establishes the foundations to streamline standardized testing in a country which is in the very initial stages of experiencing the power of data. Such a transformation, powered by insight from data, may be the beginning of a paradigm shift. The models and findings of this research have the potential to be contextualized and applied in other countries that share a similar education system to Afghanistan. This research is also important in the field of educational data mining independent of the case study on Afghanistan. Finally, this work opens up numerous opportunities for further investigations in the future.
Jedes Jahr nehmen rund 250000 Schulabsolventen an der afghanischen nationalen Aufnahmeprüfung Kankor teil, wobei die Kapazität der 36 staatlichen Universitäten des Landes ein Viertel dieser Zahl ausmacht. Derzeit fehlt es dem öffentlichen und dem privaten Sektor an Beratungssystemen, um die steigende Zahl von Teilnehmern bei der Auswahl ihrer Studienfächer zu unterstützen. Dies wird noch dadurch verstärkt, dass das afghanische Schulsystem und Kankor nicht spezialisiert sind und die Teilnehmer nur zwei Chancen haben, das Examen in ihrem Leben zu absolvieren. Somit treffen die Teilnehmer uninformierte Entscheidungen. Diese Forschung ist ein Versuch, ein datenorientiertes System einzuführen, um afghanische Politiker dabei zu unterstützen, das Bildungssystem umzugestalten und Berater zu befähigen, den Testteilnehmern Fachdisziplinen basierend auf ihren Fähigkeiten und Interessen zu empfehlen. Dies ist der erste derartige Versuch in Afghanistan. Die Ergebnisse dieser Forschung basieren hauptsächlich auf 1,5 Millionen Aufzeichnungen von Kankor-Kandidaten (2003-2015), 6000 Aufzeichnungen von Abschlussnoten, mehr als 3000 Fragebögen und Interviews, Autorenbeobachtungen sowie empirischen Studien. Die Forschungsergebnisse zeigen, dass High-School-Noten allein keine verlässlichen Daten sein können, um Kankor für die Aufnahme in die Universität zu ersetzen. Die Forschungsergebnisse dieser Arbeit schlagen strategische Lösungen für Kankor selbst vor: ein umfassendes Modell zur Einführung einer Datenkultur in den Kern des afghanischen Bildungssystems. Die angebotenen Lösungen schaffen eine sich entwickelnde Möglichkeit für die Bildungseinrichtungen, Testansätze zu standardisieren, indem die tatsächlichen Fähigkeiten und Interessen der Testteilnehmer berücksichtigt werden. Diese Forschung empfiehlt und entwickelt die folgenden drei Methoden, um die Interessen, Präferenzen und Kompetenzen der Bewerber besser zu verstehen: (1) ein "Assessment-Test", um das Interesse und die Tendenz der Kankor-Bewerber besser zu verstehen (2) "Vorhersagemodelle auf Basis von Data-Mining-Algorithmen auf den Kankordaten" sowie (3)"Empfehlungssystem-Ansätze auf Basis von Schulnoten", um Disziplinen zu ermitteln, die den Kenntnissen, Fähigkeiten und Vorlieben der Kankor-Kandidaten am nächsten sind. Der "E-Kankor" wird vorgeschlagen, um die "tatsächliche Kankor-Prüfung" zu simulieren, die es Kandidaten ermöglicht, die Wichtigkeit von Aktualität, Methoden und Techniken der Prüfung zu lernen und die Punktzahlen der Kandidaten zu schätzen, bevor der eigentliche Kankortest absolviert wird. Die Bewertungen werden dann in den "Vorhersagemodellen" als Input Daten verwendet. Die in dieser Arbeit vorgeschlagenen und entwickelten Modelle werden, wenn sie systematisch durchgeführt werden, im Durchschnitt 250000 Kankor-Teilnehmer pro Jahr bei der Auswahl ihrer Studienfächer unterstützen. Darüber hinaus werden sie fast 1000000 Schüler unterstützen, die derzeit in der Schule sind. Das würde die Auswahl an Karrieren für künftige Generationen prägen und verändern. Die entwickelten Modelle bieten eine Roadmap für die systematische Beratung von Studierenden, um ein integraler Bestandteil der Bildungsstrukturen zu werden. Diese Untersuchung schafft die Grundlagen für die Rationalisierung von standardisierten Tests in einem Land, das sich gerade in der Anfangsphase hinsichtlich eines Erlebens der Macht der Daten befindet. Eine solche Transformation, die auf Daten basiert, könnte der Beginn eines Paradigmenwechsels sein. Die Modelle und Ergebnisse dieser Forschung können in anderen Ländern, die ein ähnliches Bildungssystem wie Afghanistan haben, kontextualisiert und angewendet werden. Diese Forschung ist auch unabhängig von der Fallstudie Afghanistan für den Bereich des Educational Data Mining relevant. Schließlich eröffnet diese Arbeit zahlreiche Möglichkeiten für weitere Untersuchungen in der Zukunft.
URI: https://depositonce.tu-berlin.de//handle/11303/8083
http://dx.doi.org/10.14279/depositonce-7244
Exam Date: 13-Jul-2018
Issue Date: 2018
Date Available: 7-Aug-2018
DDC Class: 004 Datenverarbeitung; Informatik
Subject(s): educational data mining
recommender systems
predictive field of study selection
data-informed approaches
Empfehlungssystem
Voraussage der Studienauswahl
datengestützte Ansätze
License: https://creativecommons.org/licenses/by-nc/4.0/
Appears in Collections:FG Modelle und Theorie Verteilter Systeme » Publications

Files in This Item:
File Description SizeFormat 
Sherzad_Abdul-Rahman.pdf14.93 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons