Zum Inhalt
zur ICT Berufsbildung Startseite
Schliessen

Fragen zur ICT-Berufsbildung?

FAQ
Telefon +41 58 360 55 50
ICT-Berufsbildung Schweiz
Waisenhausplatz 14
3011 Bern
Contact & Options +

Wie Data Scientists die Maschinen lernen lassen – Einblick in Machine Learning

24. November 22 by Fachhochschule Graubünden FHGR

Algorithmen empfehlen uns in der Digitalisierung nicht nur Freunde auf TikTok, die künstliche Intelligenz verarbeitet dank Data Scientists riesige Datenmengen, simuliert komplexe «Denkprozesse» und lernt sogar selbständig neue dazu. «Machine Learning» ist Inhalt des Bachelorstudiums Computational and Data Science der Fachhochschule Graubünden und das wohl prägendste Wissen unserer Zukunftsgesellschaft.


Wie wird die KI zukünftige Generationen beeinflussen? Die Antworten auf diese Frage sind so unterschiedlich wie die Menschen, die sie geben. Von vielversprechenden Utopien bis zu einschneidenden Dystopien wird alles erwartet. Einig sind sich alle Stimmen beim Handlungsbedarf: Unsere Daten-Profis werden mit Unmengen von Daten arbeiten, die sie analysieren und die Maschinen clever zu menschenähnlichen «Denkprozessen» zusammensetzen. So verspricht die KI, die Gesellschaft zu entlasten. Die Data Scientists und Software Engineers, die diesen Maschinen das Lernen «lehren», sind daher gefragte Profis. Sie lotsen die Gesellschaft durch die digitale Transformation – kritisch, kompetent und top ausgebildet.


Ein Studium zum Data Scientist

Das Bachelorstudium Computational and Data Science der FH Graubünden bildet diese Spezialistinnen und Spezialisten aus – geschult in kritischem Denken und datenbasiertem Analysieren. Die Studierenden vertiefen sich in drei Fachrichtungen – in Angewandter Informatik, Data Science sowie Computersimulation.


Die Grundlage des Studiums ist die Angewandte Informatik rund um die Softwareentwicklung, Betriebs- oder Datenbanksysteme. In der Digitalisierung sind die folgenden Themen im Studium tragend: Cloud Computing, Cryptography und Security sowie Software Engineering und Software-Qualität. Zudem vermittelt das Studium im Modul Design Thinking ausgeprägte Problemlöse-Strategien.


In der zweiten Fachrichtung Data Science setzen sich die Studierenden mit einem der wichtigsten Themen der Zukunftsgesellschaft auseinander: «Machine Learning». Es ist ein wesentliches Modul der Fachrichtung, nebst den Modulen «Data Science» und «Natural Language Processing und «Question Answering». Die Studierenden erreichen, mit Unterstützung von Data Science, branchenspezifische Daten zu sammeln, sie zu visualisieren und einzusetzen.


Die dritte Fachrichtung ist die Computersimulation. Mit Simulationen ersetzen wir Experimente und gewinnen erstaunliche Erkenntnisse aus Modellen, welche grosse Rechenkapazitäten – High Performance Computing verlangen. Die Studierenden müssen in der Lage sein, komplexe Daten in anschauliche Modelle und Simulationen umzusetzen, um so genaue Erkenntnisse zu Szenarien in Wirtschaft, Gesellschaft oder Forschung zu generieren. Dabei geht es um Simulationen, wie zum Beispiel eine Evakuation von Menschen aus Gebäuden. Dabei wird analysiert, wie schnell ein Raum verlassen werden kann.  Die Inhalte aus dem Studium vertiefen die Studierenden in Aufgaben für Tech- und Life-Science sowie Engineering, damit sie projekterfahren ins Berufsleben einsteigen. Aber in welche Berufe?





Die Jobs der Computational and Data Science

Die FH Graubünden pflegt ein breites Partnernetzwerk rund um den Studiengang. Die Partner arbeiten eng mit den Studierenden zusammen, was später oft zu Arbeitsverhältnissen führt: als Data Scientist, Simulation Engineer oder Software Engineer. Die Data Scientists analysieren vor allem grosse Datenmengen und entwickeln Modelle für Vorhersagen. Die Simulation Engineers ersetzen oder ergänzen Experimente mit Computersimulationen und die Software Engineers entwickeln Software für Wirtschaft, Politik und Forschung.  


Starke Kooperationen für starke Berufsleute

Die intensive Einbindung des Partnernetzwerkes – Unternehmen wie Netcetera, Graubündner Kantonalbank oder Hamilton – ist nicht der einzige Karrierestart-Vorteil im Bachelorstudium Computational and Data Science: Die Studienleitung setzt auf kleine Klassen. Das heisst, jede Studentin und jeder Student verbringt so viel Zeit wie möglich in den Laboren. Zudem profitieren sie vom DAViS – dem Kompetenzzentrum für Daten Analyse, Visualisierung und Simulation an der FH Graubünden. Es ist ein regionales Kompetenzzentrum für Forschung, Industrie und Lehre, das den Studierenden Zugang zu aktueller Forschungsarbeit bietet.


Lehrer der Maschinen – Einblick in das Modul Machine Learning

Machine Learning bietet Automation. Aber darüber hinaus bringen uns Machine Learning Modelle laufendes Wissen zu interessanten Szenarien. Wie wir also im Fall von TikTok an Freundschaftsvorhersagen interessiert sind, interessieren sich die meisten Betriebe an den Vorhersagen von Machine Learning Modellen. Da Machine Learning Modelle selbst lernen, sind sie perfekt dafür geeignet, wichtige Ereignisse für Gesellschaft, Wirtschaft und Forschung «vorherzusagen» und Wahrscheinlichkeiten zu berechnen. Sie lernen aus dem Erlernten und entwickeln es weiter. Dennoch leisten Data Scientists ihren grundlegenden Beitrag. Die Schritte der Vorarbeit basieren auf Prozess-Modellen, die die Studierenden und zukünftigen Data Scientists im Modul Machine Learning erfahren.



Das grundlegende Standardprozess-Modell heisst «Cross Industry Standard Process for Data Mining» von IBM. Dieses Modell beinhaltet sieben Schritte: Verständnis des Unternehmens/der Frage, Verständnis der Daten, die Datenaufbereitung, die Modellierung, die Evaluation des Modells, seine Anwendung im Betrieb sowie die Überwachung.


Besonders der dritte Schritt, die Datenaufbereitung, ist ein wichtiges Arbeitsfeld für Data Scientists. Bis zu 80% der gesamten Arbeit eines Data Scientists besteht aus Datenaufbereitung. Der Rest verteilt sich auf die übrigen Schritte, wie es praxiskundige Expertinnen und Experten einschätzen. Die Ausnahme bestätigt allerdings die Regel: Es gibt Unterschiede zwischen den verschiedenen Modellen. Einige Modelle benötigen mehr Vorarbeit als andere. Die Regressions- oder Klassifikationsbäume zum Beispiel benötigen nicht viel Datenvorbereitung, aber sie sind dennoch anwendungsfreundliche Modelle in der Praxis.


Besonders die «Gradient Boosting» Modelle mit dem Paket «xgboost» sind in der Praxis sehr bekannte und beliebte Modelle. Ihre Bekanntheit haben diese Modelle durch diverse Auszeichnungen erlangt, unter anderem von der Online Community «Kaggle». Die Methoden, deren Anwendung und die Vor- und Nachteile der Boosting Modelle vertiefen die Studierenden ausführlich im Studium Computational and Data Science.



Die Erklärung der Modelle

Heutzutage spielen aber nicht nur Vorhersagen eine wichtige Rolle, sondern auch die Erklärung der Modelle selbst. Welche Variablen bestehen im Modell? Und wie wirken sie auf andere? Auf Knopfdruck bekommen Data Scientists Informationen aus den Boosting Modellen darüber, wie wichtig der Einfluss jeder Variabel ist. Dies ist nicht bei jedem Modell der Fall. Besonders in der Medizin oder im Versicherungswesen ist es nötig zu erklären, wie die Variablen die verschiedenen Modelle beeinflussen. Diese Einflüsse zu berechnen, verlangt nach hoher Rechenleistung.


Die Boosting Modelle generieren Unmengen von Daten. Sie können nicht mehr auf herkömmlichen Laptops durchgeführt werden – sie brauchen mehr Leistung. Daher verwenden die Studierenden im Studium Computational and Data Science grosse Rechner, die auch in der Praxis in den Betrieben verwendet werden. So praktizieren sie schon während des Studiums den Umgang mit den richtigen Tools. Zudem lernen sie, wie sie mit lokalen Maschinen auf diese dezentralen Hochleistungs-Rechner übers Netz oder über die Kommando-Zeile zugreifen.


Das Studium Computational and Data Science schafft die so nötigen Expertinnen und Experten, die grosse Datenmengen analysieren und häufig sogar bedrohliche Szenarien dank raffinierten Simulationen entschärfen. Sie sind das Fachpersonal, wenn es darum geht, den Maschinen etwas beizubringen – für Wirtschaft, Forschung und unsere Zukunftsgesellschaft.


Möchten Sie mehr über den Beruf als Data Scientist erfahren? Oder interessieren Sie sich für ein Studium in Computational and Data Science?


Mehr darüber finden Sie unter fhgr.ch/cds oder Sie können sich direkt per WhatsApp beraten lassen.


Wie Studierende den Studiengang erleben – Video: Benito erzählt vom Studium  


Autoren