optRF

Optimierung von Random Forest (optRF)

Das Projekt

Random Forest is eine weit bekannte Methode aus dem Bereich maschinelles Lernen für Vorhersagen und Entscheidungen, die auf Vorhersagen beruhen. Während Random Forests viele Vorteile bieten, wird oft übersehen, dass es sich hierbei um ein nicht-deterministisches Vorhersagemodell handelt. Das bedeutet, dass verschiedene Vorhersagemodelle und somit auch verschiedene Vorhersagen erstellt und Entscheidungen getroffen werden können obwohl die Trainingsdaten gleich bleiben. Das R Paket optRF modelliert die nicht-lineare Beziehung zwischen der Anzahl an Entscheidungsbäumen im Random Forest Modell und der Vorhersagestabilität und nutzt diese Beziehung, um die optimale Anzahl an Entscheidungsbäumen für einen bestimmten Datensatz festzustellen.

Software

Das R-Paket optRF ist Open-Source verfügbar und bietet Werkzeuge zur automatisierten Stabilitätsoptimierung. Es kann in R installiert werden über:
> install.packages("optRF")
> library("optRF")
> ?opt_prediction
Weiterführende Informationen zur Software finden Sie unter:

Publikationen

Die methodischen Grundlagen sowie eine anwendungsorientierte Einführung in die Problematik des Nicht-Determinismus und die Funktionsweise des Pakets finden Sie hier:
  • Link zu der Originalpublikation: optRF: Optimising random forest stability by determining the optimal number of trees. BMC Bioinformatics (2025). DOI: 10.1186/s12859-025-06097-1
  • Link zu dem Blogbeitrag: How to Set the Number of Trees in Random Forest - A practical introduction to the optRF package, towardsdatascience.com

Vorträge und Präsentationen

Präsentationsfolien zu ausgewählten Vorträgen zu dem Forschungsprojekt finden Sie hier:
  • Präsentation von optRF für allgemeine Anwendungen in der Biometrie, vorgetragen auf der 6. Central European Network (CEN) Konferenz "Power of Data – Shaping the Future of Life Sciences" 2026 in Warschau (Polen)
    Präsentationsfolien
  • Präsentation von optRF für die spezifische Anwendung in der genomischen Selektion in der Weizenzüchtung, vorgetragen auf der 8. Konferenz zu Getreidezüchtung und Biotechnologie (CBB) 2025 in Budapest (Ungarn)
    Präsentationsfolien