Forschung
Algorithmische Aspekte der Bioinformatik und Züchtungsinformatik in Pflanzen- und Tierzucht
Das Forschungsgebiet der Züchtungsinformatik ist die Schnittstelle zwischen klassischer Züchtungsforschung und Konzepten der Informatik. Hierbei werden die Konzepte in theoretischer und praktischer Sichtweise komibiniert und große Mengen von Daten (Big Data) sowohl aus der Tierzucht als auch aus der Pflanzenzüchtung genutzt.Unsere Forschungsfelder:
- regulatorische SNPs
- genetische Ursachen für Tierkrankheiten wie z.B. Trypanosomiasis
- Verbesserung von Methoden zur genomischen Vorhersage
- Anwendung von Methoden der KI zur Analyse von Tierverhalten
- Analyse von Multi-Omics Daten (Genomics, Transcriptomics, Proteomics, Metabolomics)
Forschungsprojekte
GlasSchweinTransparenz und Qualitätsoptimierung in der Wertschöpfungskette Schwein
Das Projekt fokussiert sich auf die qualitative und nachhaltige Steuerung der Wertschöpfungskette Schwein – von der züchterischen Selektion über den landwirtschaftlichen Betrieb bis zur Schlachtung. Durch die Implementierung einer lückenlosen UHF-RFID-Technik und die Vernetzung bestehender Datensysteme auf einer zentralen Plattform wird ein transparenter Informationsfluss zwischen allen Akteuren etabliert. Ein wesentlicher Schwerpunkt liegt auf der Erhebung physikalischer Parameter wie dem intramuskulären Fettanteil (IMF), um eine datengestützte Optimierung der Fleischqualität zu ermöglichen und die Interoperabilität innerhalb der gesamten Kette zu maximieren.
- Projektlaufzeit: 15.11.2024 - 14.11.2027
- Gefördert durch: BLE
Stabilitätsoptimierung von Random Forest Vorhersagemodellen durch Bestimmung der optimalen Anzahl an Entscheidungsbäumen
Random Forest is eine weit bekannte Methode aus dem Bereich maschinelles Lernen für Vorhersagen und Entscheidungen, die auf Vorhersagen beruhen. Während Random Forests viele Vorteile bieten, wird oft übersehen, dass es sich hierbei um ein nicht-deterministisches Vorhersagemodell handelt. Das bedeutet, dass verschiedene Vorhersagemodelle und somit auch verschiedene Vorhersagen erstellt und Entscheidungen getroffen werden können obwohl die Trainingsdaten gleich bleiben. Das R Paket optRF modelliert die nicht-lineare Beziehung zwischen der Anzahl an Entscheidungsbäumen im Random Forest Modell und der Vorhersagestabilität und nutzt diese Beziehung, um die optimale Anzahl an Entscheidungsbäumen für einen bestimmten Datensatz festzustellen.
Datenbanken regulatorischer SNPs bei Nutztieren und Nutzpflanzen
Das Projekt fokussiert sich auf die Identifizierung und funktionelle Annotation regulatorischer Einzelnukleotid-Polymorphismen (rSNP, engl. regulatory single nucleotide polymorphism) in den Promotorregionen von landwirtschaftlich relevanten Tier- und Pflanzenarten. Mittels eines standardisierten bioinformatischen Workflows quantifizieren die Datenbanken den Einfluss von SNPs auf die Bindungsaffinität von Transkriptionsfaktoren. Durch die Kategorisierung von SNP-Effekten in Gewinn, Verlust oder Score-Änderungen von Bindungsstellen bieten agReg-SNPdb und agReg-SNPdb-Plants umfassende Ressourcen zur Untersuchung molekularer Kausalitäten komplexer Merkmale und Krankheiten bei Nutztieren und -pflanzen.