• Die Zukunft mitgestalten

    Die Hector Fellow Academy stößt innovative Forschungsprojekte in neuen wissenschaftlichen Fragestellungen an.

High-throughput Virus Discovery in Next Generation Sequencing Data

Franziska Hameister - Hector Fellow Ralf Bartenschlager

Anelloviren sind eine weitverbreitete Virusfamilie, welche Menschen und Wirbeltiere infizieren. Ihre Rolle in der Entstehung von Krankheiten ist noch unklar. Wir nehmen an, dass während lebenslanger, andauernder Infektion ein Ungleichgewicht in der viralen Population die Entwicklung und das Voranschreiten von Krankheiten begünstigen kann. Unser Ziel ist eine umfassende Beschreibung des viralen Spektrums in gesunden und erkrankten Geweben mittels highthroughput Screening von Sequenzierdaten und die damit verbundene Identifizierung von Virusarten mit hohem pathogenem Potential.

Anelloviren sind eine diverse Gruppe nicht-umhüllter Viren mit zirkulärem erstrangigem DNA-Genom zwischen 2.8-3.8 kb. Sie sind weitverbreitet in Menschen und anderen Wirbeltieren. Häufig treten mehrere Subtypen gleichzeitig in demselben Gewebe auf, wo sie persistente Infektionen hervorrufen können. Bisher ist ihre Rolle in der Entstehung von menschlichen Krankheiten, wie beispielsweise Krebs und Autoimmunerkrankungen, noch unklar. Auch, wenn sie in vielen Fällen über Jahre hinweg keine Schäden verursachen, vermuten wir, dass Schwankungen in der viralen Population zum Entstehen und Fortschreiten von Krankheiten führen können.

Wir haben ein leistungsstarkes Computerprogramm bestehend aus zwei Modulen entwickelt. Das Erste heißt „virushunter“ und ermöglicht es virale Sequenzen in unverarbeiteten Next Generation Sequencing (NGS) Daten zu detektieren. Das Zweite, der „virusgatherer“, assembliert komplette virale Genome. Somit sind wir in der Lage in verschiedenen Geweben und Krankheitsbildern neue Virusspezies zu entdecken, welche nur sehr fern mit bisher bekannten Viren verwandt sind.

Mit dem Ziel einer umfassenden Beschreibung des Spektrums humaner Anelloviren durchsuchen wir systematisch NGS Daten von erkrankten und gesunden Geweben. Anschließend werden wir Computer- und Laboranalysen durchführen um i) Krankheitsassoziationen von identifizierten Virusspezies und Untergruppen, ii) das Auftreten von Onkogenen und iii) epidemiologische Aspekte hinsichtlich viraler Verbreitung und das damit zusammenhängende Risiko bestimmter Erkrankungen zu bestimmen.