/Google veröffentlicht KI-Werkzeug für Interpretation von Sequenzierungsdaten

Google veröffentlicht KI-Werkzeug für Interpretation von Sequenzierungsdaten

Google veröffentlicht KI-Werkzeug für Interpretation von Sequenzierungsdaten


Sascha Mattke

(Bild: “Genome” / Jeremy Keith / cc-by-2.0)

Die grobe Sequenzierung von DNA ist heutzutage relativ schnell und preisgünstig. Allerdings sind die Ergebnisse wegen ihrer Ungenauigkeit schwierig zu interpretieren. Hier soll jetzt Künstliche Intelligenz helfen.

Zwei Teams des Google-Konzerns Alphabet haben ein neues Software-Werkzeug entwickelt, das mit Techniken aus dem Bereich künstlicher Intelligenz (KI) dabei hilft, auf der Grundlage von groben Sequenzierungsdaten ein genaueres Bild des Genoms von Menschen zu erstellen. Die Software mit dem Namen Deep Variant soll automatisch kleine Insertions- und Deletionsmutationen sowie Mutationen in einzelnen Basen-Paaren identifizieren. Das berichtet Technology Review online in „Genome googeln“.

Etwa seit dem Jahr 2000 haben sich Maschinen verbreitet, die mit hohem Durchsatz Genome sequenzieren, was diese Technologie für mehr Anwendungen verfügbar gemacht hat. Allerdings liefern diese Systeme nur begrenzte, fehlerträchtige Schnappschüsse vom Genom. Dadurch fällt es Wissenschaftlern oft schwer, kleine Mutationen von zufälligen Fehlern zu unterscheiden, die beim Sequenzierungsprozess entstehen, vor allem in wiederholten Teilen des Genoms. Diese Mutationen können direkt mit Krankheiten wie Krebs zusammenhängen, was die Erforschung von genetischen Ursachen und die Entwicklung von Medikamenten erschwert.

DeepVariant wurde von Forschern im Team Google Brain entwickelt, das sich mit Entwicklung und Anwendung von KI beschäftigt. Ebenfalls beteiligt waren Forscher von Verily, einer weiteren Alphabet-Tochter, die sich auf Life Sciences konzentriert. Zusammen arbeiteten sie mit Millionen von Hochdurchsatz-Sequenzierungsergebnissen und vollständig sequenzierten Genomen aus dem Projekt Genome in a Bottle (GIAB). Diese Daten speisten sie dann in ein Deep-Learning-System ein und veränderten die Parameter des Modells immer weiter, bis es gelernt hatte, sequenzierte Daten mit hohem Genauigkeitsgrad zu interpretieren.

Mehr dazu bei Technology Review online:

(sma)