
ERGEBNISSE KAPITEL 3
0
100
200
300
400
500
600
700
800
900
1000
0 5.000 10.000 15.000 20.000
Anzahl der Sequenzläufe
Sequenzlücken
Abb. 3.23: Verlauf der Rohsequenzierungsphase und Vorhersage nach Lander & Water-
man (1988). Schwarz Linie, Vorhersage der Sequenzlücken in Abhängigkeit von der Anzahl der
Sequenzläufe nach Lander-Waterman; rote Punkte, tatsächliche Anzahl der Sequenzlücken; ro-
te Linie, Interpolation.
3.II.1.3 Editierung des Rohdatensatzes
Während der ersten Editierung, die von Dr. A. Henne (Göttingen Genomics Laboratory)
durchgeführt wurde, konnte von der hohen Abdeckung (8.34) des Genoms durch Se-
quenzläufe von sehr guter Qualität und hoher Durchschnittslänge (737 bp) profitiert
werden. Vor Beginn der Editierung wurden mit der
Gap4-Funktion Find Internal Joins
alle Contig-Enden miteinander a/jointfilesconvert/333809/bgeglichen und bereits einige Sequenzlücken geschlos-
sen. Während der Editierung wurden problematische Bereiche durch Wiederholung ein-
zelner Sequenzläufe und durch Primerwalkings auf Plasmid-Inserts a/jointfilesconvert/333809/bgesichert. An den
Enden der Contigs wurden hierzu spezifische Primer a/jointfilesconvert/333809/bgeleitet, um durch Walkings auf
Plasmidbrücken verbliebene Sequenzlücken zu schließen (siehe 2.11.1).
Parallel dazu wurden auffällige Fehlassemblierungen aufgelöst bzw. zur späteren
Bearbeitung markiert (rRNA-Operons; siehe 3.II.1.5). Auf diese Weise konnte die Zu-
92
Komentáře k této Příručce