AREM wird ein (für ChIP-Seq Daten Model Based Analysis) basierend auf MACS.
Hochdurchsatz-Sequenzierung an Chromatin Immunniederschlag (ChIP-Seq) gekoppelt ist weit verbreitet in der Charakterisierung von genomweiten Bindungsmuster von Transkriptionsfaktoren, Cofaktoren, Chromatin-Modifikatoren und andere DNA-bindende Proteine verwendet. Ein wichtiger Schritt in ChIP-Seq Datenanalyse ist es, zu einem Referenz Genoms kurze liest aus Hochdurchsatz-Sequenzierung und identifizieren Spitzenregionen mit kurzen liest bereichert.
Obwohl verschiedene Verfahren für die Chip-Seq-Analyse vorgeschlagen, nur die meisten bestehenden Methoden betrachten liest, dass eindeutig in der Referenzgenoms gesetzt werden, und haben daher geringer Stromspitzen zum Erkennen LO- im Wiederholungssequenzen Cated. Hier stellen wir eine probabilistische Ansatz für ChIP-Seq Daten-Analyse, die alle verwendet liest, die eine wirklich genomweite Ansicht der Bindungsmuster.
Lesevorgänge werden mit einem Gemisch Modell entsprechend angereicherten Regionen und ein Null-genomischen Hintergrund K modelliert. Wir verwenden Maximum-Likelihood, um die Positionen der angereicherten Regionen zu schätzen, und Umsetzung eines Erwartungsmaximierung (EM) Al- gorithmus, genannt AREM, zu aktualisieren die Ausrichtungswahrscheinlichkeiten jeweils unterschiedlichen genomischen Stellen zu lesen.
Weitere Informationen finden Sie in unserem Papier in RECOMB 2011 oder besuchen Sie unsere Website: http://cbcl.ics.uci.edu/AREM
AREM basiert auf dem populären MACS Spitzen Anrufer basiert, wie im Folgenden beschrieben:
Mit der Verbesserung der Sequenzierungstechniken, gefolgt Chromatinimmunpräzipitation von Hochdurchsatz-Sequenzierung (ChIP-Seq) wird immer beliebter, um genomweite DNA-Protein-Wechselwirkungen zu untersuchen. Um den Mangel an leistungsfähigen ChIP-Seq-Analyseverfahren anzugehen, stellen wir eine neue Algorithmus, mit dem Namen Modellbasierte Analyse von ChIP-Seq (MACS) zur Identifizierung Transkript Faktor-Bindungsstellen.
MACS erfasst den Einfluß Genom Komplexität, um die Signifikanz von angereichertem Chipbereiche auswerten und MACS verbessert die räumliche Auflösung der Bindungsstellen durch Kombination der Information von sowohl Sequenzierung tag Position und Orientierung. . MACS kann leicht für ChIP-Seq Daten allein verwendet werden, oder mit der Kontrollprobe mit der Erhöhung der Spezifität
Anforderungen :
- Python
Kommentare nicht gefunden