MetagenomeDB ist eine Python-Bibliothek entwickelt, um einfach zu speichern, abzurufen und mit Anmerkungen versehen Metagenom-Sequenzen. & Nbsp; MetagenomeDB wirken als eine Abstraktionsschicht auf einem MongoDB-Datenbank. Es bietet eine API, um zwei Arten von Objekten, nämlich Sequenzen und Sammlungen zu erstellen und zu ändern, und schließen:
& Nbsp; * Sequenzen (Sequenz-Klasse) können liest, Contigs, PCR-Klonen usw.
& Nbsp; * Sammlungen (Collection-Klasse) stellt Sätze von Sequenzen; zB liest aus der Sequenzierung einer Probe ergeben, Contigs aus einer Menge von liest, PCR-Bibliothek zusammengebaut
Jedes Objekt kann mit einem Wörterbuch-ähnliche Syntax annotiert werden:
# Zuerst importieren wir die Bibliothek
Import MetagenomeDB als mdb
# Sie dann eine neue Sequence-Objekt mit zwei schaffen wir
# (Obligatorisch) Eigenschaften "Name" und "Sequenz"
s = mdb.Sequence ({"name": "My-Sequenz", "Sequenz": "ATGC"})
# Das Objekt kann jetzt kommentiert werden
Druck s ["Länge"]
s ["type"] = "lesen"
# Einmal geändert, müssen das Objekt gebunden werden
# In der Datenbank für die Änderungen bleiben
s.commit ()
Objekte vom Typ Sequenz oder Abholung können miteinander, um verschiedene Metagenom-Datensätze stellen angeschlossen werden. Beispiele umfassen, sind aber nicht beschränkt auf:
& Nbsp; * Sammlung liest aus einer Sequenzierungslauf resultierende (Beziehung zwischen mehreren Sequence-Objekte und eine Collection)
& Nbsp; * Satz von Contigs aus der Anordnung eines Satzes von resultierenden liest (Beziehung zwischen zwei Objekten Sammlung)
& Nbsp; * liest, die Teil einer Fläche zu stehen (Zusammenhang zwischen mehreren Sequence-Objekte und eine Sequence)
& Nbsp; * Folge, die ähnlich zu einer anderen Sequenz ist (Beziehung zwischen zwei Sequence-Objekte)
& Nbsp; * Sammlung, die Teil einer größeren Sammlung ist (Beziehung zwischen zwei Objekten Sammlung)
Das Ergebnis ist ein Netzwerk von Sequenzen und Sammlung, die über dedizierte Methoden untersucht werden kann; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Jede dieser Methoden erlauben für anspruchsvolle Filter zu MongoDB Abfrage-Syntax:
# Liste alle Sammlungen des Typs 'collection_of_reads'
# Die Sequenz "s" gehören
Sammlungen s.list_collections = ({"type": "collection_of_reads"})
# Liste alle Sequenzen, die auch gehören zu diesen Sammlungen
# Mit einer Länge von mindestens 50 bp
für c in einer Sammlung:
& Nbsp; Druck c.list_sequences ({"Länge": {"$ gt": 50}})
MetagenomeDB bietet auch eine Reihe von Kommandozeilen-Tools, um Nukleotidsequenzen zu importieren, Proteinsequenzen, BLAST und FASTA Alignment-Algorithmen Ausgang und ACE Baugruppendateien. . Weitere Werkzeuge sind vorgesehen, um mehrere Objekte hinzuzufügen oder zu entfernen, oder um sie mit Anmerkungen zu versehen
Anforderungen :
- Python
Kommentare nicht gefunden