reciprocal_smallest_distance

Screenshot der Software:
reciprocal_smallest_distance
Softwarebeschreibung:
Version: 1.1.5
Upload-Datum: 20 Feb 15
Lizenz: Frei
Popularität: 42

Rating: 3.5/5 (Total Votes: 2)

reciprocal_smallest_distance ist eine paarweise Orthologie-Algorithmus, der globale Sequenzanordnung und Maximum-Likelihood-evolutionäre Distanz zwischen Sequenzen genau Orthologe zwischen Genomen erkennt verwendet.
Installation von einem Tarball
Downloaden und entpacken Sie die neueste Version von Github:
cd ~
curl -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar XVZ
Installieren reciprocal_smallest_distance, achten Sie darauf, Python 2.7 verwenden:
cd reciprocal_smallest_distance-VERSION
python setup.py install
Mit RSD zu Othologs finden
Die folgende Beispiel-Befehle zeigen die wichtigsten Möglichkeiten, um rsd_search laufen. Jeder Aufruf von rsd_search erfordert, die den Ort einer FASTA-Format Sequenzdatei für zwei Genome, die so genannte Abfrage und unterliegen Genome. Ihre Reihenfolge ist beliebig, aber wenn Sie die Möglichkeit --ids verwenden, müssen die IDs aus der Abfrage Genom kommen. Sie müssen auch eine Datei an, die Ergebnisse der Orthologen von der RSD-Algorithmus gefunden zu schreiben. Das Format der Ausgabe-Datei enthält ein Ortholog pro Zeile. Jede Zeile enthält die Abfragesequenz id vorbehaltlich Sequenz-ID und Abstand (von codeml berechnet) zwischen den Sequenzen. Optional können Sie eine Datei, die IDs mit der Option --ids. Dann rsd werden nur für Orthologe für diese IDs zu suchen. Mit --divergence und --evalue, haben Sie die Möglichkeit, mit verschiedenen Schwellenwerten von den Standardeinstellungen.
Holen Sie sich Hilfe, wie man rsd_search, rsd_blast oder rsd_format ausführen:
rsd_search -h
rsd_blast -h
rsd_format -h
Suche Orthologe zwischen allen Sequenzen in den Abfrage- und unterliegen Genome, unter Verwendung der Standard Divergenz und evalue Schwellen
rsd_search -q Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genom = Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Suche Orthologe mit mehreren Nicht-Standard-Divergenz und evalue Schwellen
rsd_search -q Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genom = Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Es ist nicht notwendig, um eine FASTA-Datei für BLAST formatieren oder zu berechnen BLAST trifft, weil rsd_search erledigt das für Sie.
Allerdings, wenn Sie auf Lauf rsd_search mehrfach für den gleichen Genomen, insbesondere für große Genome zu planen, können Sie Zeit, indem Sie rsd_format die FASTA-Dateien und rsd_blast um Vorausberechnung der BLAST trifft Vorformatierung zu speichern. Bei der Ausführung rsd_blast, stellen Sie sicher, eine --evalue so groß wie die größte evalue Schwelle Sie beabsichtigen, rsd_search zu geben verwenden.
Hier ist, wie ein Paar FASTA-Dateien im Ort zu formatieren:
rsd_format -g Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Und hier ist, wie man die FASTA-Dateien formatieren, indem die Ergebnisse in einem anderen Verzeichnis (das aktuelle Verzeichnis in diesem Fall)
rsd_format -g Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Hier ist, wie man vorwärts und rückwärts zu berechnen Explosion Hits (standard-evalue):
rsd_blast -v -q Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genom = Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-Hits q_s.hits --reverse-Hits s_q.hits
Hier ist, wie man vorwärts und rückwärts zu berechnen Explosion Hits für rsd_search mit Genomen, die bereits für den Hoch formatiert wurden und die eine nicht standardmäßige evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-Genom = Mycobacterium_leprae.aa
--forward-Hits q_s.hits --reverse-Hits s_q.hits
--no-Format --evalue 0,1
Finden Orthologe zwischen allen Sequenzen in der Abfrage und unter Genome mit Genomen, die bereits für Hoch formatiert wurden
rsd_search -q Mycoplasma_genitalium.aa
--subject-Genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-Format
Suche Orthologe zwischen allen Sequenzen in der Abfrage und vorbehaltlich Genome mit Hits, die bereits ermittelt worden wäre. Beachten Sie, dass --no-Format enthalten ist, weil da die Explosion Hits wurden bereits berechnet die Genome müssen nicht für den Hoch formatiert werden.
rsd_search -v --query-Genom Mycoplasma_genitalium.aa
--subject-Genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-Hits q_s.hits --reverse-Hits s_q.hits --no-Format
Suche Orthologe für spezifische Sequenzen in der Abfrage-Genoms. Zum Auffinden Orthologe nur für ein paar Sequenzen, mit --no-Explosion-Cache können Sie schneller Berechnung. YMMV.
rsd_search -q Beispiele / Genomen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genom = Beispiele / Genomen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Beispiele / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids Beispiele / Mycoplasma_genitalium.aa.ids.txt --no-Explosion-Cache
Ausgabeformate
Orthologe können in verschiedenen Formaten unter Verwendung der --outfmt Möglichkeit rsd_search gespeichert. Das Standardformat, --outfmt -1, bezieht sich auf --outfmt 3. Inspiriert von Uniprot dat-Dateien, eine Reihe von Orthologen beginnt mit einem Parameter Linie, dann ist 0 oder mehr Zeilen Ortholog, hat dann ein Ende Linie. Die parametes sind die Abfrage Genom Namen, den Betreff Genom Namen, Divergenzschwelle und evalue Schwelle. Jedes Ortholog ist in einer einzigen Zeile Auflistung der Abfragesequenz id, das Thema Sequenz-ID und die Maximum-Likelihood-Schätzung Abstand. Dieses Format kann Orthologe für mehrere Parametersätze in einer einzigen Datei, sowie Sätze von Parametern ohne Orthologe darstellen. Daher eignet es sich für die Verwendung mit rsd_search Wenn man mehrere Divergenz und evalue Schwellenwerte.
Hier ist ein Beispiel, das 2 Parameterkombinationen, von denen eine keine Orthologe hat:
PA tLACJO tYEAS7 t0,2 T1E-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0,2 T1E-15
//
Das Originalformat von RSD, --outfmt 1 wird für die Abwärtskompatibilität zur Verfügung gestellt. Jede Zeile enthält ein Ortholog, als Subjekt-Sequenz-ID, Query-Sequenz-ID und Maximum-Likelihood-Schätzung Abstand vertreten. Es kann nur einen einzigen Satz von Orthologen stellen in einer Datei.
Beispiel:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Auch der Abwärtskompatibilität ist ein Format intern von Roundup verwendet (http://roundup.hms.harvard.edu/), die wie das Original RSD-Format ist, mit Ausnahme der Spalte id Abfragesequenz vor dem Subjekt-Sequenz-ID.
Beispiel:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Anforderungen :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2,04

Ähnliche Software

AREM
AREM

11 May 15

checkmyclones
checkmyclones

11 May 15

pyNetConv
pyNetConv

3 Jun 15

Kommentare zu reciprocal_smallest_distance

Kommentare nicht gefunden
Kommentar hinzufügen
Schalten Sie auf die Bilder!