So konvertieren Sie eine TXT-Datei in FASTA

Klinische Studien werden durchgeführt, um Proteinsequenzdaten zu analysieren und Behandlungsmöglichkeiten für Krankheiten zu finden. Proteinsequenzdaten werden im FASTA-Format (fast-all) abgelegt, damit Softwareprogramme verstehen, wie die Datensequenz zu verarbeiten ist. Das FASTA-Format hat bis zu 80 Zeichen pro Sequenzdatenzeile und verwendet den Codestandard IUB/IUPAC (International Union of Biochemistry/International Union of Pure and Applied Chemistry). Das Konvertieren einer TXT-Datei (einfacher Text) in das FASTA-Format umfasst das Bearbeiten oder Hinzufügen von FASTA-formatierten Sequenzdaten zu einer vorhandenen Textdatei mit Proteinsequenzdatenzeilen. Texteditorprogramme wie Notepad machen dies einfach.

Öffnen Sie die Proteinsequenz-Textdatei, die Sie bearbeiten möchten, in einem Textbearbeitungsprogramm wie Notepad.

Bearbeiten oder fügen Sie die Beschreibungszeile hinzu, um dem FASTA-Format zu folgen. Zum Beispiel ist >gi|129295|sp|P01013|OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) eine gültige FASTA-Beschreibungszeile. Diese Zeile liefert eine eindeutige Beschreibung für die folgenden Sequenzdatenzeilen. Das FASTA-Format erfordert die Verwendung des Größer-als-Symbols (>), damit das Softwareprogramm die eindeutigen beschreibenden Informationen identifizieren und die Verarbeitung der Beschreibung als Proteindatensequenzzeile vermeiden kann.

Drücken Sie die "Enter"-Taste, um einen Zeilenumbruch einzufügen, nachdem die Beschreibungszeile bearbeitet wurde.

Bearbeiten oder fügen Sie das Zeilenformat der Proteinsequenzdaten hinzu, um den IUB/IUPAC-Standardcodes zu entsprechen. Der IUB/IUPAC-Standard verwendet die Buchstaben des Alphabets, um akzeptable Codes darzustellen oder Sequenzen für Aminosäuren oder Nukleinsäuren im FASTA-Format abzufragen. QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE stellt beispielsweise eine Zeile gültiger Sequenzdaten dar, da sie mit dem Buchstaben „Q“ für Glutamin beginnt und mit dem Buchstaben „E“ für Glutamat endet.

Fügen Sie nach Bedarf weitere Sequenzdatenzeilen hinzu, bearbeiten Sie vorhandene Sequenzdatenzeilen oder fügen Sie nach 80 Zeichen Zeilenumbrüche hinzu. Die Einhaltung der Zeilenstandards und Zeilenumbrüche der FASTA-Sequenzdaten stellt sicher, dass das Programm die Anweisungen für Glutamin, Glutamat und andere Buchstabencodes befolgt. Die Buchstaben im IUB/IUPAC-Standard sind lediglich Anweisungen an das Softwareprogramm, das FASTA-formatierte Daten verarbeitet.

Klicken Sie auf "Datei", wählen Sie "Speichern" und klicken Sie dann auf die Schaltfläche "Speichern". Ihre TXT-Datei hat jetzt das FASTA-Format.