Comment convertir un fichier TXT en FASTA
Étape 1
Ouvrez le fichier texte avec la séquence de protéines que vous souhaitez modifier dans un programme d'édition de texte tel que le Bloc-notes.
Étape 2
Modifiez ou ajoutez la ligne de description pour suivre le format FASTA. Par exemple, > gi | 129295 | sp | P01013 | PROTEINE GENE X DU GENE X OVAX_CHICK (RELATIVE A L'OBVALEUR) est une ligne de description FASTA valide. Cette ligne fournit une description unique pour la séquence de données qui suit. Le format FASTA nécessite l’utilisation du symbole supérieur à (>) afin que le programme puisse identifier les informations descriptives uniques et éviter de traiter la description comme une ligne de données de séquence protéique.
Étape 3
Appuyez sur "Entrée" pour insérer un saut de ligne une fois que vous avez modifié la ligne de description.
Étape 4
Modifiez ou ajoutez le format de la ligne de données de séquence de protéines pour vous conformer aux codes IUB / IUPAC standard. La norme IUB / IUPAC utilise des lettres de l’alphabet pour représenter les codes acceptables ou les séquences d’interrogation pour les acides aminés ou les acides nucléiques au format FASTA. Par exemple, QIKDLLVSSSTDLDTTLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMNNSFNVATLPAE représente une ligne de séquence de données valide car elle commence par la lettre "Q", représentant la glutamine, et se termine par la lettre "E", qui représente glutamate.
Étape 5
Ajoutez d'autres lignes de séquences de données, modifiez celles qui existent ou ajoutez des sauts de ligne après 80 caractères, si nécessaire. L'ajout de normes de ligne et de sauts de ligne au flux de données FASTA garantit que le programme respecte les instructions relatives à la glutamine, au glutamate et à d'autres codes de lettre. Les lettres de la norme IUB / IUPAC sont simplement des instructions pour le programme qui traite les données au format FASTA.
Étape 6
Cliquez sur "Fichier", sélectionnez et cliquez sur le bouton "Enregistrer". Votre fichier TXT est déjà au format FASTA.