Cómo extraer los comentarios de múltiples Fasta

FASTA es un formato basado en texto usado en bioinformática para la representación de secuencias , especialmente los de nucleótidos y péptidos , con pares de bases representada por una sola letra . Una secuencia FASTA consiste en una descripción de una sola línea , que se distingue por una " mayor que" símbolo en la primera línea, seguido por una secuencia de nucleótidos o péptido de varias líneas. Puede extraer múltiples secuencias de un archivo FASTA utilizando módulos especiales o add- ons para el lenguaje de programación Perl , conocido como BioPerl , que han sido especialmente desarrollados para manejar el formato FASTA . Usted puede también codificar manualmente un script de Perl para que coincida con los patrones en un archivo o utilizar otras herramientas disponibles para extraer secuencias FASTA . Cosas que necesitará
FASTA archivo
Perl editor
BioPerl
ActiveState Perl
Biopieces
Mostrar más instrucciones
1

Inicie el Perl aplicación de edición . Usted puede usar un simple editor de texto , como el Bloc de notas . Tendrá que guardar el archivo con la extensión " . Pl" para indicar que se trata de un programa de Perl.
2

Extracto de una secuencia de un archivo de múltiples FASTA mediante la realización de patrones en Perl, escribiendo el siguiente código en el editor:

# /usr /bin /perlmy $ fasta_seq = cambio , mi $ sequence = cambio , mi archivo de trabajo $ = ` cat $ fasta_seq ` , my ($ fasta_seq ) = ! $ archivo de trabajo = ~ /( > $ secuencia [ ^ >] +) /s ; print $ fasta_seq ;
3

Extracto de las secuencias desde el archivo FASTA utilizando BioPerl . Puede extraer múltiples secuencias escribiendo el siguiente código en el editor:

# /bin /perl- w

uso Bio :: SeqIO ;

$ sequenceobject = Bio ! :: SeqIO - > new ( -file = > " fasta_file_path " , - format = > " fASTA ");

Bio :: SeqIO módulo proporciona la secuencia de procesamiento sin problemas. Puede recuperar una sola secuencia con la siguiente declaración:

$ retrievedsequence = $ sequenceobject -> next_seq ;

Usted puede recorrer el objeto y recuperar varias secuencias , de la siguiente manera :

while ($ retrievedsequence = $ sequenceobject -> next_seq ) { print $ retrievedsequence -> ss , "\\ n ";}
4

Extracto de las secuencias desde el archivo FASTA utilizando el aplicación " Biopieces ", que es el marco que contiene un conjunto de herramientas modulares para la manipulación de datos de bioinformática. Ejecuta el comando de Biopieces en la línea de comandos

read_fasta -i fasta_file