A partir de ahora empieza la parte práctica del curso, donde empezaréis a trabajar directamente con secuencias de proteínas, en concreto con dos proteínas extraídas del proyecto de secuenciación del plásmido de simbiosis pSymb de Rhizobium etli, que pertenecen al operón yp086_htrA:
>htrA
MFPLTRINAL CLRYTKASSS RRPPTTGGAS ARRSEMSRSL LALAALFIAG ESLLSAPAVA DSLSLAPMLQ RVVPSVVSIS
VQGRELDDAD ATLADPFYRK FFGLPDDAAP AEHSFQSAGS GVVIDEVHGY IVTNQHVIAS ASKIEVALSD GRRFQAKLVG
ADPETDVAVV QIPPDHLVQA EFGSASSLHV GDVVVAIGNP FGLGQTATMG IVSALGRRAV GSEGYEGFIQ TDASTNPGNS
GGALVSEDGV VVGINSAIIG PAGGSIGIGF AVPAETVGIV MRQLILTGKL VRGEVGILTQ DLTPGLAKAF GIDEGAGALV
SEVLPGSPAA NAGIQPGDVI RMVDGRTVRG ASDVRRLVGS LPLQSKPSFQ IDRASRRIEA FPVVSDAPVA EPAAPRTIHI
GRGPLADAEM ANSPDGPGAR VVVVAEGSVA AQAGLQPDDV IVALDQQPVT DVGQLLSILV KEHARALITV VRNGHRLFVA
ADVQTQ
>yp086
MAGPYLRALR ILPRGSREPV QRSWLHGYTI DGGFAAHAAA EAGYAFELPE DADPVATAPL LCAGLIGWQS LKMAGEGRTI
GIYGFGAAAH ILVQVCKHRG QSVYAFVLPG DEAGRKFTLD LGAVWAGFSG EKPPVPLDAA IIFAPAGELV PMALDVVRKG
GTVVCGGIDM SDIPSMPYRL LWGERRVVSV ANLTRSDGAE FFSIGKAAGV RCFTSVYPLE HANEALDDLR AGRVSGAAVI
VP
La primera tarea que debéis realizar es guardar estas dos secuencias, incluyendo las cabeceras, en dos archivos de texto, para poder utilizarlas más adelante. Podeís llamar a los archivos htrA.fas y yp086.fas, puesto que están en un formato llamado FASTA, por el programa del mismo nombre para hacer búsquedas de secuencias.