Tan pronto como se desarrollaron las técnicas de secuenciación de proteínas Sanger (1952) y se empezaron a almacenar las primeras secuencias, se hizo patente la necesidad de compararlas. Para ello se decidió alinearlas, como se muestra en la figura 1.7, asignando una letra a cada residuo según su cadena lateral. Los alineamientos de secuencias de proteínas han tenido desde entonces muchas aplicaciones, de las que destaco estas:
![]() |
Como sugiere la figura 1.7 los algoritmos de alineamiento necesitan tener
métricas bien definidas para puntuar tuplas de resíduos emparejados y deben ser capaces de introducir
huecos e inserciones en las secuencias.
En los alineamientos de secuencia estas métricas suelen basarse en propiedades bioquímicas y evolutivas
de los residuos, recogidas por ejemplo en matrices de substitución como las matrices BLOSUM
(Henikoff & Henikoff, 1992). Para poder alinear secuencias más divergentes se suelen añadir además otras fuentes
de información secuencial, normalmente predicciones de estructura secundaria o de accesibilidad al
solvente.
Para alineamientos estructurales las métricas suelen tener criterios geométricos, combinados a veces
con criterios utilizados en los alineamientos de secuencia.