Validation d'une application du co-processeur VLSI Rapid 2 au calcul de similarité pour la comparaison de deux séquences d'acides aminés

J. PennE

IBP-Masi 1995/20: Rapport de Recherche Masi / Masi research reports
20 pages - Juin/June 1995 - French document.

PostScript : Ko /Kb

Titre / Title: Validation d'une application du co-processeur VLSI Rapid 2 au calcul de similarité pour la comparaison de deux séquences d'acides aminés


Résumé : La carte co-processeur Rapid 2, en cours de développement au laboratoire, est une mémoire set-associative et paginée qui peut fonctionner comme un réseau systolique linéaire. Dans de précédentes publications, nous avons montré comment une telle architecture peut être utilisée pour accélérer le calcul de la similarité locale de séquences biologiques. Nous présentons ici une application réalisant l'algorithme exact de Smith et Waterman de calcul du meilleur score local, dans la comparaison de deux séquences d'acides aminés (l'implantation, développée sous forme de microcode pour la carte Rapid 2, correspond à l'algorithme séquentiel utilisé dans le programme ssearch du package FASTA, version 1.7). Nous présentons également le logiciel C++ qui permet de piloter la carte pour cette application particulière, et qui assure le mouvement et les conversions de données entre le disque du processeur hôte et la carte co-processeur. La simulation "cycle par cycle" de cet ensemble programme/microprogramme, a été testée sur l'exemple des aminoacyl-tRNA synthétases du bacille Escherichia coli, et les résultats comparés à ceux de trois programmes séquentiels couramment utilisés : ssearch, sim (1991) et gap, du package GCG. Nous montrons ici qu'elle donne strictement les mêmes résultats que les programmes ssearch et sim, avec un gain de performances, pour la comparaison de deux séquences de longueur 1000, de 190 par rapport au plus rapide des trois (ssearch), exécuté avec un processeur Sparc 2, de 72 par rapport au même programme exécuté sous Sparc 10.

Abstract : The Rapid 2 coprocessor we are developping at the laboratory is a paginated set-associative memory with one-dimensional systolic capabilities. In previous papers, we showed how such an architecture can be used to accelerate the local similarity computation of biological sequences. We present here an application which implements the exact Smith and Waterman algorithm computing the best local score in the comparison of two aminoacid sequences. The implementation, which is mainly a microprogram for the Rapid 2 board, corresponds to the sequential algorithm used in the ssearch program of the FASTA 1.7 package. We also present the software which drives the board for this particular application. It performs data moving and conversion beetween the host processor disk and the coprocessor. The program/microprogram set has been simulated with the aminoacyl-tRNA synthetases of Escherichia Coli data base, and the results compared with those of three currently used sequential programs : ssearch, sim (1991) and gap (a part of the GCG package). We show here that the simulation gives strictly the same results than ssearch and sim. Comparing two 1000 aa sequences run 190 times faster in our board than the sequential program ssearch on a Sparc Station 2 (ssearch is the fastest within the three sequential programs). The same comparison with a Sparc Station 10 gives an accelerating factor of 72.


Publications internes Masi 1995 / Masi research reports 1995