Tamaño de la genoteca

Este es uno de los aspectos más importantes y que consiste en determinar aproximadamente cuántos clones es necesario disponer para tener una probabilidad p de contener una secuencia determinada de ADN.

Se debe asumir una re-presentación de secuencias al azar, que cada inserto es de igual tamaño y que el tamaño genómico del organismo sea conocido.

Así, si «a» es el tamaño del inserto y «b» es el tamaño del genoma (en las mismas unidades), luego una genoteca de N clones tendrá una probabilidad p de contener determinada secuencia:

Así por ejemplo para E.coli con un geoma de 4.2×10 3 Kb y si a = 20 Kb, si se
fija p = 0.99 (99% de probabilidad de contener determinada secuencia), el valor de N será de 9.6 x 10 2 clones.

Fuente: Apuntes de Microbiología Industrial del Programa Regional de Desarrollo Científico y Tecnológico de la OEA