Manipulación de la expresión

Enrique Iáñez Pareja

Instituto de Biotecnología

Universidad de Granada

Este ensayo viene acompañado por una sesión de diapositivas on line, provistas de imágenes y páginas de notas. ¡Visítelas!

ÍNDICE:

1.     Manipulación de la expresión génica en bacterias

1.1       Promotores fuertes y regulables

1.1.1        Ejemplos de promotores regulables

1.1.2        Un ejemplo de plásmido de expresión de alta eficiencia

1.1.3        Otros sistemas

1.1.4        Sistemas de expresión adaptados a la gran escala

1.2       Proteínas de fusión

1.3       Manipulación de factores que afectan a la traducción

1.4       Mejora de la estabilidad de la proteína

1.5       Resolución de los problemas de los vectores multicopia

1.5.1        Plásmidos de mediano número de copias

1.5.2        Plásmidos de bajo número de copias

1.5.3        Integración cromosómica

1.6       Carga metabólica

2.     Ingeniería genética de levaduras

2.1       Aspectos generales

2.2       Sistemas de expresión en Saccharomyces cerevisiae

2.2.1        Expresión directa (sin secreción)

2.2.2        Expresión y secreción

2.3       Sistemas de expresión en otras levaduras

3.     Sistemas de expresión de baculovirus

4.     Ingeniería de proteínas

1.    Manipulación de la expresión génica en bacterias

El objetivo principal de la ingeniería genética con fines industriales es lograr la correcta expresión a altos niveles del gen clonado en el microorganismo huésped elegido. Sin embargo, la clonación directa (sin manipulación adicional) de un gen en un vector normal (como el pBR322) no suele asegurar que nuestro gen de interés se vaya a expresar bien, sobre todo cuando procede de especies alejadas filogenéticamente. Por esta razón hay que proceder al diseño de vectores especializados y a menudo a modificaciones del gen de interés, con objeto de que este pueda transcribirse y traducirse bien en el microorganismo huésped. He aquí algunos de los elementos que conviene manipular para este fin:

bulletNaturaleza de las secuencias de inicio y final de la transcripción (promotores-operadores, terminadores)
bulletSeñales para el comienzo de la traducción, especialmente sitios de unión del ribosoma y codón de inicio de la traducción
bulletEficiciencia de la traducción, lo que puede obligar a utilizar codones sinónimos adaptados a la abundancia de los correspondientes ARNt del huésped
bulletEstabilidad de la proteína en la célula huésped
bulletLocalización celular de la proteína a expresar: en muchos casos interesa que la proteína se secrete, por lo que el diseño genético debe incluir señales de procesamiento postraduccional adecuadas. Otras veces interesa que la proteína se quede en el espacio periplásmico de la bacteria Gram-negativa huésped, o que se retenga en el citoplasma
bulletNúmero de copias del gen clonado. Cuando se pretende que el gen se exprese a alto nivel, se suele escoger un plásmido de control relajado, es decir, con gran número de copias, mientras que si interesa un nivel bajo de expresión se escoge un plásmido de control estricto (poco número de copias) o se recurre a integrar el gen de interés en el cromosoma

Cada vez que queramos clonar y expresar un gen, debemos ajustar específicamente muchos de estos parámetros, construyendo vectores de expresión ad hoc, escogiendo las cepas huéspedes, etc. Se trata de una labor que frecuentemente es bastante ardua, y que pone en juego una gran cantidad de conocimiento de biología molecular y de pericias técnicas.

Uno de los microorganismos huéspedes más usados es nuestro viejo amigo, el colibacilo Escherichia coli, probablemente el ser vivo más estudiado a nivel molecular, y del que se dispone de una vasta batería de métodos de manipulación genética in vitro. Pero para muchos experimentos se debe recurrir a otros huéspedes, como Bacillus subtilis, la levadura Saccharomyces cerevisiae, o incluso células de insectos o de mamífero.

Antes de entrar en detalles, hagamos un retrato rápido de lo que debe tener un vector de expresión en E. coli (se citan los elementos genéticos siguiendo el orden desde el lado 5’ al lado 3’):

bulletUn promotor eficiente, dotado de las regiones conservadas –35 (TTGACA o parecida) y –10 (TATAAT o parecida)
bulletA corta distancia del promotor, una región que al transcribirse suministre el sitio de entrada al ribosoma: la denominada secuencia de Shine-Dalgarno, que es complementaria del extremo 3’ del ARNr 16S
bulletA unos 3-11 pb aguas abajo de la secuencia de Shine-Dalgarno, debería situarse el codón ATG que señala el comienzo de la traduccción del ARNm. Este codón lo puede suministrar el gen a clonar, o bien el vector puede disponer de ese codón, seguido de alguna diana que permita la inserción del gen a expresar
bulletFinalmente, y situado al lado 3’ de todo lo anterior, una secuencia que funcione como terminador de la transcripción (que en su forma de ARN constituye la típica horquilla por emparejamiento intracatenario, donde la ARN polimerasa se desliga del ARN recién formado).

A continuación abordaremos algunos ejemplos de estrategias usadas en la manipulación de la expresión genética en bacterias (sobre todo E. coli).

1.1           Promotores fuertes y regulables

En principio, uno podría pensar que si queremos expresar un gen a alto nivel, deberíamos escoger un promotor fuerte y constitutivo. Sin embargo, la mayor parte de las veces no conviene usar tal tipo de promotores, porque al estar expresando permanentemente el gen de interés a alto nivel, pueden sustraerse recursos para el normal crecimiento de las células. Esto es especialmente delicado si la proteína foránea tiene efectos negativos para el huéped. Por lo tanto, lo normal es emplear promotores regulables, que el investigador puede conectar y desconectar a voluntad. Una estrategia habitual es aquella en la que se cultiva la bacteria recombinante hasta que se logran grandes densidades, momento en que se suministra la señal para que el promotor se active y transcriba el gen insertado.

1.1.1        Ejemplos de promotores regulables

Los promotores regulables de E. coli que se emplean en los vectores de expresión más habituales son promotores fuertes pero que bajo ciertas condiciones están reprimidos por las correspondientes proteínas represoras, lo que suministra la base para inducir o desreprimir el gen adyacente a voluntad.

1.1.1.1  Derivados del promotor lac

El promotor del operón de la lactosa (lac) ha servido para diseñar elementos de control de expresión en numerosos vectores. Mientras en el medio no exista lactosa (o un inductor apropiado), el promotor está reprimido por el represor (producto del gen lacI). En el laboratorio, la inducción se suele lograr añadiendo al medio un inductor gratuito (que a diferencia de la lactosa, no se metaboliza, pero se une al represor, inactivándolo). Ejemplo de inductor gratuito es el IPTG (isopropil-b-D-tiogalactósido). Para que el promotor lac se exprese a alto nivel, tenemos que evitar la represión catabólica: en ausencia de glucosa la proteína CAP se une con AMPc, y el complejo se une cerca del promotor, ayudando a la ARN polimerasa a comenzar la transcripción.

En los vectores de expresión se suele emplear un promotor lac mutante, conocido como lacUV5 (con una sustitución en la región –10), que es más potente que el promotor silvestre. Por supuesto, esta variante es reprimible por LacI e inducible por IPTG.

1.1.1.2  Derivados del promotor trp

El operón trp contiene los genes estructurales que determinan las enzimas para la síntesis del triptófano. Su promotor se ve reprimido, en presencia del triptófano en el medio, por el complejo represor-triptófano. Si no hay triptófano disponible, el represor queda inactivo, y por lo tanto el operón trp se transcribe. En los vectores basados en el promotor trp, la expresión se logra en medio sin triptófano, mientras que se reprime en presencia del aminoácido, o añadiendo el compuesto ácido 3-indol-acrílico. 

1.1.1.3  Promotor híbrido artificial tac

En los años 80 se diseñó un “promotor artificial” combinando la región –35 del promotor trp y la –10 del promotor lac, poniéndole de nombre promotor tac. Dicho promotor resultó ser 5 veces más potente que el de trp y 10 veces más que el de lac. A semejanza del promotor de lac, el tac es inducible por IPTG y reprimible por glucosa. Se ha usado mucho en vectores de expresión de alto rendimiento. Se llegan a alcanzar niveles de proteína recombinante del 10-30% de la total.

1.1.1.4  Promotores derivados del fago l

Se puede usar un sistema de expresión regulable consistente en el promotor PL del fago l y su represor cI. En la práctica se recurre al represor mutante cI857, que es un mutante termosensible (ts). De esta manera, podemos cultivar la bacteria recombinante a una temperatura moderada (30ºC) a la que el represor impide la transcripción del gen de interés. Cuando el cultivo alcanza la densidad deseada, subimos la temperatura hasta 42ºC, lo que inactiva al represor, y se logra la expresión a alto nivel de nuestro gen desde el promotor PL

1.1.1.5  Promotor del fago T7

El promotor del fago T7 necesita la ARN polimerasa específica del mismo fago, por lo que si queremos expresar genes bajo ese promotor, hay que clonar simultáneamente el gen de la polimerasa de T7. Normalmente este gen de la polimerasa se inserta en el cromosoma de E. coli o en el profago l (la versión insertada del cromosoma del l en las células lisogénicas) y bajo el control del promotor de lac. Entonces se procede a transformar las células con la construcción genética dotada del gen de interés aguas abajo del promotor del T7. Cuando añadimos el inductor IPTG, se induce el gen de la polimerasa de T7, proteína que transcribe a gran nivel el gen que hemos clonado.

1.1.2        Un ejemplo de plásmido de expresión de alta eficiencia

El plásmido pPLc2833 era ya un buen plásmido de expresión, pero vamos a ver cómo, a partir de él, se construyó otro aún mejor.

El pPLc2833 cuenta con un módulo pensado para clonar genes bajo el control del promotor PL del fago l: tras el PL existe un polilinker, es decir, un trecho de ADN dotado de múltiples dianas únicas para las respectivas enzimas de restricción (lo que permite usar cada vez la enzima más adecuada a nuestro experimento). Este plásmido presenta unas 40 copias por cromosoma. Para lograr una expresión a mayor nivel, se sustituyó su origen de replicación por el origen de replicación de otro plásmido, llamado pKN402, de modo que el número de copias se puede aumentar unas 8 veces incubando la bacteria a 42ºC. De esta forma se obtuvo el plásmido mejorado pCP3. Para su uso correcto, las células que albergan derivados de pCP3 con genes clonados bajo el promotor PL se cultivan primero a 28ºC, y una vez alcanzada una buena densidad, la temperatura se sube hasta 42ºC, con lo que el número de copias sube hasta unas 700. A esa temperatura, el represor termosensible cI(ts) se inactiva, por lo que el promotor PL funciona a su máximo rendimiento, y se logran altos niveles de la proteína codificada por el gen clonado.

Para hacerse una idea de la eficiencia de este sistema de expresión, baste decir que cuando se clonó el gen de la ligasa de T4 en el pCP3, nada menos que el 20% de la proteína total a 42ºC era ligasa de T4. (A título comparativo, la proteína “natural” más abundante de E. coli supone el 2% de la proteína total).

1.1.3        Otros sistemas

El uso de promotores que se activan al bajar la temperatura presenta la ventaja de que la proteína se pliega mejor, con lo que se evitan los problemas de la formación de cuerpos de inclusión. El promotor mejor caracterizado es el de cspA, aunque tiene el incoveniente de que se inactiva al cabo de 1-2 horas, tiempo demasiado corto para los fermentadores.

Recientemente ha recibido atención el sistema de la arabinosa, que ha sido comercializado por Invitrogen. Usa el azúcar arabinosa, que es barato, siendo la fuerza del promotor de araBAD más débil que la de los lac.

1.1.4        Sistemas de expresión adaptados a la gran escala

Los sistemas de expresión que hemos estudiado hasta ahora son muy buenos ... a escala de laboratorio de investigación, pero presentan el problema de que resultan caros y complicados si los queremos usar a escala industrial (donde manejamos volúmenes de cientos de litros de cultivo):

bulletLos sistemas basados en proteínas termosensibles plantean el problema de que cuando queremos aumentar la temperatura en un gran fermentador, esto requiere bastante tiempo (hasta 1 hora), y sobre todo, un gasto de energía importante.
bulletEn los sistemas que se inducen con inductores como el IPTG, el problema es económico: no sería rentable añadir la cantidad adecuada de este tipo de sustancias a un gran fermentador.

Para solucionar estos inconvenientes, se diseñó un sistema de expresión más barato, con dos plásmidos:

bulletUno de los plásmidos es de bajo número de copias, y lleva la parte codificadora del gen del represor cI bajo el control del promotor trp. (El uso de un plásmido de control estricto del número de copias garantiza que no se va a producir un exceso de moléculas de represor.
bulletEl segundo plásmido lleva el gen a expresar bajo el control del promotor pL.

Sabiendo cómo funcionan los elementos genéticos implicados, es fácil “deducir” el comportamiento del sistema:

bulletEn ausencia de triptófano en el medio, el promotor del trp está activo, y se producen moléculas de represor cI. Este represor se une al promotor pL del otro plásmido, y reprime la transcripción de nuestro gen, por lo que no se produce proteína.
bulletEn presencia de triptófano, se reprime la transcripción del gen cI desde el promotor trp. Al no producirse represor cI, el gen clonado en el segundo plásmido se puede expresar (desrepresión).
bulletEn la situación real de un fermentador, las cosas ocurren de la siguiente manera:
bulletAl principio, la bacteria se cultiva en un medio barato a base de melazas e hidrolizados de caseína, que contiene poco triptófano libre, de modo que nuestro gen clonado no se expresa, porque está reprimido por cI.
bulletUna vez que el cultivo se hace denso, se añade al medio triptona (un hidrolizado de proteína rico en triptófano). Entonces, al bloquearse el gen cI, queda desreprimido el gen clonado, con lo que se pueden producir grandes cantidades de la correspondiente proteína. (Se han logrado niveles de 20% de proteína recombinante respecto de proteína total).

Para la producción a gran escala lo ideal sería un promotor que no requiera inducción externa, y que por lo tanto haga el sistema más barato y automático. El del gen pho (fosfatasa alcalina) puede ser bueno, ya que se induce cuando se produce limitación de fosfatos, al final del crecimiento. Los rendimientos mejoran cuando al mismo tiempo se muta la proteína sensora de fosfato PhoS (PtsS), con lo que se logra la inducción del promotor a una mayor concentración de fosfato, y prolonga el periodo de producción. Por lo tanto, se puede adaptar a un fermentador con alimentación continua de fosfato sin que se reprima el promotor de phoA.

1.2           Proteínas de fusión

Cuando uno intenta expresar genes en huéspedes heterólogos es frecuente encontrarse con el hecho de que la proteína buscada se degrade, con lo que se obtienen bajos niveles útiles. Para solventar este problema, uno de los “trucos” consiste en lograr proteínas híbridas, de fusión, en las que nuestra proteína heteróloga (o la parte funcional que nos interesa) está unida covalentemente con una proteína estable del propio huésped, lo que la protege del ataque de proteasas de éste.

Para conseguir estas proteínas de fusión, hay que hacer una construcción genética en la que unimos, en la adecuada fase de lectura, un gen del huésped con el gen que queremos expresar. Veamos brevemente los elementos importantes de un vector especializado para obtener proteínas de fusión en E. coli que queden expuestas al exterior desde la membrana externa:

bulletPorción terminal 5’ del gen ompF que codifica una proteína de membrana externa. Este segmento suministra las señales de comienzo de la transcripción y de la traducción, así como las señales para que la proteína viaje hasta la membrana externa.
bulletInmediantamente después, una versión truncada del gen lacZ, desprovista no solo del promotor, sino carente de los codones correspondientes a los ocho primeros aminoácidos. A pesar de ello, se podría sintetizar b-galactosidasa funcional en el caso de estar en fase la secuencia que acabamos de describir. Otra característica de este lacZ es que su proteína es capaz de funcionar incluso cuando va fusionada en su extremo amino-terminal con otra proteína.
bulletLa situación relativa entre el extremo 5’ del ompF y el gen modificado de lacZ en el vector original es tal que este último no está en fase correcta. Por lo tanto, el vector no codifica b-galactosidasa.
bulletAhora bien, si clonamos un gen entre ompF y lacZ de modo que todos queden en fase, se producirá una proteína “tri-híbrida” consistente en el extremo de OmpF fusionado con nuestra proteína, que a su vez va fusionada con la b-galactosidasa. Los clones recombinantes que sinteticen esta proteína tri-híbrida se pueden identificar fácilmente porque tienen actividad b-galactosidasa, detectable como colonias azules en placas provistas de galactósido artificial cromogénico X-gal.
bulletLa proteína tri-híbrida se puede usar para dos fines:
bulletComo antígeno para producir anticuerpos frente a la porción proteica que hemos expresado con el gen clonado
bulletComo medio para aislar pequeñas porciones importantes de nuestra proteína.

El elemento Flag se compra a una empresa en forma del vector, previsto para su uso en la levadura Saccharomyces cerevisiae. Este elemento determina un péptido de ocho aminoácidos, cuya secuencia es Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys. Imaginemos que queremos expresar en levadura el gen de la interleucina 2 (IL-2), una citoquina de gran valor terapéutico. Pues bien, insertamos dicho gen a continuación del elemento genético de Flag. La levadura recombinante produce y secreta la proteína híbrida, que no se degrada. Por otro lado, el péptido Flag nos va a facilitar la tarea de purificar en un solo paso nuestra proteína de interés, por cromatografía de afinidad:

bulletSe prepara una columna cromatográfica a base de un soporte sintético (como polipropileno) al que se une anticuerpo monoclonal específico frente al péptido Flag
bulletSe hace pasar el extracto o sobrenadante de la cepa recombinante por la columna. La proteína híbrida que nos interesa queda retenida (al engarzarse con el anticuerpo), mientras que las restantes pasan de largo.
bulletPara eluir la proteína recombinante, se lava la columna con un tampón bajo en calcio.
bulletAunque la IL-2 recombinante provista de los 8 aminoácidos de Flag en su extremo N-terminal es funcional, las autoridades sanitarias obligan a eliminar ese péptido, cosa que se hace tratando el híbrido con una proteasa específica (enteroquinasa intestinal bovina).

Esto último nos ilustra el principio de que para satisfacer los estándares de seguridad y calidad, las proteínas recombinantes logradas como híbridos deben ser despojadas de las porciones del elemento de fusión. Por ello, los elementos de fusión suelen ser secuencias reconocidas por proteasas específicas que cortan en la juntura entre dicho elemento y la proteína de interés, sin atacar a esta.

1.3           Manipulación de factores que afectan a la traducción

Como se sabe, no todos los ARNm se traducen con la misma eficiencia. Uno de los factores que condicionan esta eficacia diferencial es la presencia, al comienzo del ARNm, de una secuencia (de 6 a 8 bases) que se puede emparejar con otra secuencia complementaria situada en el extremo 3’ del ARNr 16S. Así pues, el ARNm, para que sea traducido bien debe contar con este sitio de unión al ribosoma (RBS en siglas inglesas, también conocido como secuencia de Shine-Dalgarno), que suele consistir en 5’-UAAGGAGG-3’. Por esta razón, muchos vectores de expresión en E. coli se han diseñado para dotar al gen clonado de una secuencia de este tipo, con objeto de que su ARNm se traduzca eficientemente. Aparte de esto, hay que tener presente otras consideraciones:

bulletDebe existir una cierta distancia (en torno a 8 bases) entre la secuencia de Shine-Dalgarno y el codón AUG que señala el comienzo de la traducción
bulletEl segmento inicial del ADN que contiene la secuencia de Shine-Dalgarno y los primeros codones del gen clonado debe ser tal que, una vez transcrito, el ARN no forme emparejamientos intracatenarios. Es decir, a nivel de ARN ese segmento debe de carecer de la capacidad de formar estructuras secundarias en horquillas, que dificultan el acceso de los ribosomas.

Otro factor que puede condicionar la eficiencia de traducción deriva del hecho de que nuestro gen de elección tenga un “sesgo de codones” diferente al del organismo huésped, es decir, tenga abundantes codones para los que el anfitrión no disponga de suficiente nivel de los correspondientes ARNt. (Por ejemplo, de los cuatro codones para Gly, el GGA se usa poco en E. coli, pero mucho en humanos; por lo tanto, si queremos expresar un gen humano con abundantes codones GGA en esta bacteria, nos podemos encontrar que la traducción es poco eficiente, debido a la escasez de ARNt que reconozca este triplete). Cuando se nos presenta un problema de este tipo de sesgo de uso de codones, lo único que podemos hacer (aunque suele ser complicado) es sintetizar en laboratorio una versión sinónima de nuestro gen en la que los codones estén “optimizados” al uso del huésped.

1.4           Mejora de la estabilidad de la proteína

Cada proteína tiene una vida media típica, que puede ser de unos pocos minutos o de varias horas. A tal estabilidad colabora la presencia de puentes disulfuro y de ciertos aminoácidos en el extremo N-terminal. A menudo la simple modificación que añade un determinado aminoácido a ese extremo de una proteína a expresar es suficiente para conferirle una mayor estabilidad. Por supuesto, las proteínas de gran vida media se acumulan en la célula, y por lo tanto aumentan los rendimientos del producto recuperado.

1.5           Resolución de los problemas de los vectores multicopia

Muchos vectores derivan de plásmidos de control relajado: los derivados de ColE1 tienen de 15 a 60 copias. La serie pUC llega a presentar varios cientos de copias por célula. Los derivados p15A están en unas 15 copias. En ausencia de presión selectiva se pierden (10-5-10-6 por generación) como resultado de multimerización. Pero cuando se clonan genes cuyos productos son tóxicos u originan una gran carga metabólica, o cuando las células se cultivan en continuo a altas densidades, las pérdidas son mucho mayores. El uso de antibióticos para mantener la presión selectiva presenta desventajas, entre ellas la contaminación del producto o la biomasa con el antibiótico. Se han diseñado alternativas a esto, entre ellas el uso de plásmidos que ocasionan la muerte celular al perderese. Pero tienen el inconveniente de que introducen restricciones en el diseño de los medios de cultivo e introducen carga metabólica adicional. Para saltar estas desventajas, se ha diseñado el siguiente sistema:

bulletCepa huésped con un gen cromosómico condicionalmente esencial bajo el control del promotor-operador de lac
bulletUn plásmido acompañante multicopia que lleva el operador de lac
bulletLa titulación (secuestro mayoritario) del represor LacI por los numerosos operadores de lac origina la expresión del gen cromosómico (de resistencia a kanamicina) y el crecimiento selectivo de células portadoras del plásmido en medio con el antibiótico.

En muchos casos es deseable y más rentable una producción no demasiado alto, aunque estable. Para elo se puede intentar recurrir a vectores con menos copias o a integración cromosómica.

1.5.1        Plásmidos de mediano número de copias

Los plásmidos de medio número de copias tienen entre 5 y 20 por célula. Se han construido vectores a partir de varios plásmidos naturales:

bulletRK2 (del grupo IncP). De amplio espectro, son de control estricto, autotransmisibles y presentan entre 10-15 copias por cromosoma. Los miniplásmidos derivados de RK2 se han mostrado estables durante 200 generaciones en algunos pseudomonas en ausencia de presión selectiva, pero pueden ser mucho menos estables en otras bacterias.
bulletRSF1010 (grupo IncQ). De amplio espectro, autotransmisibles, presentan unas 20 copias por célula.

1.5.2        Plásmidos de bajo número de copias

Tienen entre 1-5 copias por célula. Se ha construido un vector derivado de F, que presenta las siguientes características:

bullet9 kb de F con elementos necesarios para la replicación y la estabilidad segregacional:
bulletLos orígenes oriV, oriS aseguran replicación específica del ciclo celular,
bulletel locus de reparto permite ese reparto equitativo a células hijas,
bulletel gen repD recombina los dímeros hasta monómeros
bulletlos genes ccd matan cualquier segregante que pierda el plásmido.
bulletMódulo de clonación para la expresión:
bulletPromotor de araBAD y gen araC para una expresión inducible por arabinosa
bulletSitio de clonación múltiple
bulletTerminadores de transcripción

Este plásmido es estable en ausencia de presión selectiva, tiene una expresión génica bien controlada e impone una pequeña carga metabólica.

1.5.3        Integración cromosómica

A menudo es mejor intentar expresar el gen a clonar desde una localización estable en el cromosoma del huésped, evitando que se replique por medio de plásmidos. Una vez insertado en el cromosoma, el gen puede quedar allí de forma estable durante muchísimas generaciones sin necesidad de recurrir a presión selectiva.

La integración debe lograrse en un sitio del cromosoma que no sea esencial. Para que nuestro gen se integre en determinado sitio del huésped, debemos hacer una construcción genética en la que el gen vaya unido a secuencias homólogas del huésped, con objeto de favorecer la recombinación. Veamos un resumen de método para clonar genes por integración en cromosoma:

  1. Hay que identificar un sitio adecuado para la integración (o sea, un lugar que sepamos que al romperlo no vamos a afectar las funciones celulares normales).
  2. Aislamos y clonamos todo o parte de ese sitio cromosómico.
  3. Asociamos nuestro gen favorito (provisto de un promotor regulable) al sitio clonado para la integración. Esto lo podemos hacer de dos modos:
    1. Nuestro gen lo hemos insertado “dentro” del sitio de integración clonado, por lo que tendremos un “sandwich” de dos trozos del sitio de integración enmarcando a nuestro gen
    2. Insertamos nuestro gen de modo adyacente al ADN clonado de integración
  4. Transferimos nuestra construcción genética a las células huéspedes. Para ello la construcción genética va formando parte de un plásmido que no puede replicarse en el huésped (vector “suicida”).
  5. Se aplica la presión selectiva que permita recuperar y multiplicar los transformantes buscados. Obviamente, con estas condiciones, la propagación del gen clonado sólo tiene lugar si se ha integrado en el ADN cromosómico de las células.

Si hemos hecho la transformación usando un plásmido que lleva el gen interrumpiendo el sitio de integración clonado [caso a) de la fase 3) citada arriba], los dos segmentos separados de ADN del sitio de integración suministran sendos lugares de homología respecto del cromosoma, con lo que se puede producir un doble sobrecruzamiento que lleva a la integración de nuestro gen.

Si hemos transformado con el plásmido en el que nuestro gen está adyacente al ADN clonado del sitio de integración (caso b), un simple sobrecruzamiento entre este y la región homóloga del cromosoma conduce a la integración de todo el plásmido, incluyendo nuestro gen de interés.

Otra manera de lograr inserciones en lugares cromosómicos predeterminados es mediante un sistema en dos pasos que se ha ensayado con éxito en Bacillus subtilis:

  1. insertamos un gen marcador de resistencia a antibióticos en un lugar no esencial del cromosoma (empleando la lógica que hemos descrito más arriba, en la que el gen interrumpe secuencias del huésped previamente clonadas), seleccionando transformantes resistentes a ese antibiótico.
  2. ahora transformamos con un segundo plásmido “suicida” en el que tenemos a nuestro gen interrumpiendo las mismas secuencias clonadas del huésped usadas en la fase 1). Un doble entrecruzamiento entre dichas secuencias y las homólogas del huésped nos elimina el gen marcador mientras que nos inserta nuestro gen.

Si repetimos la anterior, pero usando en cada caso secuencias clonadas diferentes del hospedador, lo que obtenemos es una cepa que lleva varias copias de nuestro gen insertadas en diferentes lugares del cromosoma.

1.6           Carga metabólica

Ya antes hemos aludido a los efectos negativos de carga metabólica que suele acarrear la introducción y expresión de ADN foráneo en el organismo huésped. Esto se puede deber a una variedad de factores:

bulletGran número de copias o gran tamaño del vector
bulletLimitación de oxígeno disuelto en el medio
bulletLa gran producción de la proteína foránea puede agotar las reservas de ciertos aminoacil-ARNt (e incluso de ciertos aminoácidos) y drenar a la célula de su energía
bulletSi la proteína del gen clonado se expresa a alto nivel y se exporta desde el citoplasma hasta la membrana o el periplasma, puede producir “atascos” en los sitios de exportación, con lo que dificulta la localización correcta de proteínas del huésped.
bulletLas propias proteínas foráneas pueden tener efectos negativos interfiriendo con el huésped, generando efectos tóxicos, etc.

Con un buen diseño experimental, se pueden disminuir los efectos de la carga metabólica, mejorando los rendimientos de proteína recombinante y mejorando la estabilidad de las células transformadas. Por ejemplo:

bulletMuchas veces es mejor usar un vector de bajo número de copias, e incluso no emplear plásmidos, sino sistemas de integración cromosómica de nuestro gen (véase la sección que dedicamos a esta cuestión)
bulletUsar promotores fuertes pero regulables, de modo que durante la mayor parte del crecimiento tengamos a nuestro gen “desconectado”, pero que lo induzcamos o desreprimamos al llegar el cultivo a cierta densidad celular
bulletSiempre que sea posible, adaptar los codones de nuestro gen al sesgo peculiar de uso de codones de nuestro huésped. Ello puede suponer tener que construir un gen “sintético” que sea sinónimo del original, pero adaptado al huésped.

Para evitar los problemas de falta de disposición de oxígeno, se ha diseñado un sistema en el que se expresa la hemoglobina de Vitreoscilla en E. coli, lo que incrementa la concentración de ribosomas y ARNt al final de una fermentación de 30 horas.

Al final de cuentas, y de cara a la producción industrial, es mejor el rendimiento que se logra con un huésped que produce un modesto 5% de proteína foránea pero que puede alcanzar densidades en el fermentador de 40 g de peso seco por litro, que el que se lograría con un 15% de eficiencia en proteína foránea pero con una densidad de solo 10 g de peso seco de biomasa por litro.

2.    Ingeniería genética de levaduras

2.1           Aspectos generales

La clonación en bacterias ha permitido obtener a escala industrial algunas proteínas recombinantes, especialmente de interés terapéutico. Sin embargo, no siempre las proteínas de origen eucariótico se producen adecuadamente en huéspedes procarióticos, ya que a menudo son inestables o carecen de actividad biológica. Por otro lado las proteínas recombinantes obtenidas en bacterias, a pesar de haber sido cuidadosamente purificadas, pueden venir acompañadas de pequeñas cantidades de sustancias bacterianas contaminantes, que pueden tener efectos pirogénicos (inducción de fiebre). Por todas estas razones, la ingeniería genética ha desarrollado otros sistemas, principalmente eucarióticos, que salven al menos algunos de estos obstáculos. En este sentido, las levaduras presentan una serie de ventajas:

bulletSon eucariotas, y por lo tanto más semejantes a las células de los organismos superiores que los procariotas (por ejemplo, sus mecanismos de secreción)
bulletA diferencia de las bacterias, producen cierto tipo de modificaciones postraduccionales en las proteínas (glucosilaciones en ciertos aminoácidos, eliminación de la metionina inicial, rotura proteolítica de un precursor inactivo, etc.), lo que puede hacer que las proteínas heterólogas de organismos superiores puedan alcanzar su actividad biológica (aunque esto no siempre está garantizado)
bulletA semejanza de ciertas bacterias, la levadura Saccharomyces cerevisiae es muy fácil de manejar con métodos microbiológicos
bulletS. cerevisiae está muy bien estudiada al nivel genético y molecular. No sólo se puede realizar genética clásica (mutagénesis y recombinación meiótica, alternancia de ciclo haploide y diploide), sino que cuenta con herramientas avanzadas de ingeniería genética, y su genoma se secuenció totalmente en 1996
bulletDesde hace decenios, las levaduras se cultivan a escala industrial, y participan en multitud de procesos biotecnológicos. Además, cuenta con la calificación oficial de “organismo reconocido como seguro” (GRAS), indispensable para poder usarlo en obtención de sustancias para consumo humano

Por todo ello, las levaduras son los huéspedes eucarióticos de clonación más fáciles de usar, y una buena alternativa para intentar la producción industrial de proteínas de interés. (Sin embargo, debido a que las levaduras poseen un sistema de splicing diferente y menos efectivo que el de eucariotas superiores, si queremos expresar estos genes, hay que recurrir no a la versión genómica, sino al ADNc tras retrocopia del correspondiente ARNm maduro).

Existen varios métodos artificiales para introducir ADN exógeno en levaduras:

bulletObteniendo protoplastos en medio hipertónico y mezclándolos con el ADN en presencia de una sustancia fusogénica como el polietilenglicol (PEG)
bulletTratando células completas con sales de litio, seguido de mezcla con PEG y ADN, con choque térmico para estimular la transformación
bulletPor electroporación: el ADN entra en las células tratadas con cortos pulsos de corriente eléctrica.

Igualmente existe multitud de tipos diferentes de vectores, cada uno con una serie de características apropiadas para fines concretos. En general, los vectores de levadura, aparte de secuencias de levadura, contienen también secuencias de vectores bacterianos, previstas para su amplificación y manejo sobre todo en E. coli. Por esta razón se suelen calificar como vectores bifuncionales o “lanzadera” (porque permiten pasar del huésped bacteriano a la levadura, y viceversa). Daremos solo una breve lista de las principales clases de vectores y sus rasgos más notables:

bulletVectores integrativos (YIp): suelen contener un gen silvestre de levadura, lo que permite que el vector se inserte, por recombinación homóloga, con secuencias homólogas de la levadura huésped. No se suelen emplear para la expresión de genes heterólogos
bulletVectores de replicación autónoma basada en componentes cromosómicos (YRp)
bulletVectores con secuencias de replicación autónoma (ARS): suelen ser vectores inestables, por lo que no tienen interés industrial
bulletVectores YCp con ARS y secuencias centroméricas (CEN): al disponer de secuencias de centrómeros de levadura, se segregan mejor a las células hijas, por lo que son más estables, aunque se siguen perdiendo poco a poco, por lo que tampoco son demasiado útiles para la expresión a escala industrial
bulletCromosomas artificiales de levadura (YAC): son vectores que cuentan con una secuencia ARS, una secuencia CEN y dos secuencias teloméricas (TEL). Están previstos para insertar grandes trozos de ADN (de más de 100 kb). No se usan como vectores de expresión, sino como vectores de gran capacidad a la hora de generar genotecas de organismos complejos y preparar la secuenciación (por ejemplo, los llamados megaYACs han sido muy útiles en el Proyecto Genoma Humano).
bulletVectores basados en el círculo de 2mm de levadura: se trata de vectores que se aprovechan de un plásmido natural de S. cerevisiae, conocido simplemente como círculo de 2mm (por su tamaño). Es un plásmido críptico (no codifica funciones fenotípicas aparte de su propia replicación) existente en algunas cepas (cepas cir+) que se encuentra en unas 50 a 100 copias en el núcleo, constituyendo una especie de minicromosoma estable. Los vectores incorporan algunas de las secuencias del 2mm implicadas en su replicación y mantenimiento.

La manipulación genética de S. cerevisiae ha permitido obtener moléculas y procesos de gran interés comercial, sobre todo en el ámbito clínico.

2.2           Sistemas de expresión en Saccharomyces cerevisiae

2.2.1        Expresión directa (sin secreción)

Veamos un ejemplo que ilustre algunos aspectos de cómo lograr expresión directa (sin excreción al medio) de un gen heterólogo eucariótico, el ADNc de la superóxido dismutasa humana citoplásmica que requiere cobre y zinc (Cu/Zn-SOD). Se fabricó un plásmido “lanzadera” con las siguientes características:

bulletSecuencias para manejo en E. coli: un gen de resistencia a ampicilina (ApR) y un origen de replicación derivado de pBR322
bulletUn gen para seleccionar transformantes en levadura: el gen LEU2, de modo que cuando el plásmido entra en una determinada cepa auxotrofa leu2, la convierte en prototrofa (crece en medio mínimo carente de leucina)
bulletSecuencias derivadas del círculo de 2mm, para la replicación del plásmido en S. cerevisiae
bulletEl ADNc de nuestro gen (el de la Cu/Zn-SOD), “emparedado” entre secuencias para el comienzo y el término de la transcripción en levadura. En esta ocasión se escogieron secuencias señalizadoras procedentes del gen GAPD (gliceraldehido-fosfato deshidrogenasa) de la propia levadura. Hay que tener en cuenta que los “promotores” de levadura son diferentes a los procarióticos, e incluyen secuencias activadoras a cierta distancia de la porción codificadora. Estas secuencias, llamadas a menudo UAS (“upstream activating sequences”) se parecen funcionalmente a los potenciadores o intensificadores (“enhancers”) de los eucariotas superiores.

Cuando se transformó una levadura leu2con este plásmido, se aislaron transformantes prototrofos en medio mínimo. Como el promotor del gen GAPD es constitutivo, la proteína humana de Cu/Zn-SOD se expresaba continuamente, a grandes niveles. Además, la levadura había realizado una modificación similar a las de la proteína nativa de humanos, la acetilación en el grupo amino de la alanina N-terminal.

La mayoría de vectores de expresión actuales recurre, sin embargo, a promotores de genes inducibles, como los de la respuesta al choque térmico, o el GAL1 y el GAL10 que se inducen 1000 veces en presencia de galactosa.

2.2.2        Expresión y secreción

Si la proteína que queremos expresar debe ir glucosilada, el gen debe clonarse de modo que el producto se secrete, ya que en levaduras solamente las proteínas secretadas son modificadas de esta manera. Para ello, debemos unir al lado 5’ de nuestro gen las secuencias responsables del procesamiento y secreción del factor a de la levadura (el factor a es una especie de “feromona” para el cruce entre células haploides de sexos opuestos). De este modo, la proteína de fusión es reconocida por el sistema de transporte y secreción de S. cerevisiae, de modo que se corta el péptido señal del precursor del factor a (llamado pre-pro-a), y se excreta la proteína recombinante al medio. Este fue el sistema que permitió expresar y secretar en levadura la hirudina, proteína anticoagulante de interés clínico procedente de la sanguijuela Hirudo medicinalis

2.3           Sistemas de expresión en otras levaduras

Aunque, como hemos visto, ha habido éxitos en la expresión de proteínas en Saccharomyces cerevisiae, existe una serie de problemas a la hora de lograrlo a escala industrial:

bulletEn los grandes volúmenes del fermentador, existe una gran frecuencia de pérdida de los plásmidos, incluso cuando usamos promotores inducibles que solo se activan al final
bulletLa proteína heteróloga excretada suele tener un patrón de glucosilación diferente al de la original. Concretamente, existen oligosacáridos a base de más de 100 manosas, mientras que las proteínas naturales no suelen pasar de las 10 manosa por cada aminoácido modificado.
bulletA veces, la proteína, en vez de secretarse, se queda en el espacio periplásmico.

Por todo ello, se ha intentado desarrollar sistemas de expresión en otras levaduras, como Kluyveromyces lactis, Pichia pastoris y Hansenula polimorpha.

P. pastoris se ha usado desde 1984 para producir unas 300 proteínas recombinantes. Es una levadura metilotrófica ascomicética que se usó durante un tiempo para producir proteína unicelular para piensos, en un proceso desarrollado por la empresa Phillips Petroleum. En los años 80, esta empresa transfirió a otra empresa californiana (SIBIA) su sistema de expresión genética, sistema que está disponible comercialmente para investigación a través de la compañía Invitrogen. 

Las ventajas de este sistema son las siguientes:

bulletVentajas derivadas de las características metabólicas de esta levadura:
bulletGran preferencia por el metabolismo respiratorio, lo que permite cultivos más densos que otras levaduras
bulletModificaciones postraduccionales mejores que los de S. cerevisiae: procesamiento proteolítico, glucosilación y formación de puentes disulfuro
bulletAltos rendimientos de proteína, normalmente superiores a los sistemas de baculovirus y de células de mamífero
bulletMuy altos niveles de secreción de proteína heteróloga, con apenas secreción de proteína nativa
bulletSistema fácilmente escalable a escala industrial
bulletSistema más barato y más rápido que los de eucariotas superiores

El sistema original de expresión en P. pastoris está basado en el promotor de uno de los genes de la alcohol-oxidasa. La alcohol-oxidasa cataliza la primera reacción de la ruta de degradación del metanol, al oxidarlo hasta formaldehido y peróxido de hidrógeno. La reacción tiene lugar en el peroxima, orgánulo que secuestran el peróxido del resto de la célula. La alcohol-oxidasa tiene poca afinidad por el metanol, pero esto lo compensa esta levadura sintetizando grandes cantidades de la enzima, determinada por dos genes, AOX1, AOX2. El producto del primero representa más del 90% de la actividad total. El promotor de AOX1 está fuertemente regulado e inducido por metanol, pero está reprimido en otras condiciones, como hambre de carbono. La proteína representa hasta el 5% del total de proteína soluble durante la inducción con metanol. Por lo tanto, el promotor era un buen candidato para la expresión controlada de genes heterólogos: es posible cultivar la levadura recombinante durante la mayor parte del tiempo en una fuente de carbono no inductora como la glucosa o el glicerol; cuando se alcanza una densidad buena, se añade metanol para la inducción de la expresión del gen clonado. Este sistema, disponible comercialmente y de fácil uso, ha permitido expresar más de 400 tipos de proteínas, desde endostatina humana hasta proteína de tela de araña.

Veamos un ejemplo concreto: la producción de antígeno de superficie del virus de la hepatitis B:

bulletSe clonó el gen del antígeno de superficie del virus de la hepatitis B (HBsAg) entre las señales de inicio y término de transcripción del gen AOX1 de P. pastoris
bulletSe diseñó un plásmido lanzadera previsto para la integración cromosómica de la construcción genética, y cuya porción de levadura consistía (en este orden):
bulletMódulo de expresión promotor de AOX1-gen HBsAg-terminador de AOX1
bulletGen marcador HIS4 (para seleccionar transformantes en el auxotrofo his4)
bulletSecuencias del gen AOX1 correspondientes a la porción no codificante distal (en 3’)

Con este plásmido se transformó una cepa auxotrofa his4. El diseño del vector es tal que, al carecer de secuencias de mantenimiento en la levadura, la única manera de que se originen los transformantes es por recombinación. Un doble entrecruzamiento por recombinación homóloga en el que, por un extremo participen las secuencias de promotor, y por el otro las secuencias en 3’ del gen AOX1 significa la integración del módulo levadura del plásmido, incluyendo el gen silvestre HIS4 y la construcción de expresión con el gen de HBsAg, pero con ello “interrumpimos” el gen AOX1 silvestre. La selección de este evento se hace en:

bulletmedio mínimo sin histidina, para seleccionar la integración del gen HIS4
bulletcon metanol: las colonias que han integrado el módulo y que inactivan el gen AOX1 endógeno crecen lentamente en metanol (porque tienen otro el otro gen, menos efectivo, AOX2)

Estos transformantes, cuando se crecen en metanol, sintetizan grandes cantidades del antígeno del virus de la hepatitis B, que se queda en el citoplasma. Un clon transformante llegó a producir el equivalente a casi 10 millones de dosis de vacuna cuando se cultivó en un recipiente de 240 litros. Además, la construcción genética era estable durante al menos varios días de cultivo.

A pesar de lo anterior, este sistema de expresión presenta ciertas limitaciones, algunas de las cuales se están resolviendo en los últimos años:

  1. El metanol que se necesita para la inducción supone cierto riesgo de fuego y puede no ser adecuado para producir proteínas alimentarias. Por lo tanto, se necesitan promotores fuertes que no necesiten metanol para su inducción. Ya se cuenta con algunos:
    1. Promotor del gen de la gliceraldehido-3-fosfato deshidrogenasa (GAP). Suministra un alto nivel constitutivo de expresión en glucosa o glicerol. El inconveniente es que al ser constitutivo, puede no ser adecuado para expresar proteínas que supongan efectos negativos para el hospedador.
    2. Promotor del gen FLD1 de P. pastoris, codificador de una glutatión-deshidrogensasa dependiente de formaldehido. Se puede inducir por metanol o por metilamina (una fuente inocua de N) en medios con glucosa. Los niveles inducidos de expresión con este promotor son parecidos a los del gen AOX1 en metanol.
  2. Se necesitan promotores de expresión moderada. Algunos ejemplos:
    1. Del gen PEX8, que codifica una proteína de biogénesis del peroxisoma. Suministra expresión a bajo nivel sobre glucosa, y se induce moderadamente (unas 10 veces) cuando las células se pasan a metanol.
    2. Del gen YPT1: confiere expresión baja pero constitutiva en glucosa, metanol o manitol
  3. Otra limitación era la carencia de más genes marcadores para seleccionar los recombinantes. Hasta hace poco, solo se disponía de HIS4, ARG4 y Sh ble (resistencia al antibiótico zeocina). Ahora contamos con otros marcadores: ADE1, URA3.

Otros sistemas de expresión en otras levaduras:

bulletLevaduras metilotróficas:
bulletCandida boidinii
bulletHansenula polymorpha
bulletPichia methanolica
bulletLevaduras que usan lactosa: Kluyveromyces lactis
bulletLevaduras usadoras de alcanos y de ácidos grasos: Yarrowia lipolytica

3.    Sistemas de expresión de baculovirus

Los baculovirus son un tipo de virus que infectan artrópodos, especialmente insectos. Durante su infección, las partículas virásicas se empaquetan en unos grupos llamados cuerpos poliédricos, que son cuerpos de inclusión localizados en el núcleo celular, compuestos mayoritariamente de la proteína poliedrina. La poliedrina se sintetiza en grandes cantidades al final del ciclo infectivo, pudiendo llegar a suponer el 50% del total proteico de la célula. 

El genoma de los baculovirus consta de una molécula circular de ADN de c.d., de un tamaño de entre 88 y 200 kb. Aunque los poliedros se necesitan para la infección, no se requieren para mantener el cultivo celular infectado. Por lo tanto, el gen de la poliedrina es dispensable y puede hacerse hueco en esa parte del genoma para manipulación genética. Como el genoma es demasiado grande para manupular directamente, se recurre a lo siguiente:

bulletEl ADN heterólogo se inserta en un vector intermedio llamado de transferencia, sin capacidad infectiva, que es un vector con secuencias de E. coli (para hacer las manipulaciones fácilmente en la bacteria), y que lleva el eficiente promotor de la poliedrina, tras el cual se inserta el gen de interés.
bulletSe co-transfectan células de insecto con el vector que lleva el ADN clonado y con ADN virásico no recombinante.
bulletTiene lugar la recombinación in vivo entre el vector de transferencia y secuencias del genoma virásico, con lo que se generan genomas recombinantes que se pueden seleccionar y uar para producir la proteína de interés.

Presentan las ventajas de que las proteínas foráneas se expresan a alto nivel, experimentando modificaciones postraduccionales similares a las de mamíferos. El coste de producción es superior al de levaduras, pero menor al de usar células de mamíferos

bulletSe ha logrado adaptar líneas celulares de insectos a algunos de los requerimientos habituales de la producción a gran escala, incluyendo la resistencia a la agitación de los fermentadores
bulletHoy día ya se pueden usar cultivos de células de insectos en biorreactores parecidos a los empleados con los microorganismos
bulletSe han hecho avances en diseño de medios de cultivo más sencillos y baratos, que no necesitan suero. Todo ello permite el escalado, esencial para la producción de grandes cantidades de proteínas terapéuticas recombinantes
bulletUna de las aplicaciones más importantes de los baculovirus derivados de cultivos de células de insectos es su uso como insecticidas biológicos selectivos y seguros, que se emplean sobre todo en lucha biológica e integrada frente a plagas que afectan a bosques

4.    Ingeniería de proteínas

La ingeniería de proteínas es uno de los ámbitos más novedosos y prometedores de la ingeniería genética. Mediante este conjunto de técnicas se alteran genes de modos racionales para modificar la estructura de proteínas. Una de las modalidades es realizar mutagénesis in vitro sobre el ADN clonado, introduciendo mutaciones puntuales en sitios predeterminados, deleciones, etc. Si estas técnicas se unen al mayor conocimiento de la estructura y función de las proteínas, se puede uno dirigir a alterar aminoácidos concretos que afectan a propiedades fisicoquímicas o alostéricas. Se puede, p. ej., lograr modificar el estatus nutricional de las proteínas, o aumentar su estabilidad ante condiciones de pH, temperatura, etc.

Otros ensayos de esta sección:

Introducción a la Biotecnología ] Ingeniería genética básica ] Ingeniería genética industrial ] [ Manipulación de la expresión ] Ingeniería metabólica ]

Otras secciones:

Bioética (general) ] Biotecnología (introducción) ] Genoma y sociedad ] Terapias génicas y sociedad ] Eugenesia ] Clonación y embriones ] Biotecnología vegetal ] Biotecnología y economía ]

Actualizado el martes, 15 de febrero de 2005

© Enrique Iáñez. Prohibida su reproducción con fines lucrativos. Permitido el uso en educación.