Tuesday, October 4, 2016

The arabidopsis thaliana nac transcription factor family structure - function relationships and determ






+

astratto TF (fattori di trascrizione) sono proteine ​​modulari contenenti minimamente un DBD (DNA-legame dominio) e un TRD (trascrizione dominio normativo). NAC [per NAM (senza meristema apicale), ATAF, CUC (a forma di coppa cotiledone)] proteine ​​comprendono una delle più grandi famiglie di piante TF. Sono regolatori chiave di stress percezione e programmi di sviluppo, e la maggior parte condividono un dominio NAC N-terminale. Sulla base di analisi di dati di espressione genica e la filogenesi di Arabidopsis thaliana NAC TF decifrare in modo sistematico le specificità strutturali e funzionali dei domini NAC conservati e divergenti C-Termini. Nove dei dieci domini NAC analizzati associare un conservata sequenza di DNA target precedentemente identificato con un nucleo CGT [GA], anche se con diverse affinità. Analogamente, tutti tranne uno delle proteine ​​NAC analizzate dipende dalla regione C-terminale per l'attività transactivational. In silico analisi mostrano che i TRDs NAC contengono motivi specifica sequenza-gruppo e sono caratterizzati da un alto grado di disordine intrinseco. Inoltre, ANAC019 è stato identificato come un nuovo regolatore positivo di ABA (acido abscissico) di segnalazione, conferendo ABA ipersensibilità quando ectopica espresso in piante. È interessante notare che l'espressione ectopica del ANAC019 DBD o TRD da solo ha portato anche in ABA ipersensibilità. L'espressione di geni marcatori di stress-reattiva [COR47 (freddo-reattiva 47), RD29b (reattivo-to-essiccazione 29b) e ERD11 (early-reattiva-to-disidratazione 11)] sono state indotte anche da full-length e ANAC019 troncato. esperimenti Domain-swapping sono stati utilizzati per analizzare la specificità di questa funzione. proteine ​​chimeriche, in cui il dominio NAC di ANAC019 è stato sostituito con le regioni analoghe di altri TF NAC, hanno anche la capacità di regolare positivamente la segnalazione ABA. Al contrario, la sostituzione del TRD ANAC019 con altri TRDs abolito ANAC019-mediata ipersensibilità ABA. In conclusione, i nostri risultati dimostrano che la specificità biochimica e funzionale di NAC TFs è associato con entrambe le DBDS ei TRDs. L'acido abscissico (ABA) Arabidopsis thaliana DNA-binding dominio dominio-swapping disordine intrinseco fattore di trascrizione NAC INTRODUZIONE TF gene-specifici (fattori di trascrizione) sono proteine ​​regolatorie che legano il DNA che attivano o reprimono l'apparato di trascrizione basale a promotori dei geni bersaglio. TF sono raggruppati in famiglie sulla base di somiglianze di sequenza, più spesso nella DBD (DNA-legame dominio) [1]. TF dalla stessa famiglia spesso legano DNA in maniera sequenza-specifica, quindi solo il targeting promotori con una determinata sequenza consenso [1]. A parte il DBD, TF sono caratterizzati da avere un TRD (trascrizione dominio normativo). In contrasto con le somiglianze di sequenza e le strutture ben definite di DBDS in membri di una specifica famiglia di TF, TRDs sono stati tradizionalmente classificati in base al loro profilo di aminoacidi, cioè come acido, glutamine-, proline - o serina / treonina-ricchi. Inoltre, TRDs spesso hanno un alto grado di sequenze bassa complessità ed una propensione per i segmenti proteici flessibili che non riescono ad auto-fold in una struttura tridimensionale ordinata, comunemente indicato come ID (disordine intrinseco) [2]. Gli sforzi in corso per comprendere la modularità strutturale e funzionale di TF sono stati tradizionalmente sulla base dell'esame dell'attività di versioni tronche delle proteine; una scoperta iniziale era che il DBD può essere separato dal TRD senza perdita di funzione o modulo che è illustrato dalla TF lievito GAL4, un paradigma per studi regolazione trascrizionale eucariotiche [3]. Inoltre, Johnston et al. [3] ha mostrato che l'espressione di una versione cytoplasmically situato di GAL4, senza l'N-terminale DBD, in una wild-type sfondo induzione permesso l'espressione di geni reporter nella stessa misura come espressione integrale GAL4. Questo implicava che GAL4 è costituito da domini separati conferire localizzazione nucleare, specifiche interazioni proteina-proteina, DNA-binding e l'attivazione trascrizionale [3]. Questa modularità apparentemente indipendente, ha dimostrato di essere un modello generale per molti TF e ha portato alla questione di come funzionale specificità si sostanzia [4, 5]. Anche se un gran numero di studi hanno mirato a caratterizzare la funzionalità TF, alcuni di loro può essere evidenziato come importanti tentativi di far luce sulla specificità funzionale dall'analisi dei moduli indipendenti TF. In lievito, la questione è stata affrontata decifrando le funzioni delle regioni all'interno del attivatore trascrizionale Rap1p (repressore attivatore protein 1), dimostrando che il C-terminale TRD ha solo un effetto minore sull'effetto crescita cellulare modulata da Rap1p [6]. Inoltre, esperimenti dominio scambiare con combinazioni di elementi DBDS di Rap1p omologhi di diversi lieviti rivelato che importanti modifiche possono essere apportate alla sequenza di amminoacidi di questa regione senza influenzare la funzione telomero vincolante Rap1p [6]. In un altro studio, utilizzando una serie di chimere dominio-swap, in cui diverse parti del Drosophila melanogastor T-dominio TF, codificate dal OMB geni (optomotor cieco) e org-1 (optomotor cieco legati-1), sono stati reciprocamente scambiati , Porsch et al. [7] indagato la rilevanza dei singoli domini per il corretto sviluppo degli occhi. I loro risultati suggerivano che entrambe le proprietà trascrizionali attivazione e repressione, così come la specificità di legame al DNA, possono contribuire alle caratteristiche funzionali dei fattori T-dominio [7], evidenziando la complessità di analisi del specificità funzionale dei domini apparentemente indipendenti TF. Nelle piante, il NAC [per NAM (senza meristema apicale), ATAF, CUC (a forma di coppa cotiledone)] famiglia costituisce un gruppo importante di [8] TF. I genomi di Arabidopsis thaliana (thale crescione), tabacco e riso tutti contengono più di 100 geni che codificano NAC TF, che lo rende uno dei più grandi famiglie di geni nelle piante [9, 10]. Geni che codificano TF NAC sono stati originariamente identificati dagli schermi genetici avanti come regolatori chiave dei processi di sviluppo [8]. Più di recente, NAC TF hanno anche dimostrato di essere coinvolto nella regolazione delle risposte allo stress in entrambe le piante modello e colture agronomicamente importanti [11, 12]. Abbiamo precedentemente dimostrato la proteina ANAC019 NAC interagisce con il RING-finger H2-E3 ubiquitina-proteina ligasi RHA2a, e abbiamo risolto la struttura cristallina del dominio ANAC019 NAC [13, 14]. La struttura ha rivelato una piega nuova proteina costituita da un imballaggio β-sheet ritorta contro un α-elica su entrambi i lati. Inoltre, utilizzando ANAC019 come riferimento abbiamo chiarito residui importanti sia per omo ed etero-NAC dimerizzazione e per il legame ad un elemento centrale del consenso DNA della sequenza CGT [GA] [15]. Gli studi di espressione genica ANAC019 hanno implicato un ruolo in diversi tipi di risposte allo stress [14, 16] e sovraespressione di ANAC019 causato una maggiore tolleranza alla siccità [16]. Inoltre, è stato dimostrato che ANAC019 regola le risposte di difesa su attacchi fungini attraverso un segnale di percorso relativo al acido jasmonico ormone vegetale [17]. Recentemente, Bu et al. [18] verificata l'interazione ANAC019-RHA2a e definito RHA2a come un nuovo regolatore positivo di ABA phytohormone (abscissico acido) di segnalazione [18]. Per quanto riguarda l'analisi determinanti funzionali di NAC DBDS e TRDs, Taoka et al. [19] hanno dimostrato che per i membri della sottofamiglia CUC del NAC TF del DBD conferisce specificità funzionale in termini di indurre la formazione di tiro accidentale su calli [19, 20]. TRDs provenienti da tre diverse origini NAC TF potrebbero essere fuse al dominio NAC di CUC2 ed ancora inducono formazioni sparare. Al contrario, sostituendo i domini CUC NAC con un dominio NAC da un membro della sottofamiglia ATAF di NAC TF non ha indotto la formazione di sparare. Tuttavia, il dominio NAC degli Stati sottofamiglia CUC1 CUC non ha mantenuto shoot-formazione-abilità quando fusa al TRD potente dalla proteina VP16 herpes simplex virus. Questo suggeriva che certe caratteristiche strutturali del TRD, che sono difficili da prevedere dalla sequenza aminoacidica, erano necessari per la funzione di CUC [19]. Nel presente studio, abbiamo utilizzato un approccio genome-wide, approfittando della diversità funzionale delle proteine ​​NAC, a sezionare gli aspetti struttura-funzione di NAC TF modularità. Le nostre analisi hanno mostrato che le relazioni filogenetiche basate su sequenze di dominio NAC sono generalmente in accordo con il C-terminale motivi di sequenza dei TRDs intrinsecamente disordinati e cluster di espressione genica globale NAC. Inoltre, il nostro studio comprende l'esame di versioni tronche di dieci proteine ​​NAC filogeneticamente distinte per caratterizzare la specificità strutturale del NAC DBDS e TRDs. Usiamo anche una strategia chimerica, sulla base della nostra identificazione di ANAC019 come regolatore ABA romanzo, per indagare il rapporto struttura-funzione del ANAC019 DBD e TRD. I risultati suggeriva multi-specificità del NAC TF, in termini di siti che legano il DNA di geni bersaglio, e hanno fornito la prova che la funzionalità positivo ABA-normativo è associato sia con il TRD ANAC019 e DBD. SPERIMENTALE Oligonucleotidi e enzimi di restrizione Oligonucleotidi e enzimi di restrizione usati nel presente studio sono riportati in Tabella complementare S1 (disponibile presso http://www. BiochemJ. org/bj/426/bj4260183add. htm). L'integrità sequenza di DNA di tutti i costrutti di espressione è stata confermata mediante sequenziamento. numeri di accesso dati di sequenza di questo articolo possono essere trovati in TAIR (L'Arabidopsis Information Resource) e EMBL (European Molecular Biology Laboratory) librerie di dati con le seguenti denominazioni nomenclatura NAC e numeri di adesione: ANAC019, At1g52890; ANAC003, At1g02220; ANAC002 (ATAF1), At1g01720; VOZ2 (pianta vascolare una zinco-dito proteine ​​2); At2g42400; ANAC008 [(SOG1 (soppressore della risposta di gamma 1)], At1g25580; ANAC105 [VND3 (vascolari legati dominio NAC 3)], At5g66300; ANAC030 (VND7), At1g71930; ANAC092 (NAC2 / ORE1), At5g39610; ANAC062 (NTL6) , At3g49530 e ANAC040 (NTL8), At2g27300. L'analisi bioinformatica della famiglia NAC BLASTP e PSI (iterate-specific di posizione) Ricerche - blasto sono state eseguite utilizzando il NCBI (National Center for Biotechnology Information) servizi BLAST. Ricerche sono state effettuate in un database non ridondante, ma sono stati limitati a includere solo colpi all'interno del genoma di Arabidopsis. Tutte le sequenze sono state annotate secondo le ultime annotazioni Arabidopsis genoma. allineamenti multipli sono stati generati utilizzando ClustalW o ClustalX [21] e BoxShade (http://www. ch. embnet. org/software/BOX_form. html) è stato poi utilizzato per la produzione di presentazioni grafiche degli allineamenti e per regolazioni manuali. L'analisi filogenetica delle sequenze dominio NAC è stata effettuata utilizzando il software MEGA4 [22]. La voce è stata un allineamento multiplo di sequenze di dominio NAC generate in ClustalX. L'affidabilità dei diversi raggruppamenti dell'albero è stata misurata mediante bootstrapping. MEME [multipla EM (Expectation Maximization) per motivo lo scatenamento] è stato utilizzato per la ricerca di motivi statisticamente significative nelle proteine ​​NAC utilizzando sia tutte le sequenze o sequenze di NAC Group-e specifici sottogruppi come un insieme di dati. MAST (allineamento motivo e strumento di ricerca) è stato utilizzato per ulteriori analisi delle proteine ​​NAC. valori di P sono stati usati per determinare la partita complessiva della sequenza al motivo di ingresso. Inoltre, la rilevanza dei motivi individuati è stata valutata mediante analisi della sua comparsa gruppi di controllo, ad esempio il dominio NAC servito come gruppo di controllo per motivi individuati nelle regioni C-terminale e viceversa. profiling aminoacido è stata effettuata utilizzando Composizione Profiler [23] approfittando del set standard di aminoacidi dati, SwissProt51, fornita dal programma. PONDR VL3 [24] è stato utilizzato per la previsione di ID strutturale. Per l'analisi di espressione globale, normalizzata At-TAX (array piastrelle express) dati di espressione per 107 geni NAC durante fasi di sviluppo selezionati e in risposta a diversi stress ambientali è stata ottenuta [25]. valori di espressione sono stati importati in R-software per l'elaborazione e heatmap uscita utilizzando il microarray Bioconductor pacchetti di analisi Affy, heatplus e gplots [26]. materiali vegetali, condizioni di crescita e di trasformazione di Arabidopsis Arabidopsis Col-0 (Columbia ecotipo 0) wild-type, omozigoti anac019 mutanti (SALK_096303) e semi transgenici sono state coltivate in camere di crescita a 22 ° C e con intensità luminosa di 150 micromol / m 2 per s da una combinazione di fluorescenza e lampade ad incandescenza. Trasformazione di Arabidopsis Col-0 impianti è stata eseguita con un metodo di immersione infiltrazione floreale modificato [27] utilizzando il Agrobacterium tumefaciens ceppo GV3101 (pMP90) e il pCAMBIA3300 binario vettore (Change) contenente il CaMV (cavolfiore virus del mosaico) promotore 35S per l'espressione costitutiva di transgeni e il bar marcatore che conferisce tolleranza all'erbicida Basta (50 mg / l di ammonio glufosinato). Le piante transgeniche sono stati selezionati da Basta spruzzare e T3 semi di trasformanti che esprimono transgeni sono stati utilizzati per le successive analisi. Un pCAMBIA3300 vettore vuoto è stata trasformata in impianti di Col-0 wild-type come controllo. test di sensibilità ABA Per determinare l'effetto di ABA sulla germinazione e l'efficienza crescita post-germinazione, superficie sterilizzato e stratificati (3 giorni) semi di Arabidopsis Col-0 wild-type, anac019 alleli mutanti (SALK_096303) e linee transgeniche che esprimono full-length, troncati o costrutti chimeriche di ANAC019. sono state coltivate su mezza forza Murashige e medie Skoog addizionato di 0-5 micron ABA (miscela di isomeri, Sigma-Aldrich). Un seme è stato considerato come germinato quando la radichetta penetrato il tegumento. La percentuale di semi germinati è stato segnato a 3 giorni dopo la stratificazione in tre esperimenti indipendenti (40 semi / esperimento per il trattamento). Post-germinazione efficienza di crescita è stato segnato come lunghezza radice primaria a 7 giorni dopo la stratificazione. Semi di Col-0 wild-type, mutanti anac019 e linee transgeniche utilizzate per l'analisi fenotipica sono state raccolte e raccolti allo stesso tempo. saggi di allungamento della radice sono stati eseguiti come descritto in [28] e livelli di significatività sono stati valutati da una t-test su due lati. Produzione di proteine ​​ricombinanti e nell'espressione planta Per la produzione di proteine ​​NAC ricombinanti, cloni di cDNA ottenuti dalla ABRC (Arabidopsis Biological Resource Center) e sono stati amplificati mediante PCR per ottenere la sequenza di codifica completa o la regione codificante il dominio NAC di ANAC019, ATAF1, NAC2 / ORE1, VOZ2, VND3, VND7, NTL8, SOG1, NTL6 e ANAC003 usando i set di primer elencati nella tabella supplementare S1. I prodotti di PCR sono stati inseriti pENTR / D-TOPO (Invitrogen) seguita da ricombinazione in pDEST-15 (Invitrogen) per ottenere GST (glutatione transferease) - tagged NAC proteine ​​ricombinanti. Le proteine ​​ricombinanti sono stati chiamati a mostrare i bordi del frammento dominio NAC, ad esempio, GST-ANAC019- (1-168), che consiste di GST fusa al N-terminale dei 168 residui N-terminali di ANAC019. Escherichia coli BL21 (DE3) è stato trasformato con i costrutti di espressione e utilizzato per l'espressione di GST-NAC proteine ​​ricombinanti. Trasformate colture di E. coli sono state coltivate ad una densità cellulare (D 600) di 0,6 in mezzo Luria-Bertani prima dell'induzione con 0,5 mM IPTG (isopropil β - D - thiogalactoside). Dopo 3 h di incubazione a 37 ° C le cellule sono state raccolte mediante centrifugazione a 10000 g per 20 min. Il pellet cellulare è stato risospeso in PBS, pH 7,5, contenente 1 mM DTT (ditiotreitolo), ed è stato incubato in ghiaccio per 30 min prima di sonicazione con uno strumento Soniprep 150 (MSE) in ampiezza 7 μ per 30 s, fermandosi per 1 min, e poi ripetere il processo per tre volte. Dopo sonicazione, il lisato viene liberata da centrifugazione a 10000 g per 20 min. Le proteine ​​di fusione GST-NAC sono stati purificati mediante cromatografia di affinità usando una colonna 2 ml glutatione-Sepharose 4B (GE Healthcare) con 250 ml di coltura di E. coli (al momento del raccolto D 600 era circa. 3,0-4,0). La colonna è stata lavata con dieci volumi di colonna di PBS, pH 7,5, contenente 1 mM DTT. La proteina è stata eluita in frazioni da 1 ml in tampone di 50 mM Tris / HCl, pH 8,0, contenente 10 mM GSH. Se necessario, le proteine ​​sono state purificate ulteriormente cromatografia a scambio anionico. Le soluzioni di proteine ​​sono stati dializzati overnight contro tampone 20 mM Tris / HCl, pH 8,0, contenente 1 mM DTT e caricati su una colonna RESOURCE Q 1 ml (GE Healthcare) ed eluiti con un gradiente di NaCl. Il pCAMBIA3300 vettoriale e le primer e enzimi di restrizione elencati nella tabella supplementare S1 sono stati utilizzati per la generazione di costrutti chimeriche per nell'espressione planta. Full-length ANAC019 (residui 1-317) è stato amplificato utilizzando un clone di cDNA ottenuto dalla ABRC. costrutti chimeriche per esperimenti dominio-swapping che contenevano il dominio ANAC019 NAC e TRDs divergenti sono stati costruiti. Innanzitutto, il frammento di DNA corrispondente al dominio ANAC019 NAC (residui 1-168 della ANAC019) è stato amplificato mediante PCR usando un full-length cDNA clone dalla ABRC; per l'estensione sovrapposizione PCR con frammenti che codifica per il dominio ANAC019 NAC, i primer inverso inclusi un'estensione di 12 bp al loro 5'-Termini. Poi frammenti di DNA che codifica per le TRDs [NAC2 / ORE1- (175-285), NTL8- (158-335) e SOG1- (216-449)] erano PCR amplificato utilizzando cloni di cDNA da ABRC; per l'estensione sovrapposizione PCR, primer a termine per l'amplificazione del DNA di sequenze codificanti TRDs, incluso un prolungamento di 12 bp nel loro 5'-Termini. Su generazione di successo dei singoli frammenti, i due prodotti di amplificazione sono stati mescolati e amplificati utilizzando il seguente programma PCR: quattro cicli di 94 ° C per 3 min, 53 ° C per 30 s e 72 ° C per 3 min. La PCR è stata eseguita con 2,5 unità di polimerasi Pfu DNA (Fermentas), 0.2 mM dNTP e circa. 150 ng di singoli frammenti di DNA in un volume di reazione di 100 microlitri. Subito dopo, sono stati aggiunti 0,3 pM primers esterni e l'inserto costruito è stato amplificato usando il seguente programma PCR: 95 ° C per 2 min; 30 cicli di 94 ° C per 1 min, 52 ° C per 1 min, 72 ° C per 2 min; 72 ° C di 15 min; e tenendo a 4 ° C. costrutti chimeriche che contenevano il TRD ANAC019 e domini NAC divergenti sono stati costruiti come descritto sopra, amplificando i domini NAC invece dei TRDs [NAC2 / ORE1- (1-174), NTL8- (1-157) e SOG1- (1-215 )], e il TRD di ANAC019 (residui 169-317) invece del dominio ANAC019 NAC. EMSA (saggio elettroforetico di mobilità-shift) Un oligonucleotide a doppio filamento contenente una versione ottimizzata del palindromo (sito di legame) NAC-BS selezionato per colata (amplificazione ciclica e selezione del target) [15] è stato preparato da ricottura complementari oligonucleotidi a singolo filamento della sequenza 5'-CAGTCTTGCGTGTTGGAACACGCAACAGTC - 3 '. L'oligonucleotide a doppia elica è stato etichettato all'estremità 3 'con DIG (digossigenina) utilizzando un kit DIG gel-shift (di seconda generazione; Roche). DNA reazioni di legame contenevano 4 pl di 5 × tampone 4 vincolanti) 2 SO 4. 5 mM DTT, 1% (w / v) Tween-20, 150 mM KCl, 1 ug di poli [d (IC)]>, 31 fmol di DNA DIG marcato e la quantità indicata di dominio proteina GST-NAC in un volume finale di 20 ul. Le reazioni di legame sono state incubate per 15 min a temperatura ambiente (20 ° C) e separati da PAGE (10% PAGE gel oro prefabbricati; CAMBREX). Elettroblotting è stata effettuata utilizzando un nylon membrane Hybond-N (Amersham Biosciences) e rivelazione chemiluminescente è stata eseguita secondo le istruzioni del produttore. analisi transattivazione nel lievito proteine ​​NAC sono stati esaminati per la presenza di un dominio di attivazione utilizzando un saggio reporter di lievito-based. Full-length o NAC-domain-troncati sequenze codificanti dei dieci candidati NAC sono stati clonati nel vettore pGBKT7 DBD (Clontech). Fondi e gli enzimi di restrizione utilizzati sono elencati nella tabella supplementare S1. versioni Successivamente, costruisce la codifica del GAL4 DBD fusa a full-length o NAC-domain-troncata di sequenze codificanti proteine ​​NAC sono stati trasformati in pJ694A ceppo di lievito, che ospita i geni reporter HIS3 e ADE2. Le colture di lievito trasformate sono state piastrate su SD (sintetico definito) piastre senza triptofano (-Trp) e piastre SD senza triptofano, istidina e adenosina (-Trp / - Il suo / - Ade) per 7 giorni a 30 ° C prima del controllo di transattivazione proprietà dei costrutti reporter. Per una facile valutazione dell'attività transactivational, culture durante la notte di trasformanti sono stati diluiti a una D 600 di 0,6, e quindi sono state preparate diluizioni seriali di 10 volte. Infine, 5 ml di ogni diluizione è stato avvistato a SD - TRP e piastre SD - Trp / - Il suo / - Ade, che sono stati poi incubate a 30 ° C per altri 7 giorni. Costrutti pVA3-1 (contenente il DBD p53) e pTD1-1 (che contiene il dominio di attivazione T-antigene) sono stati utilizzati come controlli positivi. Le cellule di lievito trasformate con pGBKT7 vettore da solo non può attivare il promotore GAL1 e quindi servito come controllo negativo. Estrazione di RNA, la sintesi del DNA e in tempo reale RT (trascrizione inversa) - PCR analisi Per Arabidopsis analisi trascrizione, RNA totale è stato isolato da tre rosoni completi per ciascun genotipo, utilizzando il kit RNeasy Mini (Qiagen). Purificata RNA DNase-trattato (1 mg; Promega) è stato utilizzato per la sintesi di cDNA utilizzando il kit di sintesi di cDNA Superscript III (Invitrogen) secondo le istruzioni del produttore. Quantitative PCR in tempo reale sono stati eseguiti in triplicato per ogni singola linea, e la quantificazione dei valori CT (soglia ciclo) è stato raggiunto calcolando mezzo di espressione normalizzata utilizzando il software Q-gene [29]. Actin2 è stato utilizzato come riferimento per determinare l'espressione dei geni ABA-reattiva COR47 (freddo-reattivo 47; At1g20440) e RD29b (reattivo-to-disseccamento 29b; At5g52300), ei geni di stress-reattiva FER1 (ferritina precursore 1 ; At5g01600) e ERD11 (early-reattiva-to-disidratazione 11; At1g02930). Gli esperimenti sono stati ripetuti tre volte con risultati simili. Primer per quantitativa real-time PCR sono elencati nella Tabella supplementare S1. RISULTATI La famiglia di Arabidopsis NAC Per scoprire l'espansione della famiglia Arabidopsis NAC TF abbiamo cercato per sequenze NAC utilizzando BLASTP in ultima annotazione del genoma, il genoma di Arabidopsis tradotto, utilizzando il dominio NAC di ANAC019 [14] come query. Questo approccio ha identificato 92 proteine ​​di Arabidopsis non ridondanti, e 18 proteine ​​supplementari NAC sono stati scoperti in una ricerca PSI-BLAST iterativo. L'assetto ClustalX multipla delle 110 sequenze rivelato una sequenza con unica somiglianza parziale al dominio del consenso NAC, lasciando 109 sequenze NAC (vedi tabella supplementare S2 disponibile al http://www. BiochemJ. org/bj/426/bj4260183add. htm) . Per studiare la famiglia Arabidopsis NAC TF in maggior dettaglio, un albero filogenetico è stato costruito con i domini NAC conservati in MEGA4 [22], utilizzando un metodo vicina-giunzione e analisi bootstrap per valutare l'affidabilità ramo (Figura 1). Come MEGA4 è stato in grado di costruire un albero sulla base di allineamenti tra At1g60240, questa sequenza è stato lasciato fuori. La filogenia del 108 Arabidopsis NAC è presentato nella figura 1 e un allineamento dei domini NAC è presentata nella Figura 2 (A). Sulla base delle analisi filogenetica, la famiglia Arabidopsis NAC è stata divisa in dieci principali polytomies collassando rami con bootstraps & lt; 40%. A parte i dieci principali raggruppamenti, sono stati osservati diversi gruppi minori. Per mantenere la nomenclatura Arabidopsis NAC coerente, i nomi di sistemi di nomenclatura precedenti [9, 30] sono mantenuti quando possibile in questa nomenclatura aggiornata (vedi anche tabella supplementare S2). Figura 1 filogenetica ed espressione analisi della famiglia Arabidopsis NAC diagramma di sinistra: presentazione filogenetico della famiglia NAC TF. L'analisi si basa su 108 NAC sequenze proteiche del dominio e l'albero è stato costruito nel MEGA4 [22]. Singole proteine ​​NAC sono elencati in base alla loro annotazione TAIR9, ANAC numerazione è come suggerito da Ooka et al. [9] e, quando possibile, il loro nome banale (per i riferimenti vedi Tabella supplementare S2). pannelli centrali e di destra: presentazione heatmap di normalizzati dati di espressione A-fiscali per 107 geni NAC nel corso di sei diversi stadi di sviluppo e in risposta a sei diversi trattamenti di stress. Medie di tre campioni replicati sono stati utilizzati per tutte le fasi di sviluppo e trattamenti analizzati. Per i campioni di stress, profili di espressione sono presentati relativi ai campioni mock-trattati appropriate. La chiave di colore nella parte inferiore mostra la correlazione tra colore e scala di registro 2 cambi piega. I valori inferiori a media (stadi di sviluppo) o valori dei campioni finti (set di dati tensione) sono di colore rosso e quelli sopra media o valori di esempio finte sono di colore bianco. I valori medi e geni invariati nella loro espressione rispetto al controllo finto sono di colore arancione. NAC TF esaminati più in dettaglio nel presente studio sono evidenziati (*). Figura 2 caratteristiche strutturali delle proteine ​​NAC (A) L'allineamento della sequenza dominio NAC delle dieci proteine ​​Arabidopsis NAC analizzati nel presente studio. Residui circondato da nero sono comuni ad almeno metà delle sequenze, che i residui circondate da grigio sono chimicamente simili in più della metà delle sequenze o simile al residuo dominante. (*) Indica residui che formano un ponte salino stabilizzare l'interfaccia dimerizzazione (sottolineato) [13]. (#) Indica i residui in una regione che contiene diversi residui altamente conservati importanti per legame al DNA [15]. Gli elementi secondari della struttura, α-elica (α) e beta-fili (beta), del dominio ANAC019 NAC sono indicati sopra l'allineamento. L'elemento racchiuso in parentesi era presente solo in uno dei monomeri del dominio dimero NAC [13]. I motivi di sequenza dominante individuati mediante l'analisi MEME / MAST [49, 50] sono indicati con le lettere A-E. Le sequenze consenso dei motivi sono riportati nella tabella supplementare S2. Le proteine ​​sono etichettate con il loro nome o ANAC numerazione banale (per i riferimenti vedi Tabella supplementare S2). (B) WebLogos di MEME / MAST motivi di sequenza per motivo io, che si trova nel prolungamento N-terminale del gruppo IX-1 proteine, e motivi di sequenza rappresentativi da NAC TRDs (per le assegnazioni di motivo a gruppi specifici, sottogruppi e proteine, vedi Tabella supplementare S2). L'altezza di una lettera nella WebLogo indica la frequenza relativa alla posizione data (asse x) nel motivo. (C) strutture di dominio schematica di proteine ​​tipiche NAC, N-terminale esteso sottogruppo IX-1 proteine ​​NAC, proteine ​​VOZ con il dito di zinco indicato (zinco F), e tandem dominio NAC NAC. barre nere indicano i confini del dominio NAC e frecce nere indicano posizioni introni. La figura non è in scala. (D) La struttura del dominio omodimero ANAC019 NAC (PDB codice adesione 1UT7) è mostrato in formato nastro con differenti colori (verde e magenta) per ogni monomero. I residui (ARG-19 e Glu-26) dell'interfaccia dimero (circondato) e Arg-88 del motivo di legame al DNA probabile (in scatola) sono mostrate come bastoni con azoto e atomi di ossigeno indicati rispettivamente in blu e rosso. Residui Lys-Arg 79 a-85 non sono risaliti nella struttura cristallina NAC019 [13]. analisi di espressione genica globale NAC La conoscenza di NAC pattern di espressione genica ha contribuito in modo significativo alla nostra comprensione del NAC coinvolgimento del gene nella tolleranza allo stress delle piante e lo sviluppo [25]. Per fornire una visione globale del trascrittoma NAC in relazione alle diverse fasi di sviluppo e stress ambientali abbiamo analizzato l'accessibili on-line dei dati di espressione genica Arabidopsis sul sito Al-TAX (http://www. weigelworld. org/resources/microarray/at - fiscale) [25]. In contrasto con il numero limitato di NAC probe set gene reperibili ampiamente usato ATH1 GeneChip, At-IVA dati di espressione è disponibile per quasi tutti i 108 geni NAC elencati nella Figura 1 (locus At1g64105 sovrapposizioni At1g64100 e non ha le sonde), e quindi fornito la base per l'analisi di espressione. I profili di espressione A-FISCALI hanno dimostrato che, nel complesso, NAC espressione genica viene rilevato in tutti i tessuti selezionati e stadi di sviluppo (Figura 1). Similmente, i livelli di trascritto NAC sono ampiamente influenzate da una serie di stress ambientali. Inoltre, senza porre alcun raggruppamento dei dati di espressione, i raggruppamenti minori con modelli di espressione simili in correlazione con l'analisi filogenetica basata sulle sequenze di dominio NAC. Questo è particolarmente evidente per i modelli di espressione tessuto-specifici, ad esempio una frazione del sottogruppo VND (II-1) di geni NAC sono prevalentemente espressi in entrambi gli steli e radici, mentre altri sono espressi solo in radici o steli. Questi dati supportano precedenti studi di membri VND che li hanno identificati come regolatori importanti transdifferenziazione delle varie cellule in elementi dei vasi [31, 32]. Un altro sottogruppo di rilievo è il gruppo ATAF (III-3), che mostra le più abbondanti livelli di co-espressione di vecchie foglie e radici. Questo è anche il caso per il più distante relative sottofamiglia VII-2 e per i membri dei sottogruppi transmembrana-ancorato I-1 e I-2. Inoltre, i membri del sottogruppo del gene III-3 sono altamente salata inducibile, mentre quelli della sottofamiglia I-1 e VII-2 rispondere principalmente a temperature elevate. Infine, la co-espressione dei cinque geni NAC codifica due domini NAC (VIII-1) in infiorescenze intere e frutti merita di essere messo in evidenza come un sottogruppo ancora da caratterizzarsi con una distinta modello co-espressione correla con la distribuzione filogenetica. Nel complesso, tra i set di dati di stress visualizzati, fattori che influenzano l'espressione dei maggior parte dei geni NAC sono il sale e temperature estreme. Per quanto riguarda questi ultimi, la maggior parte dei geni NAC mostrato di essere indotta dal freddo sono repressi dal calore e viceversa. In conclusione, numerosi geni NAC filogeneticamente correlati sono co-espressi in sviluppo / tessuto specifica-, e in misura minore specifico stress, modo. Caratterizzazione strutturale e classificazione delle proteine ​​NAC Per analizzare ulteriormente la diversità strutturale di proteine ​​Arabidopsis NAC, motivi di sequenza sono stati previsti con il MEME programmi e MAST. Questo individuati sia condiviso e specifici gruppi di motivi di sequenza nei domini NAC (figure 2 A e 2 B; supplementare Tabella S2). I principali motivi mappati ai alfa-eliche e beta-fili di dominio NAC [13]. Mentre la maggior parte dei domini NAC motivi abbiamo designato come A-F, domini da gruppi conteneva VI-X condiviso un minor numero di motivi con il resto dei domini NAC, e alcuni avevano motivi sottogruppi specifici, come motivo R del sottogruppo IX-1 (Figura 2 B). Le regioni divergenti C-terminale di proteine ​​NAC, per i quali è disponibile alcuna informazione struttura terziaria, sono stati anche esaminati per motivi di sequenza (Figura 2 B supplementare Tabella S2). Sottogruppo II-1 di proteine ​​/ VND NST condivisi motivi WQ e LP, di cui WQ ha dimostrato di essere importante per l'attività transactivational [33]. Tre motivi, LP (anche chiamato L; [19]), V e W, dominano il C-termini delle proteine ​​CUC-like, che comprende NAC2 / ORE1 [34], di sottogruppo II-3. Motif W è stato segnalato per essere di importanza per l'attività trascrizionale [19, 33]. circa. DISCUSSIONE




No comments:

Post a Comment