Consistència de gens i classificadors de signes predictius generats mitjançant diferents plataformes microarray | la revista farmacogenòmica

Consistència de gens i classificadors de signes predictius generats mitjançant diferents plataformes microarray | la revista farmacogenòmica

Anonim

Temes

  • Perfil de l'expressió gènica
  • Hepatotoxicitat
  • Farmacogenogenia
  • Marcadors predictius

Resum

Els classificadors basats en microarray i els gens de signatura associats generats a partir de diverses plataformes són abundants en la literatura; tanmateix, la utilitat dels classificadors i dels gens de signatura en aplicacions de predicció de plataformes creuades segueix sent en gran part incerta. Com a part del projecte de fase de control de qualitat MicroArray (MAQC-II), mostrem en aquest estudi la coherència de predicció de plataformes entre el 80 i el 90% utilitzant un gran conjunt de dades toxicogenòmiques il·lustrant que: (1) els gens de signatura d’un classificador generats. des d’una plataforma es pot aplicar directament a una altra plataforma per desenvolupar un classificador predictiu; (2) un classificador desenvolupat mitjançant dades generades a partir d'una plataforma pot predir amb precisió mostres que es van perfilar mitjançant una plataforma diferent. Els resultats suggereixen la utilitat potencial d’utilitzar gens de signatura publicats en aplicacions multiplataforma i la possible adopció dels classificadors publicats per a diverses aplicacions. L’estudi revela una oportunitat per a una possible traducció de biomarcadors identificats mitjançant microarrays a assajos d’expressió gènica no matriu validats clínicament.

Introducció

Durant més d'una dècada, s'ha utilitzat l'ús de microarrays com a eines moleculars per a mesurar l'abundància de transcripcions. 1 La producció de microarrays i els mètodes de laboratori associats han millorat i s'han normalitzat. La maduració d’aquesta tecnologia va proporcionar els fonaments necessaris per al desplegament recent de dues proves de diagnòstic diferents basades en microarray (és a dir, classificadors) relacionades amb el càncer. MammaPrint utilitza els nivells d’expressió de 70 gens, mesurats mitjançant la plataforma Agilent (Santa Clara, CA, EUA), com a indicador pronòstic per predir el risc de recurrència en pacients amb càncer de mama amb ganglis mamari negatius. 2 El Pathwork Tissue of Origin Test mesura els nivells de transcripció de 1500 gens, mitjançant la plataforma Affymetrix (Santa Clara, CA, EUA) per facilitar el diagnòstic de tumors d'origen desconegut. 3 Aquests avenços recents posen de manifest la utilitat de classificadors moleculars basats en transcripcions mesurats per microarrays en aplicacions clíniques.

Un classificador molecular és el resultat d’una combinació de gens de signatura (seleccionats mitjançant l’aprenentatge automàtic per diferenciar grups biològics com entre malaltia i salut) i d’un algorisme d’aprenentatge automàtic. S’ha analitzat intensament l’aplicació de classificadors a la clínica per diagnosticar, pronòstic i predicció dels resultats del tractament. Per millorar la predicció de la toxicitat i reduir el cost en les proves amb animals, sovint es desenvolupen classificadors basats en microarray en el camp de la toxicogenomia mitjançant sistemes in vitro o models animals a curt termini per substituir potencialment més costosos, que necessiten molt temps i que necessiten màxima màxima durada. proves d’animals. En conseqüència, els classificadors basats en microarray generats a partir de diverses plataformes són abundants en la literatura; tanmateix, la utilitat dels classificadors i dels gens de signatura associats en aplicacions de predicció de plataformes creuades segueix sent en gran part incerta. La utilitat d'aquests gens i classificadors de signatura publicats depèn en última instància d'un alt grau de transferibilitat de les plataformes.

L'avaluació del rendiment de micromecenatge multiplataforma ha estat el focus d'un gran nombre d'estudis (revisats a Yauk i Berndt 4 ). Entre els diferents factors que han resultat en la millora de les correlacions entre plataformes, dues àrees clau de millora han estat en els aspectes tècnics de la producció de dades de micromecenatge i de la manera en què s'analitzen aquestes dades. S'han aconseguit millores tècniques principalment en la fabricació de microarrays i en procediments de laboratori associats. 5, 6, 7, 8 L’anàlisi de dades s’ha fet més completa com a resultat directe del desenvolupament de noves eines i enfocaments computacionals per facilitar l’anàlisi dins i a través de diverses plataformes de microarrays. 9, 10, 11, 12, 13, 14, 15 L'estudi 16, 17, 18, 19, 20, 21 de l'Agència d'Alimentació i Drogues (FDA), relacionat amb el MicroArray Quality Control Consortium (MAQC) , va avaluar sistemàticament totes dues àrees clau i van concloure que els microarrays són capaços de generar mesures reproduïbles dins i a través de diferents laboratoris així com a diferents plataformes si s’aplicaven procediments d’anàlisi adequats. 17, 19 Aquest va ser un resultat significatiu ja que va mostrar que es van revelar les mateixes troballes i idees biològiques, fins i tot quan es van generar dades en diferents plataformes de microarray. El consorci MAQC ha ampliat encara més la seva exploració de les capacitats de les microarrays mitjançant l'establiment d'un conjunt de 'bones pràctiques' i un protocol d'anàlisi de dades associat per desenvolupar i validar classificadors basats en microarray, 22 inclòs l'estudi presentat sobre l'aplicació multiplataforma de classificadors. i gens de signatura.

Per avaluar la transferibilitat de la plataforma entre els gens de la signatura i el classificador, es va analitzar un gran conjunt de dades de toxicogenòmica que conté perfils d’expressió gènica del teixit diana (fetge) generat en dues plataformes de microarray diferents (Agilent i Affymetrix). 23 Es va utilitzar un enfocament complet i robust per avaluar si es pot desenvolupar un classificador predictiu utilitzant gens de signatura derivats d’una plataforma de microarray diferent (és a dir, transferibilitat de gens de signatura) i si el classificador d’una plataforma podria produir una predicció precisa per a la mostres les dades d’expressió que es van generar a partir d’una altra plataforma (és a dir, transferibilitat de classificadors).

Materials i mètodes

Conjunt de dades

Les dades de perfil d'expressió gènica basades en microarray, així com les dades histopatològiques que es van utilitzar en aquest estudi, es van generar prèviament i s'han detallat en altres llocs. 23, 24 Breument, vuit hepatotoxicants diferents (1, 2-diclorobenzene, 1, 4-diclorobenzene, bromobenzene, dibromur diquat, galactosamina, monocrotalina, N- nitrosomorfolina i tioacetamida) van ser seleccionats a partir de la literatura publicada respecte a les diferències existents a la cèl·lula. tipus i regions hepàtiques que es lesionen com a resposta a l’exposició. Per a cada compost es van seleccionar les dosis que van provocar un sub-tòxic ("baix"), una resposta moderadament tòxica ("mitjana") o una resposta excessivament tòxica ("alta") les 24 hores després del tractament. Es van recollir mostres per a perfilació d’expressió gènica, química clínica, hematologia i histopatologia a les 6, 24 i 48 h després de l’exposició. Per a cada compost es van utilitzar quatre animals per a cada dosi (inclòs un control del vehicle) i grup de punts de temps, a excepció del compost dibromur diquat en el qual es van utilitzar sis animals per a cada grup (a causa d’un major grau de variabilitat en presència i extensió de lesions hepàtiques en cada dosi i grup de temps). Després de 6, 24 o 48 h de tractament, es van realitzar experiments segons les directrius establertes i un protocol d’estudi amb animals aprovat estava arxivat abans de l’inici de l’estudi. 25

Per a les hibridacions realitzades a la plataforma Affymetrix, es va marcar l’ARN aïllat del fetge de cada rata individual i es va hibridar al Rat Genoma 230 2.0 Array amb 31 099 conjunts de sondes (Affymetrix) per a un total de 418 hibridacions. Per a les hibridacions realitzades a la plataforma Agilent, l'ARN aïllat del fetge de cadascuna de les 318 rates tractades es va etiquetar i es va hibridar contra una mostra d'ARN combinada que representava a tots els individus del grup de control coincident amb el temps. Les mostres es van hibridar a Agilent Rat Oligo Microarrays (G4130A) (22 075 sondes) i es va realitzar un reversor de fluoròfors (colorant) per a un total de 636 hibridacions. Les dades Agilent de doble color es van analitzar de dues maneres diferents en aquest estudi: basat en proporcions i en funció de la intensitat. Les dades basades en proporcions són el valor mitjà dels resultats d'intercanvi de dye, mentre que les dades basades en intensitat són el valor mitjà de Cy3 i Cy5 dels resultats de swap de tint, corresponent només a les mostres tractades.

Ancoratges fenotípics per a anàlisis multiplataforma

Per a cada animal d’aquest estudi, es van recollir un gran nombre de mesures d’endpoints, com ara química clínica, hematologia i histopatologia. Molts d’aquests paràmetres eren rellevants per a les troballes de toxicitat hepàtica; No obstant això, als efectes d’aquest estudi només es van considerar dos objectius diferents. Primer, per generar un classificador binari (el focus principal d’aquest estudi), es van utilitzar les dades histopatològiques de cadascun dels 418 per identificar els animals pels quals es va observar la necrosi hepatocel·lular (independentment de la gravetat) i aquells per als quals no ho havia (resumit a la taula complementària 1 en línia). En segon lloc, la resposta a la puntuació 24 de lesió hepatocel·lular (RHI) es va utilitzar com a punt continu per a l’anàlisi de regressió. Totes les dades clíniques per a cada animal, inclosos tant la classificació binària com els valors RHI, es troben disponibles a la taula complementària 2 en línia.

Conjunts d’entrenament i proves

El parell d’entrenament / conjunt de proves per a cada plataforma es va generar mitjançant un enfocament híbrid basat en la cronologia, basat en compostos i en la divisió aleatòria. Utilitzant un enfocament basat en la cronologia, en què s'utilitza la data de la hibridació per dividir aquestes dades, es confondria el fet que els compostos d'aquest conjunt de dades estudiats es perfilessin seqüencialment, cosa que seria problemàtica ja que s'hipotitza que els mecanismes moleculars subjacents. la resposta tòxica a aquests compostos és diferent i també per la manca de significació estadística associada amb el nombre limitat de compostos en aquest estudi. Tot i això, dividir aleatòriament les dades entre els vuit compostos podria dividir desigualment les mostres entre els conjunts d’entrenament i de prova i, per tant, es podria traduir de manera inadequada als prejudicis inherents que s’han pogut generar durant la creació d’aquestes dades. Per tant, el plantejament híbrid adoptat va ser que es va realitzar una divisió aleatòria en sis dels vuit compostos, en els quals la proporció d’entrenament / test va ser d’aproximadament 2: 1. Els dos compostos restants es van utilitzar exclusivament per al conjunt de proves. La monocrotalina es va seleccionar aleatòriament com un d'aquests compostos mentre que el bromobenzene es va seleccionar basant-se en la cronologia. Aquest procés va donar lloc a un nombre aproximadament igual de mostres de necrosi i no necrosi tant en la prova com en els conjunts d’entrenament. El nombre d’animals amb i sense necrosi dins de cada compost assignat a la prova o al conjunt d’entrenament es detalla a la taula complementària 2 en línia.

Assignació de proves entre les plataformes Affymetrix i Agilent

Totes les anàlisis es van fer mitjançant sondes que van mesurar la mateixa transcripció tant en la matriu Affymetrix Rat Genoma 230 2.0 Array com en el ratolí Agilent Oligonucleotide Microarray (G4130A). Es van utilitzar tres enfocaments diferents per identificar sondes associades a la mateixa transcripció.

  1. Conjunt de mapeig basat en seqüències (SeqMap): es va generar un enfoc basat en seqüències per identificar sondes comunes mitjançant l'aproximació que també es va utilitzar en el projecte MAQC-I. Breument, cada seqüència de sondes d'ambdues plataformes va ser BLASTed a la base de dades RefSeq. Per a la plataforma Affymetrix, cadascuna de les 11 seqüències de concordança perfecta per a cada conjunt de proves va ser BLASTAT de forma independent a la base de dades RefSeq i es va registrar la qualitat coincident per a cada sonda. Com que les 11 sondes Affymetrix de cada sonda acostumen a cobrir diversos centenars de bases, els criteris per considerar-se una concordança perfecta amb un registre RefSeq es van definir com a mínim el 80% de les sondes (9 de les 11) en una sonda que coincideix perfectament amb la mateixa. Registre RefSeq. Es va generar una llista de sondes que coincideixen perfectament amb les entrades RefSeq per a cada plataforma i es van fer servir per trobar comunes. Per a les entrades de RefSeq que es combinaven perfectament amb més d’una sonda de la mateixa plataforma, es va utilitzar la sonda més propera al extrem 3 ′ i es van excloure les sondes que coincideixin amb més d’una entrada RefSeq.

  2. Conjunt RefSeq (RefSeq): la base de dades RefSeq també es va utilitzar de manera menys restrictiva per combinar les sondes Agilent amb les sondes Affymetrix. La identificació de la sonda de la plataforma Agilent i l'ID del conjunt de sondes de la plataforma Affymetrix es van associar a la base de dades RefSeq disponible a la biblioteca ArrayTrack 26, 27 de juny de 2008, que reflectia la base de dades RefSeq al Centre Nacional d'Informació Biotecnològica (NCBI). El conjunt comú es va identificar mitjançant un enfocament de diagrama de Venn. En el cas de múltiples identificadors de sondes (o sondes) corresponents al mateix ID RefSeq per a cada plataforma, el valor d'expressió mitjà de les sondes (o sondes) es va calcular i utilitzar en les anàlisis posteriors.

  3. Conjunt Unigene (Unigene): per a l'enfocament menys estricte per identificar sondes de coincidència entre plataformes, la base de dades Unigene es va utilitzar seguint el mateix mètode descrit anteriorment per a la base de dades RefSeq. Es va utilitzar la base de dades ArrayTrack Unigene, que reflectia la base de dades NCBI del 21 de maig de 2008.

Índex T per avaluar la consistència multiplataforma

Tant la transferibilitat de gens de signatura com la predicció multiplataforma dels classificadors es van avaluar mitjançant la puntuació de l’índex T:

Image

on T A és una mesura de transferibilitat de classificadors desenvolupats des de la plataforma A a la plataforma B. Es van desenvolupar un total de N (és a dir, 500) classificadors. P k A i P k B són prediccions exactes per al mateix conjunt de proves perfilades per les plataformes A i B , respectivament. sd és la desviació estàndard de ( P k A - P k B ). La puntuació de l’índex T oscil·la entre 0 i 1 amb <0, 5 que indica que la transferibilitat es deu a l’atzar. La puntuació de l'índex T més gran indica una millor transferibilitat a les plataformes.

Resultats

Es van generar classificadors per predir si un animal determinat tenia o no proves de necrosi hepatocel·lular. Tant la transferibilitat dels gens de la signatura com dels classificadors es van valorar a partir de la precisió de predicció calculada mitjançant el conjunt de proves (figura 1). Es va utilitzar una puntuació de l’índex T per avaluar el grau de transferibilitat. Totes les anàlisis es van basar en el subconjunt de transcripcions comunes a les plataformes Affymetrix i Agilent. Per identificar les transcripcions comunes (TAC) es van utilitzar tres mètodes diferents, segons el seu nivell de rigor. Tal com es mostra a la taula 1, el nombre de TC augmenta a mesura que disminueix la rigidesa dels criteris de mapeig, proporcionant així l’oportunitat d’analitzar la dependència de la transferibilitat entre les plataformes de la rigidesa que s’utilitza per identificar els TC. Com que la plataforma Agilent utilitzava un disseny de dos colors (una mostra de "control" i una de "tractada", cadascun d'ells etiquetat amb un colorant diferent, hibridat a la mateixa microarray) en contrast amb la plataforma Affymetrix en la qual es va hibridar una única mostra etiquetada per cada microarray, aquesta diferència en la configuració d’hibridació va donar lloc a tres configuracions d’anàlisi diferents (ACs) per comparar les dades generades a partir de les dues plataformes diferents (taula 1).

Image

Dos procediments d’anàlisi per a l’avaluació de la coherència multiplataforma. ( a ) La transferibilitat de gens de signatura es va avaluar primer desenvolupant classificadors específics per Affymetrix mitjançant les dades del conjunt d'entrenament. Els gens de signatura utilitzats pels classificadors Affymetrix es van aplicar a les dades del conjunt d'entrenament generats mitjançant la plataforma Agilent per a produir classificadors específics per a Agilent. Ambdós conjunts de classificadors específics de la plataforma es van utilitzar per predir els seus propis conjunts de proves de manera independent. El procés es va repetir de manera que inicialment es van identificar els gens de la signatura a la plataforma Agilent i després es van aplicar a la plataforma Affymetrix. La precisió de predicció que es va assolir amb les dues plataformes es va utilitzar per avaluar la coherència entre les dues plataformes a nivell de gens de signatura. ( b ) La transferibilitat de classificadors consisteix a valorar si un classificador generat a partir d'una plataforma pot predir amb precisió les mostres perfilades per una altra plataforma. Concretament, es va generar un conjunt de classificadors que utilitzaven les dades del conjunt d'entrenament per a una plataforma determinada. A continuació, es van utilitzar aquests classificadors per predir el conjunt de proves per a ambdues plataformes, de manera independent. Això es va examinar bidireccionalment per ambdues plataformes de microarray. La diferència de la precisió de predicció dels conjunts de proves de les dues plataformes es va utilitzar per avaluar la consistència entre les plataformes a nivell de classificadors.

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint

Taula completa

L’anàlisi de transferibilitat de gens de signatura i classificadors va revelar una coherència entre el 80 i el 90% entre les plataformes Affymetrix i Agilent per al conjunt de dades de toxicogenòmica estudiat independentment de l’elecció dels mètodes d’aprenentatge de màquines, els TC seleccionats i les CA aplicades (es presenten els resultats detallats baix).

Transferència de gens de signatura

Es van utilitzar tres algoritmes diferents, el centroc més proper, el veí més proper i el bosc de decisió K, 28, 29 per generar classificadors i gens de signatura associats per a cadascun dels tres conjunts de TC i per a cadascuna de les tres CAs per a la comparació de dades a les dues plataformes. El procediment d’anàlisi general es mostra a la figura 1a amb detalls addicionals proporcionats per a cadascun dels algoritmes dels mètodes suplementaris. La figura 2 i la taula complementària 3 mostren les puntuacions de l’índex de T i la precisió de predicció dels classificadors que es van obtenir per a cadascuna de les 54 permutacions (dues plataformes de microarray × tres ACs × ​​tres conjunts CT × tres algoritmes). En general, es va observar un alt grau de transferibilitat amb un índex T de mitjana de 0, 84. No hi va haver cap diferència significativa en la transferibilitat respecte a la direccionalitat de la transferència (Affymetrix a Agilent o viceversa). A la figura 2 es mostra clarament que el mètode per seleccionar els conjunts de TC va tenir poc efecte sobre la transferibilitat. L’algoritme de selecció de decisió per a la classificació va sobrepassar constantment el veí més proper i el centroide K més proper en totes les instàncies.

Image

Avaluació de la transferibilitat de gens de signatura a la plataforma mitjançant puntuacions de l'índex T. Es van provar un total de 54 permutacions per valorar la transferibilitat de gens de signatura entre plataformes, que constaven de dues plataformes, tres CAs, tres enfocaments per generar llistes de TC i tres algoritmes de classificació. Es va calcular una puntuació de l’índex T per a cada permuta per avaluar la transferibilitat. ( a ) Compara les puntuacions de l’índex T que van generar les tres CA, mentre que ( b ) compara els resultats que es van aconseguir amb els tres algoritmes de classificació. ( c ) Descriu les puntuacions de l'índex T que es van obtenir amb els tres mètodes per generar conjunts de TC a les dues plataformes. Tant els mètodes alternatius com els mètodes per seleccionar els TC van tenir poc efecte sobre la transferibilitat, mentre que es va observar un grau de variabilitat per a diferents algoritmes de classificació.

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint

Hem integrat múltiples diagnòstics histopatològics diferents (tots relacionats amb la gravetat i l'extensió de la lesió hepàtica) per a cada animal en aquestes dades en un conjunt de cinc nivells de "RHI". 24 Es van examinar els animals classificats erròniament segons la puntuació de cinc nivells de RHI. Tal com es mostra a la figura 3, independentment de l’elecció dels conjunts d’AC, CT i algoritmes de classificació utilitzats, els animals classificats amb freqüència normalment tenien puntuacions de RHI baixes (és a dir, RHI = 0, 1 i 2, cosa que indica nivells inexistents o molt baixos de lesions hepàtiques). Els animals freqüentment classificats erròniament en la validació interna en una plataforma també van ser classificats amb més freqüència a l’altra plataforma utilitzant els gens de signatura transferits (figura 4). Aquests resultats suggereixen que si els gens de signatura d’un classificador es van generar mitjançant una plataforma, es pot obtenir una precisió similar mitjançant la generació de classificadors que utilitzen els mateixos gens de signatura dins d’una plataforma microarray diferent. A més, quan s'utilitzen els mateixos gens de signatura i mètode de classificació, els classificadors dependents de la plataforma van donar lloc a no només una precisió similar en la predicció del conjunt de proves, sinó que també es classifiquen de forma constant les mateixes mostres, cosa que probablement es deu als nivells biològics en contraposició a una dèficit en l’enfocament de classificació.

Image

Distribució del percentatge de mostres classificades erròniament entre diferents puntuacions de "RHI". Cinquanta-quatre classificadors (resumits a la figura 2 i la taula complementària 1 en línia) es van representar en tres panells basats en l’algoritme de classificació que es va utilitzar: ( a ) el centríod més proper (NC); ( b ) el veí més proper al K (KNN); i ( c ) bosc de decisió (DF). AFX AFX (o AGL AGL) denoten els resultats de predicció del conjunt de proves que es van obtenir quan es van generar els gens de signatura mitjançant el conjunt d’entrenament Affymetrix (o Agilent) des de la mateixa plataforma. En canvi, AFX AGL (o AGL AFX) indica que els gens de signatura s’havien identificat mitjançant el conjunt d’entrenament des de la plataforma oposada. En cap de les permutacions provades no es va classificar erròniament cap mostra amb una puntuació RHI> 2. La taxa de classificació errònia més gran es va observar per a les baixes puntuacions de RHI (és a dir, RHI = 0 i 1), relacionades o bé a l’absència d’aparent o a la presència de només petites quantitats de lesió hepàtica.

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint
Image

La taxa de classificació errònia per a cada animal del test establert en l'estudi de la transferibilitat de plataforma entre els gens de la signatura. L’estudi de la transferibilitat de plataformes transversals de gens de signatura va implicar 54 permutacions (és a dir, dues plataformes de microarray × tres ACs × ​​tres conjunts CT × tres algoritmes), resultant un total de 108 classificadors (és a dir, transferència d’Affymetrix a Agilent i viceversa) . La taxa de classificació errònia es calcula dividint la freqüència de classificació errònia de cada animal pel nombre total de classificadors (és a dir, 108 classificadors) del conjunt de proves. Cada barra està dividida en dos colors; el blau està associat a la classificació errònia per als classificadors seleccionats per la validació creuada, mentre que el vermell és per als classificadors que utilitzen els gens de la signatura transferits. L’etiqueta superior a la barra és la puntuació RHI. Tots els animals classificats erròniament tenien una puntuació de RHI de 0, 1 o 2 i cap animal amb RHI = 3 i 4 no va ser classificat erròniament. les mostres (és a dir, animals) classificades erròniament pels classificadors conduïts per validació creuada en una plataforma probablement ocorreguts en una altra plataforma utilitzant els gens de signatura transferits, indicant que el rendiment dels classificadors no es veia afectat per l’elecció dels gens de signatura sempre que es van validar en qualsevol plataforma. Tots els classificadors es van classificar malament els animals 27, 39, 45, 43 i 83.

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint

Els resultats fins ara han demostrat que es pot assolir la transferibilitat de diverses plataformes mitjançant dades de nivell de transcripció. Tot i això, s’ha documentat bé que la reproducció multiplataforma de les dades de microarray és encara més gran quan s’examinen les dades a nivell de procés / via biològica. 5 Per analitzar-ho, es va examinar la transferibilitat de les dades després que les dades de la transcripció s’haguessin assignat a 352 vies canòniques mitjançant l’aplicació 30, 31 de MetaGore MetaGore de GeneGo i el procediment d’anàlisi detallat a Mètodes suplementaris. La taula addicional 4 resumeix els resultats del classificador basat en ruta. D’acord amb els informes anteriors sobre la reproduïbilitat de dades, es va observar una transferència de plataformes multiplataforma mitjançant dades de nivell de ruta en comparació amb dades de nivell de transcripció. Això es posa de manifest amb els índexs de índex T més alts generals de la taula suplementària 4 en comparació amb la taula complementària 3. De forma similar a les anàlisis de nivells de transcripció, ni la CA ni el mètode per escollir els TAC van influir significativament en els resultats.

Tot i que es van obtenir bons resultats per al desenvolupament de signatures moleculars per a un sistema de classificació binària (és a dir, la presència o absència de necrosi), es va examinar més la transferibilitat dels gens de signatura a través de les plataformes quan s’utilitza una variable contínua (és a dir, un punt final). La puntuació RHI es va seleccionar com a punt final i es va valorar la transferibilitat de la plataforma entre tres algoritmes diferents (és a dir, model lineal general, quadrat parcial i arbre de particions). El procediment d’anàlisi està detallat a Mètodes suplementaris i els resultats de 43 paràmetres de model de tres algoritmes basats en AC 3 i el conjunt CT de SeqMap es van resumir a les figures suplementàries 1 i 2. Tal com es descriu a la figura suplementària 1, els models de formació desenvolupats a la El conjunt d’entrenament d’ambdues plataformes tenia l’error quadrat de la mitjana arrel comparable, independentment de si els gens de la signatura eren derivats de la validació interna realitzada dins de la mateixa plataforma o eren transferits de l’altra plataforma. A més, aquests models d'entrenament proporcionaven una precisió de predicció similar als conjunts de proves respectius. La correlació de predicció de Pearson entre els models d’entrenament de dues plataformes, una utilitzant gens de signatura derivats de la validació interna, i l’altra amb els gens de signatura transferits, va ser> 0, 97, que és lleugerament superior als valors de correlació (0, 94-0, 96) que eren generat amb cada conjunt de proves respectiu (figura suplementària 2). Aquests resultats mostren una alta transferibilitat de gens de signatura entre plataformes quan s'utilitza una variable d'extrem continu.

Transferència de classificadors

Es va analitzar la transferibilitat de la plataforma entre classificadors tal com es descriu a la figura 1b. Els classificadors es van generar mitjançant el conjunt d’entrenament des d’una plataforma determinada i després es van utilitzar per predir els conjunts de proves a partir de dades d’expressió gènica que es van generar ambdues plataformes. Es van comparar les precisions de predicció del conjunt de proves d’ambdues plataformes mitjançant la puntuació de l’índex T per determinar la predicció de la plataforma creuada. El veí més proper al K, el bosc de decisió i la màquina vectorial de suport es van aplicar a cadascun dels tres CAs per als tres conjunts de TC. Els procediments d’anàlisi de tres algoritmes de classificació diferents es resumeixen en Mètodes suplementaris.

Igual que amb l'avaluació de l'estudi de transferibilitat de gens de signatura, es van generar un total de 54 classificadors diferents amb la correcció per lots de plataforma transversal per a ACs 1 i 3, però no per a AC 2. La taula 5 addicional en línia resumeix les puntuacions de l'índex T de aquests classificadors i il·lustra l’alta precisió de predicció que es va observar per a ambdues plataformes amb una puntuació mitjana de l’índex de T de 0, 84. La figura 5 mostra clarament que hi havia poca diferència entre la precisió de la predicció, independentment de quina de les tres CAs per comparar les dades a les plataformes i quins dels mètodes per seleccionar els conjunts de TC es van utilitzar. Es va observar una lleugera variació entre els algorismes de classificació utilitzats per a anàlisis de transferibilitat de diverses plataformes.

Image

Avaluació de la transferibilitat de classificadors a través de la plataforma mitjançant puntuacions de l'índex T. Es van provar un total de 54 permutacions per avaluar la predicció entre plataformes de classificadors, que constava de dues plataformes, tres CAs, tres enfocaments per generar conjunts CT i tres algoritmes de classificació (és a dir, màquina vectorial de suport (SVM), KNN i DF) . AFX AGL (o AGL AFX) denoten que els classificadors es van generar a partir de la plataforma Affymetrix (o Agilent) i després es van utilitzar per predir els conjunts de proves que perfilen la plataforma oposada. Es va calcular una puntuació de l’índex de T per a cada permuta per avaluar la predicció de la plataforma creuada a partir d’una anàlisi comparativa dels resultats de predicció obtinguts dels dos conjunts de proves que s’utilitzava cada conjunt de classificadors per predir. ( a ) Compara les puntuacions de l’índex T que van generar les tres CA, mentre que ( b ) compara els resultats que es van aconseguir amb els tres algoritmes de classificació. ( c ) Descriu les puntuacions de l'índex T que es van obtenir amb els tres mètodes per generar llistes de TC a les dues plataformes. Els resultats indiquen que la predicció multiplataforma era independent de la CA i del mètode per identificar els TC, però variava lleugerament amb els algoritmes de classificació.

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint

La correcció per lots de plataforma creuada és necessària per utilitzar un classificador d’una plataforma per predir les mostres perfilades per l’altra plataforma perquè l’escala en mesurament per a l’abundància de transcripció absoluta és diferent entre les plataformes. Tal com es mostra a la Figura 6 i es resumeix a la Taula Suplementària 6, quan s'utilitzen valors d'intensitat generats per almenys una de les plataformes (ACs 1 i 3), la predicció era baixa tret que es realitzés una correcció de lots multiplataforma. En el cas d’AC 3 (la comparació de dades basades en intensitat generades per ambdues plataformes), una transformació simple de dades, com el mètode de centratge mitjà, és suficient per corregir l’efecte batch (taula suplementària 6). No obstant això, quan es van utilitzar classificadors de les dades d’intensitat d’Affymetrix per predir les relacions generades per mostres perfilades a la plataforma Agilent (és a dir, AC 1), es va requerir tant transformació de dades com escala. No és d'estranyar, quan es van comparar dades basades en relacions (AC 2), no va ser necessària una correcció de lots multiplataforma.

Image

Avaluació de la correcció de lots multiplataforma sobre la transferibilitat de classificadors a través de la plataforma. L'efecte de la correcció de lots multiplataforma es va avaluar per a cadascuna de les 54 permutacions anteriors i posteriors a l'aplicació de la correcció per lots a les dades. ( a ) Compara la precisió de predicció que es va obtenir generant classificadors mitjançant dades de la plataforma Agilent i, a continuació, prediu les dades del conjunt de proves de la plataforma Affymetrix. ( b ) Mostra els resultats de l'enfocament invers en el qual es van generar els classificadors mitjançant dades de la plataforma Affymetrix i després es van predir les dades del conjunt de proves de la plataforma Agilent. Els resultats van mostrar que la correcció de lots multiplataforma era necessària per als AC 1 i 3, però no era necessària quan es van utilitzar les dades de la relació (AC 2).

Imatge a mida completa

  • Descarregueu la diapositiva de PowerPoint

Discussió

Hi ha un gran interès per utilitzar classificadors (és a dir, signatures moleculars) en aplicacions clíniques, toxicologia predictiva i avaluació de riscos. Amb la varietat de diferents plataformes microarray disponibles comercialment, es plantegen qüestions naturals sobre (1) els gens de signatura identificats a partir d'una plataforma poden ser utilitzats directament per una altra plataforma per generar un classificador predictiu, cosa que suggereix la utilitat potencial d'utilitzar gens de signatura publicats en creu. -aplicacions de format? i (2) un classificador desenvolupat mitjançant una plataforma produirà una predicció precisa per a mostres les dades d’expressió gènica que es van generar mitjançant una plataforma diferent, cosa que suggeriria la possible adopció dels classificadors publicats per a una varietat d’aplicacions? A partir de les dades d’un gran estudi de toxicogenòmica que es van generar mitjançant les plataformes de microarrays Agilent i Affymetrix, els resultats presentats aquí descriuen una avaluació exhaustiva d’aquestes preguntes específiques, que van revelar la coherència entre les plataformes entre el 80 i el 90% i independent de l’elecció dels mètodes d’aprenentatge de màquines, s'han seleccionat els TC seleccionats i les CAs.

Hi ha molts paràmetres que es poden variar quan es comparen dades a través de plataformes de microarray, cadascun dels quals podria afectar teòricament les conclusions que es treuen. Per exemple, els diferents dissenys experimentals associats amb la plataforma Affymetrix d’un color i la plataforma Agilent de dos colors van donar com a resultat tres maneres diferents de comparar les dades entre les dues plataformes (taula 1). A més, el mètode que s'utilitza per identificar la llista comuna de transcripcions mesurades per ambdues plataformes (taula 1) i també l'algorisme utilitzat per a la classificació de les mostres podria afectar els resultats de comparació entre plataformes. A més, es pot avaluar la coherència multiplataforma tant a nivell de transcripcions individuals com a nivell de vies biològiques. Finalment, es pot valorar la coherència de la plataforma entre classificació binària o bé mitjançant anàlisi de regressió. Atès el seu caràcter combinatori, no és possible analitzar tots els possibles factors que puguin influir en els resultats de microarray. Per tant, en aquest estudi ens hem centrat en avaluar factors que creiem que són més importants i que probablement afectin la interpretació de resultats de consistència multiplataforma.

Es van examinar diversos factors claus que influeixen en la transferibilitat de gens de plataformes multiplataforma. L'elecció de la determinació de CA o CT ha tingut generalment un efecte mínim en la coherència de la plataforma, mentre que diferents mètodes de classificació variaven lleugerament pel que fa a la precisió que cadascú va aconseguir. De forma acumulada, els resultats mostren que l’elevat grau de transferibilitat de plataformes transversals dels gens de signatura tant per a la classificació binària com per a la predicció de l’endpoint continu.

En termes de transferibilitat de classificadores entre plataformes, quan es van calcular dades basades en relació a partir de la plataforma Affymetrix d’un color i en comparació amb les relacions que es van generar directament per la plataforma Agilent de dos colors (AC 2), no hi havia un lot de plataforma transversal. es necessitava una correcció per aconseguir una alta predicció multiplataforma. Tanmateix, quan les dades d’intensitat es van extreure de la plataforma Agilent de dos colors i es van comparar amb les dades d’intensitat generades directament per la plataforma Affymetrix d’un sol color (AC 3), va ser necessària una simple transformació mitjana de dades de centratge per assolir el mateix nivell de creuada. predicció de la tarima. Finalment, es va requerir una correcció per lots més complicada quan les dades d’intensitat de la plataforma Affymetrix es van comparar amb les dades de relació de la plataforma Agilent (AC 1). Això fa èmfasi en la importància d’assegurar l’equivalència de dades de diferents plataformes abans de fer anàlisis multiplataforma.

No es van obtenir resultats fenotípics inesperats en el context d’aquest estudi múltiple compost. Per exemple, en l'examen histològic de les seccions hepàtiques de cadascun dels 418 animals, es va observar que dos dels animals control tenien quantitats mínimes de necrosi hepàtica. La causa va ser idiopàtica perquè aquests animals no havien estat exposats a cap toxicitat, però a mesura que els danys estaven presents, es va comptar amb aquests animals en el grup de "necrosi" en aquest estudi. A més, malgrat que s’utilitzava una soca d’animals consagrada, hi havia una variabilitat considerable entre els animals en la resposta fenotípica a alguns dels toxics a intervals particulars de dosis i temps. Quan es considera aquesta variabilitat, no va sorprendre que diversos animals fossin classificats de forma constant sense tenir en compte els mètodes emprats per generar els classificadors amb o sense utilitzar els gens de la signatura transferits. No obstant això, per entendre millor el funcionament dels gens classificadors i signatures, es van analitzar més endavant els animals classificats. En la majoria de les permutacions provades, la majoria dels animals classificats erròniament o bé tenien una quantitat mínima de necrosi (és a dir, es preveu com a falsos negatius) o cap en absolut (és a dir, es preveu com a falsos positius) (figura 4). Des d’un punt de vista tècnic, aquest resultat no va ser inesperat. Es van collir dues seccions separades del lòbul esquerre del fetge a la necròpsia. Una de les seccions es va utilitzar per a la histopatologia i una altra de les seccions per a perfilació d'expressió gènica. Els diferents nivells de necrosi hepatocel·lular (mínima, lleu, moderada i marcada (greu)) es van basar en la quantitat de necrosi observable a la secció que es va utilitzar per a la histopatologia. En els nivells de necrosi més acusats, es podria esperar que el dany no es localitzés en regions específiques del fetge, sinó que es pogués presentar arreu. Això és coherent amb les observacions que les mostres amb necrosi moderada o marcada no es van classificar erròniament en aquest estudi. Tot i això, amb nivells menys pronunciats de dany al fetge, la lesió pot no ser homogènia a tot el fetge, sinó localitzada. Això podria explicar perquè l'observació de la necrosi es va fer en una secció del teixit, però el dany no estava present a la secció que es va utilitzar per a la perfilació de l'expressió gènica, per tant, es va produir una classificació errònia com a resultat d'un problema de mostreig. El segon conjunt més freqüent de classificacions errònies va ser quan un animal no tenia necrosi observable, però es classificava amb necrosi. Des d’una perspectiva tècnica, això podria ser simplement l’invers de la qüestió de mostreig detallada anteriorment. Tot i això, des d’una perspectiva biològica, també s’esperava aquesta observació. En el context d'un grup de dosis determinat, alguns animals no presentaven necrosi hepàtica observable al punt de temps de 6 hores (i per tant estarien inclosos en el grup de "no necrosi"), però tots els animals al moment següent. exposats a la mateixa dosi tenien una necrosi notable. Considerem que aquests animals eren representatius de la “toxicitat incipient”, en què el fetge respon a l’insult tòxic al nivell de transcripció, però encara no s’ha manifestat en el fenotip cel·lular. 32 Això podria explicar per què es va detectar el senyal necròtic a nivell molecular (transcripció) i, per tant, les trucades de "necrosi" per part del classificador, però per què això encara no es podia observar a nivell cel·lular (histopatològic).

Hi ha diverses observacions interessants addicionals que es poden fer quan s’examinen aquests resultats en conjunt. Primer, no hi ha una diferència significativa en el grau de transferibilitat tant de gens de signatura com de classificadors quan es generen a la plataforma Agilent i es transfereixen a la plataforma Affymetrix en comparació amb aquests en l'ordre invers, cosa que suggereix la comparabilitat de les dades derivades d'Affymetrix i Agilent plataformes de microarray i per tant, donant suport a les conclusions del projecte MAQC-I quant a la reproductibilitat de les dades generades en diferents plataformes de microarray. En segon lloc, les puntuacions de l'índex T per a la transferibilitat de gens de signatura eren estadísticament comparables (valor P <0, 05) a les puntuacions que avaluen la predicció de plataformes creuades dels classificadors, cosa que suggereix una correlació positiva entre gens de signatura i classificadors en termes de plataforma multiplataforma transferibilitat. Finalment, els perfils d'expressió gènica derivats de qualsevol plataforma han tingut un bon resultat en separar mostres en un anàlisi de components principals basat en la presència o absència de necrosi i també en funció de la gravetat de la necrosi (és a dir, RHI) (figura suplementària 3). Sens dubte, hi ha una resposta transcripcional forta a la necrosi del fetge que es va observar en aquest estudi i, per tant, la consistència multiplataforma de les respostes biològiques evocades per estímuls biològics més febles hauria de ser objecte de més investigacions.

En resum, els resultats positius de la transferibilitat de les plataformes multi-plataformes en genes i classificadors de signatura no només obren oportunitats i aplicacions potencials per als gens i classificadors de signes existents i futurs per a aplicacions multiplataforma, sinó que també suggereixen la possibilitat d’identificar biomarcadors rellevants clínicament basats en dades generades mitjançant microarrays d’expressió, i després analitzar aquests biomarcadors mitjançant una plataforma de menor densitat (per exemple, PCR quantitativa) en aplicacions d’avaluació de riscos clínics i de risc.

Image

Informació complementària

Documents de paraula

  1. 1.

    Figures suplementàries S1 – S3

  2. 2

    Mètodes suplementaris

  3. 3.

    Taules suplementàries 1-6

Glossari

AC

configuració de l'anàlisi

CT

transcripció comuna

DF

bosc de decisions

ANAR

ontologia gènica

KNN

Veí més proper a K

MAQC

Control de qualitat MicroArray

NC

centríode més proper

RHI

resposta a lesions hepatocel·lulars

SVM

màquines vectorials de suport

La informació complementària acompanya el document al lloc web de la revista The Pharmacogenomics (//www.nature.com/tpj)