Cuestionarios sobre bioconductores para ciencia de datos genómicos & respuestas – Coursera
Explorar las profundidades de la ciencia de datos genómicos nunca ha sido más accesible, gracias a plataformas como Coursera. los ‘bioconductor-para-genómico–Datos–Ciencia‘ El curso ofrece una inmersión completa en las herramientas y técnicas esenciales para la investigación genómica actual..
Antes de profundizar en los detalles del cuestionarios y respuestas, Es crucial comprender el valor que este curso aporta tanto a los científicos novatos como a los experimentados en el campo.. Este artículo tiene como objetivo arrojar luz sobre los conceptos y metodologías fundamentales que encontrará, allanando el camino para dominar la ciencia de datos genómicos.
Examen 1
Q1. Utilice el paquete AnnotationHub para obtener datos sobre las “islas CpG” en el genoma humano.
Pregunta: ¿Cuántas islas existen en los autosomas??
Responder: 26641
Q2. ¿Cuántas islas CpG existen en el cromosoma? 4?
Responder: 1031
Tercer trimestre. Obtenga los datos para la modificación de histonas H3K4me3 para la línea celular H1 de Epigenomics Roadmap, usando AnnotationHub. Subconjunto de estas regiones para mantener solo las regiones asignadas a los autosomas (cromosomas 1 a 22).
Pregunta: ¿Cuántas bases cubren estas regiones??
Responder: 41135164
Cuarto trimestre. Modificación de histonas H3K27me3 para la línea celular H1 de Epigenomics Roadmap
Responder: 4.770728
Q5. Las regiones bivalentes están unidas tanto por H3K4me3 como por H3K27me3.
Responder: 10289096
Q6. Examinaremos hasta qué punto las regiones bivalentes se superponen con las islas CpG..
Pregunta: ¿Qué tan grande es una fracción? (expresado como un número entre 0 y 1) de las regiones bivalentes, superponer una o más islas CpG?
Responder: 0.5383644
Q7. ¿Qué tan grande es una fracción? (expresado como un número entre 0 y 1) de las bases que forman parte de las Islas CpG, también están marcados como bivalentes.
Responder: 0.241688
Q8. ¿Cuántas bases están marcadas bivalentemente dentro de los 10 kb de las islas CpG??
Responder: 9782086
Q9. Fracción de CpG
Responder: 0.007047481
Q10. Calcular el odds ratio a partir de la tabla de contingencia
Responder: 169.0962
Examen 2
Q1. ¿Cuál es el contenido de GC de "chr22" en la construcción "hg19" del genoma humano??
Responder: 0.4798807
Q2. ¿Cuál es el contenido medio de GC de las regiones “narrowPeak” H3K27me3 de la hoja de ruta de epigenómica de la línea de células madre H1 en chr? 22.
Responder: 0.528866
Tercer trimestre. ¿Cuál es la correlación entre el contenido de GC y el "valor de señal" de estas regiones? (en chr22)?
Responder: 0.004467924
Cuarto trimestre. ¿Cuál es la correlación entre el "signalValue" de las regiones "narrowPeak" y el "fc.signal" promedio en las mismas regiones??
Responder: 0.9149614
Q5. ¿Cuántas bases en chr22 tienen una señal fc mayor o igual a? 1?
Responder: 10914671
Q6. Identificar las regiones del genoma donde está la señal en E003. 0.5 o inferior y la señal en E055 es 2 o mas alto.
Responder: 1869937
Q7. ¿Cuál es la proporción promedio observada y esperada de dinucleótidos CpG para las islas CpG en el cromosoma? 22?
Responder: 0.8340929
Q8. ¿Cuántas cajas TATA hay en chr? 22 de la construcción hg19 del genoma humano?
Responder: 27263
Q9. ¿Cuántos promotores de transcripción hay en el cromosoma? 22, que contienen una secuencia codificante, como una caja TATA en la misma cadena que la transcripción?
Responder: 218
Q10. ¿Cuántas bases en chr22 forman parte de más de un promotor de una secuencia codificante??
Responder: 309991
Examen 3
Q1. ¿Cuál es la expresión media de todas las características de la muestra? 5 en TODO el conjunto de datos(del paquete TODO)?
Responder: 5.629627
Q2. Usando el conjunto 75, anotar cada característica de TODO el conjunto de datos con la identificación del gen Ensembl. ¿Cuántos conjuntos de sondas (caracteristicas) están anotados con más de un ID de gen Ensembl?
Responder: 1045
Tercer trimestre. ¿Cuántos conjuntos de sondas (ID de Affymetrix) Están anotados con uno o más genes en los autosomas. (chr 1-22)
Responder: 11016
Cuarto trimestre. ¿Cuál es el valor medio del canal de metilación en todas las funciones de la muestra n.º?”5723646052_R04C01″
Responder: 7228.277
Q5. Acceda a los datos procesados desde el número de acceso NCBI GEO GSE788, ¿Cuál es el nivel de expresión medio de la muestra GSM9024??
Responder: 756.432
Q6. ¿Cuál es el promedio de la longitud promedio de las muestras en el experimento??
Responder: 113.75
Q7. ¿Cuál es el número de genes Ensembl que tienen un recuento de 1 leer o más en la muestra SRR1039512?
Responder: 25699
Q8. El conjunto de datos de vías respiratorias contiene más de 64.000 funciones.. ¿Cuántas de estas características se superponen con las transcripciones de los autosomas? (cromosomas 1-22) como lo representa el paquete TxDb.Hsapiens.UCSC.hg19.knownGene?
Responder: 26276
Q9. Las medidas de expresión del conjunto de datos de las vías respiratorias son el número de lecturas asignadas a cada característica..
Responder: 0.853774
Q10. ¿Cuál es la mediana del número de recuentos por función? (para muestra SRR1039508) que contienen un H3K4me3 estrechaPeak en su promotor (sólo se consideran las características que se superponen a las transcripciones autosómicas de TxDb.Hsapiens.UCSC.hg19.knownGene)?
Responder: 232
Examen 4
Q1. ¿Qué fracción de lecturas en este archivo tiene un nucleótido A en la quinta base de la lectura??
Responder: 0.3638
Q2. ¿Cuál es el valor de calidad numérico promedio de estas lecturas??
Responder: 28.93
Tercer trimestre. En este intervalo, ¿Cuántas lecturas están duplicadas por posición??
Responder: 129.00
Cuarto trimestre. ¿Cuál es el número promedio de lecturas en todo el 8 muestras que caen en este intervalo?
Responder: 90.25
Q5. ¿Cuál es la expresión promedio entre las muestras del grupo de control para la “8149273” conjunto de sondas (este es un identificador de personaje, no es un número de fila)
Responder: 7.0218
Q6. ¿Cuál es el valor absoluto del cambio de registro?(registroFC) del gen con el valor P. más bajo?
Responder: 0.7126
Q7. ¿Cuántos genes se expresan diferencialmente entre los dos grupos en un límite de valor de P ajustado de 0.05
Responder: 0
Q8. ¿Cuál es la diferencia media en los valores beta entre los 3 muestras normales y 3 muestras de cancer,en OpenSea CpG?
Responder: 0.0846
Q9. ¿Cuántos de estos sitios hipersensibles a la ADNasa contienen uno o más CpG en la matriz de 450k??
Responder: 40151
Q10. ¿Cuántas características se expresan diferencialmente entre control y tratamiento? (es decir.padj <= 0.05)?
Responder: 87
Deja una respuesta
Debes iniciar sesión o registro para agregar un nuevo comentario .