Kick off Tribus
¿Qué es Apache Airflow?
Plataforma para la gestión del flujo de trabajo de código abierto escrita en Python.
Herramienta ETL para big data escrita en Python
Cuando una empresa emplea un enfoque Data Driven significa:
Toma decisiones estratégicas basadas en el análisis de datos e interpretación.
Se mantienen los datos aislados y seguros, cada departamento trabaja con sus propios datos.
¿Qué es un Data Warehouse?
Repositorio de datos integrados desde uno o varios archivos fuentes heterogéneos.
Repositorio de almacenamiento que contiene una gran cantidad de datos en bruto y se mantienen allí hasta que sea necesario.
¿Como definimos el concepto de bias o sesgo en ML?
Error entre la predicción del modelo y la realidad
Estadístico de prueba, es una variable aleatoria a partir de datos de muestra y se utiliza en pruebas de hipotesis.
Cuando decimos que un modelo de ML tienen overfitting lo interpretamos como:
Un modelo que no puede modelar los datos de entrenamiento ni generalizar a nuevos datos ajuste insuficiente.
Modelo que aprendio demasiado bien de los datos de entrenamiento, afecta negativamente al momento de modelar nuevos datos.
De los siguientes modelos de ML, ¿Cual no pertenece a modelos de clustering?
Gaussian Mixture
K-means
Neuronal Networks
Support Vector Machine
¿Qué es la regularización en ML?
Técnica de remuestreo, útil para la estimación del sesgo y varianza de estimadores.
Técnica que se utiliza para reducir errores ajustando la función adecuadamente en el conjunto de entrenamiento dado y evitando el sobreajuste (overfitting).
Framework de programación para procesamiento de datos distribuidos diseñado para ser rápido para ser rápidoy de propósito general.
Mongo DB
Docker
Apache Spark
ElasticSearch
{"name":"Kick off Tribus", "url":"https://www.quiz-maker.com/QOWO3LU72","txt":"¿Qué es Apache Airflow?, Cuando una empresa emplea un enfoque Data Driven significa:, ¿Qué es un Data Warehouse?","img":"https://www.quiz-maker.com/3012/images/ogquiz.png"}