¿Que es Big Data? > El Presente

Big Data es todo aquello relacionado con un volumen de datos masivo, entendemos éste término como algo que una persona por si sola tardaría cientos de años en analizar.

Adquirir, extraer, analizar, transformar o visualizar datos son algunas de las características principales para dar una visión general asociada al tratamiento de datos masivos.

No existe una definición o significado exacto para entenderlo en unas pocas lineas pero podría resumirse mediante lo que se conoce como las 6 Vs:

  • Volumen: La Gran Cantidad de Datos que se manejan
  • Variedad: En los tipos de datos, ya sean Estructurados o No Estructurados
  • Velocidad: La rapidez en que se generan los datos con big data
  • Veracidad: El grado de certeza en la eleccion de que datos son correctos o no.
  • Valor: El valor de los para los negocios en los que se usa.
  • Variabilidad: Se pueden usar los mismos datos para diferentes analisis, sectores o negocios.

Formación Big Data

Si deseas aprender big data, hoy en día no existe una formación específica oficial para poder atender a las necesidades de éstas nuevas tecnologías.

Es necesario entonces, estudiar otro tipo de educación para adquirir las capacidades necesarias para optar a puestos de trabajo.

¿Donde Estudiar Big Data?

  • Masters
    • Presenciales: Principalmente los podemos encontrar en Universidades de nuestro pais y centro de educación privada especializada.
    • Online: Existen entidades que ofrecen modalidades online para realizar formación en big data, pueden estar vinculada a Universidades Públicas, pero muchos de ellos son de carácter privado.
  • Cursos
    • Presenciales: Tienen una duración menor y son enfocados normalmente a una introducción o especifícos de alguna herramienta o tecnología.
    • Online: Al ser online de un tiempo de realización variable es más versátil, existen multitud de plataformas en las que ofrecen todo tipo de cursos big data online.
  • BootCamps
    • Presenciales: Son formaciones exhaustivas en las que en un periodo de tiempo fijado máximo desarrollan un completo programa de formación para adquirir capacidades necesarias. Es un método que está en auge.

Tecnología y Herramientas Big Data

A medida que avanza el uso del big data, es necesario crear tecnologías para satisfacer cada sector o empresa.

Muchas veces son programas exclusivos para una pequeña especialización pero hay muchas que se convierten en referente en extracción, analisis o visualización de datos.

Actualmente algunas de las más destacadas que podemos encontrar dependiendo de sus características son éstas:

Almacenamiento de Datos

  • Hadoop: Diseñada específicamente para almacenar grandes conjuntos de datos utilizando clústeres.
  • MongoDB: Empresas que utilizan una combinación de datos semiestructurados y no estructurados
  • RainStor: Comprime y desduplica datos, lo que proporciona ahorros de almacenamiento de hasta 40:!.

Mineria de Datos

  • IBM SPSS Modeler: Cubre análisis de texto, análisis de entidades, gestión de decisiones y optimización y permite la extracción de datos estructurados y no estructurados en un conjunto de datos completo.
  • KNIME: Ayuda a los científicos de datos a obtener nuevos conocimientos, hacer predicciones y descubrir puntos clave de los datos
  • RapidMiner: Es una herramienta de minería de datos de código abierto que permite a los clientes usar plantillas en lugar de tener que escribir código

Análisis de Datos

  • Apache Spark: Es una de las herramientas de análisis de big data más conocidas, es de código abierto, rápido, efectivo y funciona con todos los principales lenguajes de big data, incluyendo Java, Scala, Python, R y SQL.
  • Presto: Es una herramienta de código abierto, que utiliza consultas distribuidas de SQL, diseñada para ejecutar consultas contra datos como un potente motor de análisis interactivo
  • SAP HANA: El análisis de datos es una característica que hace excepcionalmente bien. Al admitir datos de texto, espaciales, gráficos y series desde un solo lugar.
  • Tableau: Combina herramientas de análisis y visualización de datos y se puede usar en un escritorio, a través de un servidor o en línea.
  • Splunk’s Hunk: Es una herramienta(Diseñado para ejecutarse sobre el marco de Apaches Hadoop ) de análisis de datos totalmente equipada que puede generar gráficos y representaciones visuales de los datos que se suministran, todo manejable a través de un panel.

Visualización de Datos

  • Plotly: admite la creación de gráficos, presentaciones y paneles a partir de datos analizados mediante JavaScript, Python, R, Matlab, Jupyter o Excel.
  • DataHero: Es una herramienta de visualización fácil de usar, que puede absorber datos de una variedad de servicios en la nube e inyectarlos en cuadros y paneles que facilitan la comprensión de toda la empresa.
  • QlikView: Permite a sus usuarios crear visualizaciones de datos de todo tipo de fuentes de datos con herramientas de autoservicio que eliminan la necesidad de contar con modelos de datos complejos.

Empleo

Actualmente en nuestro país empieza a haber una alta demanda de éstos puestos:

A continuación os dejo un Listado de Portales de Empleo donde podemos encontrar trabajo en Big Data:

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad