En este grupo En todos

Foro de Base de datos



¿Cómo convertirse en un experto en Big Data?

Emagister
Barcelona, España
Escrito por Emagister Responde
el 18/12/2017

Resultado de imagen de Base de datos

Después de leer el artículo de Huffington Post llamado Los científicos de datos, una profesión de futuro puede que a más de uno se le despierte la inquietud por este sector. Pero, ¿Cómo convertirse en un experto en Big Data? ¿Qué podemos hacer para desarrollar nuestra carrera como científico de datos o analista de datos?

Sigue leyendo para descubrirlo.


No se puede afirmar que exista un camino definido para convertirse en un experto en Big Data , pero sí hace falta una serie de habilidades especificas para lanzar una carrera profesional dentro de este área. No es de extrañar que ahora muchos profesionales de IT estén buscando la manera de formar parte de esta nueva veta dentro del sector donde hace falta una sólida formación en Informática y conocimientos funcionales de Negocio . La combinación de estas características proporciona la oportunidad privilegiada de de convertirse en científico de datos o en analista de datos.

Uno de los caminos más directos para lograrlo es obtener alguna certificación en un campo que esté relacionado como, por ejemplo, con lenguajes de Programación , Bases de datos , herramientas de Big Data , distribuciones Hadoop o en cualquiera de las habilidades que a continuación se describen.

Las 10 habilidades para los científicos del dato o analistas de datos

Como habilidades generales se deben poseer conocimiento de Ingeniería y Estadística . Por supuesto, tener facilidad para las Matemáticas y los números será de gran utilidad. Sin embargo, el abanico de conocimientos es muy amplio y finalmente va a depender de las necesidades tecnológicas y de información que las empresas estén buscando.

Éstas son algunas de las habilidades necesarias más recomendables para convertirse en un científico del dato:

  1. Administración de sistemas de almacenamiento distribuido.
  2. Saber cómo realizar un análisis del entorno y diseñar un sistema de reportingpara la visualización de los datos, principalmente en la materia de business intelligence.
  3. Tener experiencia con bases de datos y los lenguajes de programación asociados, como SQL o PL/SQL.
  4. Estar familiarizado con herramientas Hadoop como Hive o Pig.
  5. Conocimientos en lenguajes de programación estadísticos como R o Python.
  6. Tener facilidad para las matemáticas en los ámbitos del álgebra lineal, calculo y probabilidad.
  7. Nociones en estadística como por ejemplo en descriptiva o regresiones lineales.
  8. Comprensión y manejo de las técnicas de machine learning.
  9. Instrucciones para la manipulación de datos, como data wrangling, data munging o data tyding.
  10. Conocimientos en ingeniería de software en sistemas distribuidos, algorítmica y estructuras de datos.

A simple vista, todos estos conocimientos resultan abrumadores, de modo que hay que planteárselo como un itinerario de aprendizaje durante el cual ir sumando conocimientos. Lo más conveniente es empezar por una Certificación o Máster que englobe la mayoría de estos ellos y, después, ir profundizando en cada una de las habilidades, especializándose en aquella que más interese.

Dónde seguir aprendiendo

Ante el boom de esta nueva profesión, han surgido multitud de herramientas para formarse y ampliar conocimientos en el todavía incipiente mundo del Big Data. Aquí se presenta una selección de algunas de ellas que, además, tienen apartados gratuitos para que avanzar sea todavía más sencillo:

  • Coursera : es una plataforma educativa asociada con las universidades y organizaciones más renombradas de todo el mundo. Por medio de esta colaboración, ofrece cursos gratuitos en línea que cualquiera puede realizar. En muy interesante una Especialización de científico del datos separada en nueve módulos.
  • Codecademy : Portal de formación gratuita de lenguajes de programación, especialmente recomendado el curso de Python .
  • RStudio : Uno de los entornos más extendido para desarrollar con R. Tiene un apartado de formación online .
  • Cloudera : Esta distribución de Hadoop permite descargar una máquina virtual con su producto de forma gratuita y además ofrece recursos de formación .