martes, mayo 7

“¿Cómo va a ser posible tener dos ventanas abiertas al mismo tiempo en una computadora?” “¿Para qué? Si con costos podemos manejar una” …una conversación perdida o tal vez algo que muchos de nosotros podemos recordar ya hace más de 30 años (No, no por los 80s o 70s, sino más bien por los 90s). Y es que la tecnología ha venido en un auge exponencial, en donde en nuestros tiempos ya no nos preocupamos por tener dos o tres monitores mientras estamos trabajando, sino más bien lo vemos como una necesidad.

La computación como muchos sabemos, ha llegado a ser una parte fundamental en cada una de las actividades que nosotros realizamos. Una de ellas en este caso es por ejemplo la lectura de este blog y ni que se diga de la explosión y transformación obligada que tuvimos en los últimos años. Pero día con día seguimos creciendo en su usabilidad y poco a poco vamos dejando en rastro de datos en cada una de esas actividades que desarrollamos.

En la época actual que vivimos, uno de los temas que más nos hablan y que escuchamos es el de los datos. Y es que, en promedio, cada ser humano sobre la faz de la tierra deja un rastro de poco más de 1.7Mb de información al día (Staff High Tech Editores, 2018), si lo quisiéramos dimensionar, necesitaríamos dos disquetes para poder meter estos datos, lo que se traduce a que por persona necesitaríamos más de 700 disquetes al año y espacios muy grandes para guardar esta información. El disquete, por su nombre en español, fue un dispositivo de almacenamiento, hoy en desuso, fácil de transportar, pero muy limitado y poco seguro.

Como muchos sabemos, este problema de almacenamiento lo hemos podido erradicar con la creación de dispositivos que almacenan grandes volúmenes de datos o hasta que se encuentran en servidores que llamamos nube, pero en lugar proveernos una solución, más bien viene a nuestra mente los miles de problemas de haber realizado este proceso a nivel de estudiarlos.

En nuestros días la herramienta por excelencia con la que analizamos datos podemos decir que son las hojas de cálculo. Alguno de nosotros hasta nos atrevemos a llamarlas bases de datos (no lo son), pero en realidad hemos visto como nos vamos quedando cada vez más atrás si queremos empezar a revisar grandes volúmenes de datos, ya sea porque nuestra hoja de cálculo no lo soporta o nuestra máquina no logra devolvernos una respuesta eficiente en tiempo cuando estamos realizando algún proceso. Con el aumento en la generación de datos que vivimos, necesitamos empezar a utilizar nuevas herramientas que nos permitan poder analizar, tratar y no tener limitación de la cantidad de datos que deseamos procesar.

R es un lenguaje de programación estadístico que nos permite precisamente eso: analizar y realizar cálculos estadísticos independientemente del volumen de datos que tengamos, con la finalidad de poder devolver un producto de conocimiento de forma eficiente y sin ninguna limitación de imaginación del proceso que queremos revisar.

Muchos podemos pensar que, aunque tengamos la herramienta, programar es sólo para los ingenieros en sistemas, pero no podemos estar más lejos de la realidad. En nuestros días, cada vez más vemos como muchos de los trabajos que conocemos, poco a poco las máquinas los empiezan a realizar, reemplazando muchas de las actividades que nosotros como seres humanos realizamos. Escuchamos de hoteles que son 100% atendido por robots o hasta una banca mucho más automatizada a como estábamos acostumbrados a trabajar y esto nos da el entendimiento de que la programación dejó de ser para unos pocos, sino más bien una habilidad obligatoria para muchos.

R, a parte de las bondades con los datos para graficar y analizar, logra rendimientos extraordinarios, una de las virtudes que se le atribuyen es la facilidad con la que el usuario puede adaptarse a la herramienta y empezar un viaje de desarrollo, con instrucción, esfuerzo y dedicación para empezar a aprender lo que en nuestros días consideramos muy complicado o sencillamente le tenemos miedo.

Son cada vez más las empresas que confían el análisis de esta herramienta. Desde corporaciones como Microsoft, dedicadas al mundo del software, hasta empresas dedicadas a la banca, o la asistencia sanitaria para centrar los campos de acción sobre el eje médico, obteniendo como beneficios principales ser un código abierto, una plataforma independiente y su usabilidad en el mundo de la inteligencia artificial.

Hace poco más 20 años, los 2000, a muchos de nuestros estudiantes escolares, nos enseñaban a utilizar una computadora y programábamos a una pequeña tortuguita en un sistema que se llama Micromundos, que tal vez muchos lo recuerden, despertando el interés de muchas personas y la pasión por programar. Veíamos muy lejano el día en dónde iba a ser tan importante mover esa tortuguita. Ese día es hoy y con el crecimiento exponencial con la que tecnología avanza, esa tortuguita se transformó ahora en miles de disquetes que cada día crece más y más a la espera de ser analizados. Bienvenidos al mundo de la analítica de datos en R.

 

César Arroyo

Ingeniero en Computación

Ingeniero Industrial

 

Imágenes

 

https://en.wikipedia.org/wiki/R_(programming_language)#/media/File:R_logo.svg

MS-DOS installation diskettes” by DBreg2007 is marked with CC BY-SA 2.0.

Tomado de: https://www.youtube.com/watch?v=Cpjj02Os2oQ

http://www.sthda.com/english/wiki/ggplot2-histogram-easy-histogram-graph-with-ggplot2-r-package

Share.
Exit mobile version