Â¿QuÃ© es Big Data y de quÃ© forma funciona?

Eliminando el corte en la contrataciÃ³n

big data en RRHH podrÃan hacer mÃ¡s equitativa la contrataciÃ³n y prosperar la diversidad reduciendo el sesgo, dice Zoe Jervier Hewitt de EQT Ventures a Protocol. Eso empieza aun antes de que los candidatos sean entrevistados identificando quÃ© criterios deben cumplir. Trato de hacer que el sistema de evaluaciÃ³n sea verdaderamente hermÃ©tico, y encuentro que hay menos espacio a fin de que el sesgo no Ãºtil se introduzca en el proceso de esa manera, afirma Jervier Hewitt. Agrega que una tarjeta de puntuaciÃ³n de la evaluaciÃ³n puede centrar la atenciÃ³n en la competencia de un candidato y tener un efecto positivo en la diversidad de la tuberÃa y la diversidad de las contrataciones.

Â¿Deseas saber mÃ¡s?

Muchas organizaciones y escuelas ofrecen clases on-line de anÃ¡lisis de recursos humanos y anÃ¡lisis predictivo. TambiÃ©n hay guÃas on-line disponibles. Lee recomienda que los profesionales de RRHH consigan ayuda de los departamentos de TI, pero que asimismo aprendan ellos mismos lo suficiente para decirle al cientÃfico de datos lo que es correcto.

Resumiendo, estÃ¡ claro que RRHH no solo tiene big data, sino tiene muchas maneras potenciales de emplear big data que podrÃan hacer que el lugar de trabajo sea mejor tanto para los empleadores para los empleados.

Si ha disfrutado de esta profunda inmersiÃ³n en de quÃ© manera el big data estÃ¡n cambiando la manera en que marchan los departamentos de RR.HH., puede suscribirse a nuestro folleto diarioHRnewsbrief para obtener un contenido mÃ¡s informativo.

Modernizando el almacen de big data, ha llegado el momento

En el espacio de la tecnologÃa y el anÃ¡lisis de datos, me recuerdan de forma continua que la Ãºnica constante es el cambio. A esta industria le encanta innovar. Una y otra vez innovamos para superar los retos inmediatos y futuros - con soluciones que abordan la necesidad de mÃ¡s datos, anÃ¡lisis mÃ¡s veloces y una mejor arquitectura.

La innovaciÃ³n acostumbra a continuar una trayectoria de algo renovador, seguida de aÃ±os de mejoras incrementales que maduran la oferta y la hacen aplicable a las masas. Si bien estos cambios incrementales son en general simples de agregar, el inconveniente es que primero debemos incorporar la innovaciÃ³n innovadora. Esta transiciÃ³n en general requiere cambios en los procesos, capacitaciÃ³n, re-estructuraciÃ³n y una larga y dolorosa migraciÃ³n. En Ãºltimo tÃ©rmino, esto conduce a los ciclos de exageraciÃ³n tecnolÃ³gica, en los que las compaÃ±Ãas evalÃºan individualmente cuÃ¡ndo o aun si el peligro y la lucha por hacer un cambio merece la pena.

Mirando cara atrÃ¡s... un tanto de perseverancia... un poco de perspectiva...

El Hadoop es un gran ejemplo de ambos lados de este fenÃ³meno. Hace varios aÃ±os, el Hadoop era la nueva innovaciÃ³n en el bloque. A principios de 2010, llegÃ³ rÃ¡pido y furioso como el asesino del almacÃ©n de datos de la empresa (EDW). Aunque la mensajerÃa y la tecnologÃa inmadura de Hadoop crearon confusiÃ³n para muchas empresas, ciertos primeros adoptantes se lo tragaron y lo hicieron marchar. Durante los aÃ±os, la tecnologÃa madurÃ³ hasta el punto de que (prÃ¡cticamente) todo el planeta tenÃa un lago de datos basado en Hadoop marchando en sus centros de datos.

Avanzando de forma rÃ¡pida hasta el 2020, y sus aplicaciones analÃticas crÃticas para el negocio dependen de Hadoop - pero ahora estÃ¡ en el otro extremo del ciclo tecnolÃ³gico. El ecosistema del Hadoop se ha ido desarrollando y evolucionando a lo largo de la Ãºltima dÃ©cada, pero mientras tanto se han producido varias innovaciones tecnolÃ³gicas. Ha llegado el instante de abrazar estas nuevas innovaciones - y actualizar su gran acervo de datos.

Â¿El peligro vale la recompensa?

Las distribuciones de hadoop luchan por continuar siendo relevantes, pero han surgido plataformas de datos y opciones alternativas de despliegue. Muchas organizaciones empresariales estÃ¡n reevaluando su camino hacia adelante, embarcÃ¡ndose en una nueva estrategia para modernizar su gran acervo de datos. Con lo que, ahora es el momento de hacer las preguntas difÃciles:

Â¿Estoy obteniendo el valor que aguardaba de mi lago de datos? Â¿QuÃ© valor extra consigo cuando me actualizo?

Â¿De quÃ© forma va a ser la soluciÃ³n integrada? Â¿QuÃ© caracterÃsticas/apariciones seguirÃ¡n estando ahÃ?

Â¿QuÃ© es el mapa de senda? Â¿CambiarÃ¡ si mi distribuciÃ³n es adquirida?

Â¿Tengo que actualizar? Â¿CÃ³mo lo hago? Â¿CuÃ¡nto tiempo va a tomar? Â¿CuÃ¡nto va a costar? Â¿CuÃ¡ndo voy a perder el soporte de mi versiÃ³n actual?

Â¿EstarÃ© bloqueado en las aplicaciones propietarias de mi distribuciÃ³n? Â¿QuÃ© tan simple es traer las Ãºltimas herramientas de cÃ³digo abierto que mis equipos de ciencia de datos quieren?

Â¿EstÃ¡ Apache Ozone listo para el horario de mÃ¡xima audiencia? Â¿Debo confiar en Ã©l con mis datos?

Â¿Merece la pena el peligro o deberÃa estimar otra soluciÃ³n estratÃ©gica (y otro socio estratÃ©gico) para actualizar mi gran acervo de datos?

Las cuatro V de el big data

Para los cientÃficos de datos, el tÃ©rmino de big data se puede descomponer en lo que ellos llaman las cuatro V. Si bien ciertas escuelas de pensamiento afirman que podrÃa haber hasta 10 V's, aquÃ estÃ¡n los 4 primordiales calificadores que asisten a explicar cuando un flujo de datos se convierte en un gran flujo de datos.

Volumen

Merced a la gran cantidad de datos disponibles diariamente, el big data tienden a ocupar una gran cantidad de ancho de banda y almacenaje. Miles y miles de bytes pueden atravesar la Internet, en especial con el uso generalizado de la Internet de banda ancha. En verdad, conforme una encuesta de IBM, se estima que este aÃ±o se crearÃ¡n cuarenta zettabytes de datos, lo que supone un incremento del trescientos por cien con respecto a dos mil cinco. Estas enormes cantidades requieren una tecnologÃa de datos de importante tamaÃ±o que pueda manejar grandes conjuntos de datos.

Velocidad

Los datos fluyen mediante Internet a tal velocidad que si intentaras analizarlos por tu cuenta, serÃa como intentar tomar de la manguera de agua mÃ¡s grande y poderosa del mundo. La rapidez con la que se mueven los datos aumenta exponencialmente dependiendo del nÃºmero de conexiones que la gente tiene entre sÃ, en tanto que probablemente estÃ©s mandando mensajes de texto, que te agraden los mensajes de los medios sociales y que hagas pactos comerciales con ellos. La velocidad a la que los datos entrantes precisan ser procesados es un sello propio de el big data.

Variedad

Los datos pueden reunirse de muchas fuentes diferentes, como las diferentes redes sociales, las transacciones comerciales y de consumo, y la proliferaciÃ³n de dispositivos inteligentes que recogen datos de los usuarios (con frecuencia involuntarios). De forma anÃ¡loga, esos datos pueden presentarse en diferentes formatos y estructuras de archivo, desde informaciÃ³n de bases de datos rigurosamente categorizada hasta transferencias de archivos y comunicaciones en tiempo real.

Veracidad

Los datos inexactos son datos inÃºtiles. AdemÃ¡s, los datos inexactos le cuestan a la economÃa de los EE.UU. mÃ¡s o menos tres,1 billones de dÃ³lares estadounidenses de aÃ±o en aÃ±o, conforme la encuesta de IBM. Muchos lÃderes empresariales estiman que el big data son una apuesta, con 1 de cada tres encuestados diciendo que no confÃan en la informaciÃ³n que proporcionan el big data. Sin embargo, la tecnologÃa de el big data trata de mitigar ese problema tanto como sea posible.

Â¿De quÃ© forma se guardan y regulan el big data?

Dado lo grande que son los datos, la instalaciÃ³n de almacenaje de dicha informaciÃ³n ha de ser del mismo modo masiva, Â¿cierto?? Bueno, depende de la cantidad de dinero y espacio que su empresa tenga libre. Ciertos centros de datos mÃ¡s grandes del planeta engloban millones de metros cuadrados y cobijan miles y miles de millones de dÃ³lares estadounidenses en equipos de servidores. Para su pequeÃ±a empresa, no obstante, un rack de servidores con terabytes de almacenaje podrÃa ser suficiente.

Si bien probablemente halle muchas empresas que dependen de soluciones fÃsicas para alojar sus sistemas de ficheros, como un enorme almacÃ©n de datos o bien un servidor a gran escala, otras empresas han recurrido a soluciones de almacenaje basadas en la nube, como las que ofrecen Google y Amazon Web Services. En los dos casos, los datos pueden guardarse mientras que tengan espacio.

En lo que se refiere a la regulaciÃ³n de big data, el gobierno federal de los EE.UU. ha tomado un enfoque de no intervenciÃ³n en el tema. En cambio, las leyes de privacidad existentes tienden a observar el big data y las corporaciones que procuran participar en ellos. Las leyes de privacidad en USA suelen centrarse en industrias especÃficas que tratan con informaciÃ³n sensible, como las instituciones financieras que utilizan informaciÃ³n personal no pÃºblica, que debe ajustarse a la Ley Gramm-Leach-Bliley. De igual forma, los proveedores de servicios de salud que emplean big data deben cerciorarse de que los datos estÃ©n asegurados en cumplimiento de la Ley de Portabilidad y Responsabilidad de los Seguros MÃ©dicos (HIPAA).

Jacqueline Klosek, letrada senior de Goodwin Procter LLP, afirmÃ³ en un blog post para Taylor Wessing que las compaÃ±Ãas de manera frecuente alteran los datos para quitar cualquier informaciÃ³n de identificaciÃ³n sensible. Ese paso se da en general antes de que los cientÃficos analicen los datos o antes de que se envÃen a un tercero.

Bajo el GLBA, la definiciÃ³n de 'informaciÃ³n financiera reconocible personalmente' excluye especÃficamente: 'la informaciÃ³n que no identifica a un consumidor, como la informaciÃ³n agregada o los datos ciegos que no contienen identificadores personales como nÃºmeros de cuenta, nombres o bien direcciones', escribiÃ³ Klosek. Asimismo existen salvedades a los requisitos de privacidad para los datos no identificados en razÃ³n de la HIPAA. Las compaÃ±Ãas que empleen datos rigurosamente anonimizados deberÃ¡n seguir asegurÃ¡ndose de que su conducta cumple con sus propias polÃticas de privacidad y obligaciones establecidos y, como es natural, van a deber asegurarse de que los datos en cuestiÃ³n sean verdaderamente anÃ³nimos.

A medida que el big data aumentan en alcance, es sÃ³lo cuestiÃ³n de tiempo antes de que la legislaciÃ³n rija los usos de los datos privados. A nivel estatal, algunas partes del paÃs ya han comenzado a tomar medidas.

Las grandes soluciones de datos pueden batallar para proporcionar anÃ¡lisis en tiempo real

Trabajo en una investigaciÃ³n de mercado de los integradores de sistemas (SI) que implementan sistemas de administraciÃ³n de guardes (WMS). TenÃa la impresiÃ³n de que los distribuidores de software escriben el software, y o bien los SI o/y la empresa de software incorporan el software. No es tan sencillo. En ocasiones los integradores de sistemas escriben software que complementa las soluciones WMS que incorporan. Estas SI han aprendido las debilidades de varios sistemas y han escrito aplicaciones complementarias para cerrar las brechas.

Un ejemplo viene de un integrador de sistemas llamado Longbow Advantage. Ellos crearon un producto llamado Rebus desarrollado para prosperar el reporte en tiempo real de las soluciones WMS.

HablÃ© con un directivo de la cadena de suministro de una empresa de fabricaciÃ³n que habÃa implementado Rebus. Este directivo me dijo que habÃan sustituido una soluciÃ³n WMS de una compaÃ±Ãa ERP con una de las mejores soluciones de la raza. El directivo me dijo: Logramos toda la funcionalidad que esperÃ¡bamos. HabÃa toneladas de funcionalidad - cosas como el intercalado de labores y el soporte para el crossdocking. Pero tenÃamos una brecha en la visibilidad del trabajo que se hacÃa. El informe en tiempo real del trabajo era mÃ¡s dÃ©bil de lo aguardado.

Las soluciones WMS son sistemas de Big Data con bases de datos de producciÃ³n. La base de datos de producciÃ³n se encarga de dar tareas a los trabajadores del almacÃ©n y de proseguir la realizaciÃ³n de esas tareas. Toda la lÃ³gica de optimizaciÃ³n tambiÃ©n interacciona con la base de datos de producciÃ³n. Los trabajadores del almacÃ©n utilizan pistolas de radiofrecuencia para cerciorarse de que estÃ¡n recogiendo de las ranuras adecuadas, para indicar al sistema que han completado una labor y para obtener sus prÃ³ximas asignaciones. Al acceder a la base de datos de producciÃ³n, las pistolas RF se ralentizan hasta un grado inadmisible, quizÃ¡ varios segundos para conseguir una tarea. Esto es una eternidad en un almacÃ©n muy frecuentado.

AsÃ que en vez de obtener anÃ¡lisis detallados, y resguardar la base de datos de producciÃ³n de WMS, se golpea un archivo, lo que quiere decir que los anÃ¡lisis son, en el mejor de los casos, de mÃºltiples horas de antigÃ¼edad. SegÃºn Alex Wakefield, el CEO de Longbow Advantage, las soluciones basadas en la nube no mejoran las cosas. Las compaÃ±Ãas de software siempre y en todo momento pueden poner mÃ¡s potencia de computaciÃ³n en un problema, mas mÃ¡s servidores no ayudarÃ¡n a los clientes del servicio a acceder a sus datos de manera mÃ¡s eficiente. Eso es un problema de estructura de la base de datos.

La soluciÃ³n de Rebus usa una base de datos de documentos - una base de datos NoSQL de Mongo.Â Esta tecnologÃa permite que los grandes conjuntos de datos sean accedidos y analizados considerablemente mÃ¡s rÃ¡pidamente. Las transacciones creadas en el WMS asimismo fluyen en la soluciÃ³n Rebus. La compaÃ±Ãa manufacturera con la que hablÃ© afirmÃ³ que pueden obtener anÃ¡lisis que se fundamentan en transacciones que estÃ¡n a menos de 5 minutos de lo que ocurre en el piso del almacÃ©n. Dentro de los sesenta dÃas de la contrataciÃ³n, estos anÃ¡lisis de tiempo cercano se hicieron totalmente disponibles. Pero incluso dentro de los primeros treinta dÃas recibÃamos contenido, afirmÃ³ el directivo. Longbow Advantage entendiÃ³ las estructuras de datos que hicieron que esto fuera mÃ¡s parecido a una implementaciÃ³n de una soluciÃ³n off the shelf que a un proyecto de anÃ¡lisis personalizado.

Ahora este fabricante puede hacer preguntas como Â¿CuÃ¡ntos camiones estÃ¡n en el patio y listos para ser descargados? Los gerentes pueden monitorear todo el trabajo de salida que tiene que suceder durante el dÃa y ver de quÃ© manera avanza el dÃa. Por servirnos de un ejemplo, Â¿se hacen los pedidos de salida que deben hacerse para un envÃo de siete am? Hora por hora, se pueden monitorear las estadÃsticas de los objetivos de recolecciÃ³n y empleo de AGV. Si el almacÃ©n se queda atrÃ¡s, el gerente puede pesquisar en los datos y entender lo que estÃ¡ ocurriendo y lo que se podrÃa hacer para regresar a la normalidad. Si el almacÃ©n se mueve ya antes de lo previsto, el gerente puede solicitar voluntarios que deseen regresar a casa temprano. Esta operaciÃ³n tiene pantallas de T.V. que muestran los anÃ¡lisis en tiempo real, con lo que no sÃ³lo los gerentes tienen acceso a lo que estÃ¡ sucediendo. En Ãºltima instancia, segÃºn este director de logÃstica, esta soluciÃ³n nos permite y responde a la pregunta 'Â¿Estoy adelante o bien atrÃ¡s? Â¿Gano o bien perdiendo el dÃa?

El director de la cadena de suministro terminÃ³ diciendo, tambiÃ©n aprovechamos a Rebus para archivar nuestros datos WMS.Â Esto nos deja obtener anÃ¡lisis de los datos histÃ³ricos en segundos.Â Esto ha sido extremadamente Ãºtil para rastrear el movimiento de productos dentro y fuera de nuestra red.Â Similar a nuestros datos WMS en vivo, Rebus es una parada para adquirir datos archivados en nuestros sitios.

Los cinco pasos primordiales para una buena ciencia de los datos

Bastante gente habla de la ciencia de los datos. Pocos saben de quÃ© estÃ¡n hablando y aÃºn menos son conscientes de cÃ³mo funciona. Pero, se usa en todas partes hoy dÃa, asÃ que incluso si no eres un cientÃfico de datos, es bueno saber cuÃ¡les son los pasos bÃ¡sicos. AcÃ¡ hay 5 pasos bÃ¡sicos para la ciencia de los datos.

Â¿Por quÃ© razÃ³n lo haces?Â Â¿EstÃ¡s resolviendo un problema? Â¿QuÃ© problema es? La ciencia de los datos no es una salsa que se esparce sobre las cosas para mejorarlas de alguna manera. Es una forma de abordar los inconvenientes. Sepa quÃ© inconveniente intenta solucionar su empresa antes de pedirle a la ciencia de los datos que lo resuelva.

Recopile los datos.Â Cuando conozca la razÃ³n de su negocio, su cientÃfico de datos puede comenzar a descubrir quÃ© datos pertenecen a Ã©l y recogerlos. No se limite a escoger los datos disponibles o se arriesgue a introducir un corte.

Analice los datos.Â El anÃ¡lisis exploratorio de datos (EDA) es el enfoque mÃ¡s frecuente. Revela lo que los datos pueden decirle. El EDA suele ser bueno para descubrir las Ã¡reas en las que se quiere compendiar mÃ¡s datos. Un buen EDA emplea un conjunto predefinido de directrices y umbrales para ayudar a superar el sesgo.

Construya sus modelos y pruebe si son vÃ¡lidos.Â Cuando haya analizado los datos puede hacer su modelo de aprendizaje automÃ¡tico que tiene como propÃ³sito suministrar una buena soluciÃ³n al inconveniente de la empresa. Antes de establecer un modelo, asegÃºrese de experimentar con algunas opciones y ciclos de validaciÃ³n adecuados.

Resultados.Â Ejecute el modelo y tambiÃ©n interprete los resultados. Bastante gente no se percata de que la inteligencia artificial no solo le afirma la soluciÃ³n a su inconveniente. Los modelos de aprendizaje automÃ¡tico ofrecen resultados que los humanos interpretan. Los conocimientos de los cientÃficos de datos son los que hacen que el resultado sea algo sobre lo que se pueda actuar.

Seguro que esto hace que suene asÃ de fÃ¡cil, y obviamente cualquier cientÃfico de datos sabe que la prueba estÃ¡ en todo ese trabajo para hacer que estas cosas sucedan, pero conocer lo bÃ¡sico puede ayudar a tomar mejores resoluciones que van a ayudar a sus cientÃficos de datos a hacer mejor su trabajo. Todo el planeta gana. Aun la mÃ¡quina.

Certificaciones en ciencias de la informaciÃ³n para mejorar tu currÃculo y tu sueldo.

A finales de agosto, Glassdoor tenÃa mÃ¡s de cincuenta y tres ofertas de trabajo que mentaban el aprendizaje automÃ¡tico (ML) y veinte trabajos que incluÃan la ciencia de los datos con salarios que iban de cincuenta a mÃ¡s de 180.000 dÃ³lares americanos. Poco a poco mÃ¡s empresas estÃ¡n haciendo del anÃ¡lisis de datos y del aprendizaje automÃ¡tico un factor central del desarrollo de nuevos productos y de las oportunidades de ingresos futuros.

Las grandes empresas de tecnologÃa, como las organizaciones tecnolÃ³gicas independientes, ofrecen programas de capacitaciÃ³n para personas que son nuevas en la ciencia de los datos, de este modo para profesionales que quieren dominar la tecnologÃa mÃ¡s reciente. Cada programa de esta lista de los mejores cursos online para la ciencia de los datos Blog de big data ampliarÃ¡ su experiencia y aÃ±adirÃ¡ un valioso elemento de lÃnea en forma de certificaciÃ³n de ciencia de los datos a su currÃculum.

AnalÃtica certificada CertificaciÃ³n profesional

Este programa, que es neutral en cuanto a los distribuidores, estÃ¡ dirigido a profesionales de la analÃtica en la primera fase o intermedia de sus carreras. Los solicitantes precisan una licenciatura y cinco aÃ±os de experiencia profesional o una maestrÃa con 3 aÃ±os de experiencia laboral. Todos y cada uno de los candidatos al examen firman un cÃ³digo de moral y deben presentar una referencia de un empleador para confirmar las habilidades sociales.

El examen se fundamenta en el anÃ¡lisis de tareas del trabajo y cubre siete Ã¡reas:

El inconveniente de la enmarcaciÃ³n de los negocios

El anÃ¡lisis de los problemas de enmarcado

Data

SelecciÃ³n de la metodologÃa

ConstrucciÃ³n de modelos

Despliegue

GestiÃ³n del ciclo de vida

Hay 100 preguntas de opciÃ³n mÃºltiple en el examen. El precio base de la certificaciÃ³n CAP es de seiscientos noventa y cinco dÃ³lares o bien cuatrocientos noventa y cinco dÃ³lares para los miembros del Instituto de InvestigaciÃ³n de Operaciones y Ciencias de la AdministraciÃ³n (INFORMS). INFORMS ofrece una clase de preparaciÃ³n para el examen.

Una nueva versiÃ³n del examen va a ser lanzada el 1 de enero de 2021 y puede ser tomada en lÃnea.

Mesa de especialista de escritorio

El anÃ¡lisis de datos es inÃºtil a menos que motive la acciÃ³n. Eso de forma frecuente requiere hacer un caso basado en este anÃ¡lisis y presentarlo a los colegas de otros departamentos. Visualizar los datos en lugar de confiar sÃ³lo en los nÃºmeros puede ayudar a ganarse a las personas que no tratan con datos a diario. Tableau puede ayudarte a hacer eso.

El certificado de Especialista en Escritorio de Tableau mostrarÃ¡ que usted tiene una entendimiento bÃ¡sica de esta herramienta de visualizaciÃ³n de datos. La compaÃ±Ãa sugiere que los examinadores tengan por lo menos 3 meses de experiencia con la plataforma. El programa de preparaciÃ³n para el examen de Especialista en Escritorio Tableau es un programa de 6 semanas de adiestramiento interactivo, lecciones y hasta 2 intentos para el examen de certificaciÃ³n.

El examen tiene treinta preguntas y ha de ser completado en sesenta minutos. Los examinandos deben conseguir un 70 por cien para aprobar. El examen mide estas habilidades:

Crear y guardar conexiones de datos

La gestiÃ³n de las propiedades de los datos

Creando grÃ¡ficos bÃ¡sicos

Aplicar el anÃ¡lisis a una hoja de trabajo

Crear y modificar un tablero de mandos

ComprensiÃ³n de las dimensiones y medidas

Dominar los campos discretos y continuos