El valor comercial de los servicios de aprendizaje automático, análisis y lagos de datos de AWS
Published on 29 Oct 2022
Según IDC, para 2022, más del 46% del PIB mundial estará digitalizado, y el crecimiento estará impulsado por servicios, procesos y asociaciones mejorados digitalmente en todos los sectores.
Una transformación digital exitosa depende de la transformación de los datos en información procesable, y esta creciente dependencia de la información basada en datos está ayudando a marcar el comienzo de una nueva era de datos. Los datos de cada organización se están convirtiendo rápidamente en un activo estratégico. Las empresas exigen más valor de sus datos, que están más diversificados y se expanden a un ritmo exponencial. Las capacidades de análisis e inteligencia artificial/aprendizaje automático (IA/ML) que utilizan muchos usuarios dentro de una empresa ayudarán a estas actividades de transformación digital (DX).
Tradicionalmente, las empresas han empleado almacenes de datos aislados (por ejemplo, uno para sistemas ERP y otro para sensores y datos de redes sociales) como repositorio de datos integrados de una o más fuentes dispares, así como un sistema para la generación de informes y el análisis de datos para varios grupos. Sin embargo, dado que los sistemas de almacenamiento de datos (DW) convencionales no son escalables, las empresas están cambiando cada vez más a diseños de lagos de datos, que amplían o mejoran los DW clásicos, almacenan cualquier dato en cualquier formato, son duraderos y accesibles, y pueden crecer hasta alcanzar un tamaño de exabytes. Además, las organizaciones quieren infraestructuras de lagos de datos que sean seguras, compatibles y auditables, y que puedan ejecutar cualquier forma de aplicaciones de análisis y aprendizaje automático.
AWS ofrece una infraestructura abierta, segura, escalable y rentable que permite crear lagos de datos y análisis fáciles de crear para satisfacer las cambiantes necesidades de los clientes. Las empresas pueden utilizar la tecnología adecuada para la tarea sin tener que migrar o modificar los datos para diversas metodologías de análisis. AWS ofrece una colección completa de capacidades que se extienden más allá de las funciones de seguridad típicas, como el cifrado y el control de acceso, hasta la supervisión proactiva y la gestión unificada de políticas de seguridad.
IDC entrevistó a 11 empresas que emplean lagos de datos, análisis y servicios de aprendizaje automático de AWS para confirmar las ventajas de la solución de AWS. Según los datos de la encuesta recibidos y aplicados al modelo de valor comercial de IDC, los participantes del estudio están obteniendo un valor sustancial de AWS. Según IDC, los participantes del estudio se beneficiarán de un beneficio anual promedio de $6,15 millones por empresa ($100,4K por aplicación comercial), lo que se traducirá en un retorno de la inversión (ROI) de cinco años del 415% mediante:
- Proporcionar a las empresas lagos de datos, análisis y servicios de aprendizaje automático que sean flexibles, escalables, rentables y de alto rendimiento.
- Reducir la cantidad de tiempo dedicado a administrar y respaldar lagos de datos, análisis y actividades de aprendizaje automático
- Aumentar la eficiencia de los equipos de análisis mejorando el acceso a los datos y las herramientas analíticas
- Permitir a las empresas realizar más consultas analíticas y, al mismo tiempo, reducir el tiempo necesario para completar cada consulta
Descripción general de los servicios de aprendizaje automático, análisis y lagos de datos de AWS
AWS ofrece una gama integrada de servicios que pueden ayudarlo a establecer y administrar un lago de datos para realizar análisis de manera rápida y eficiente. Los lagos de datos impulsados por AWS pueden administrar el volumen, la agilidad y la flexibilidad necesarios para combinar varios tipos de datos y metodologías analíticas para generar información más detallada. AWS ofrece a los usuarios una amplia gama de servicios de análisis y aprendizaje automático que permiten un acceso rápido a todos los datos esenciales y, al mismo tiempo, mantienen la seguridad y el control.
Para lograr los conocimientos y las respuestas adecuados, la analítica moderna implica una variedad de metodologías analíticas, que incluyen almacenamiento de datos, procesamiento de Big Data, ETL, BI, analítica de streaming y analítica operativa. Los desarrolladores construyen programas analíticos en una variedad de lenguajes, incluidos R, Scala y Python, según cuál sea el más adecuado para sus casos de uso individuales. Jupyter Notebook, una aplicación en línea interactiva, de código abierto y gratuita que permite a los desarrolladores crear y compartir documentos con código en vivo, ecuaciones, visualizaciones y prosa narrativa, ha ganado popularidad en los últimos años. Esta rápida adopción ha sido respaldada por una comunidad apasionada de usuarios y desarrolladores y una arquitectura renovada que permite que el notebook hable docenas de lenguajes de programación.
Es posible realizar limpieza y transformación de datos, simulación numérica, modelado estadístico, visualización de datos, aprendizaje automático y muchas otras aplicaciones. AWS ofrece una sólida colección de servicios de análisis que funcionan en el lago de datos abierto, lo que permite a las organizaciones utilizar la herramienta correcta para el trabajo sin tener que migrar o modificar los datos para cada método de análisis. AWS ofrece una colección completa de capacidades que se extienden más allá de las funciones de seguridad típicas, como el cifrado y el control de acceso, hasta la supervisión proactiva y la gestión unificada de políticas de seguridad.
AWS ofrece una variedad de alternativas para transferir datos a la nube, incluida la migración de datos locales en lotes o en masa y el movimiento de datos en tiempo real. Una vez que los datos están listos para la nube, Amazon S3 y Amazon Glacier simplifican el almacenamiento de datos en cualquier formato, de forma segura y a gran escala. Amazon S3 es un servicio de almacenamiento de objetos seguro, escalable y duradero. Amazon Glacier es un servicio web que ofrece almacenamiento de archivos en línea para la conservación y copia de seguridad de datos. AWS Glue proporciona automáticamente un catálogo único en el que los clientes pueden buscar y consultar para ayudarlos a encontrar los datos adecuados para utilizar en su investigación.
AWS ofrece una amplia gama de servicios analíticos de bajo costo que operan en el lago de datos. Cada servicio analítico está diseñado específicamente para una variedad de casos de uso analíticos, incluidos análisis interactivos, procesamiento de big data con Apache Spark y Hadoop, almacenamiento de datos, análisis en tiempo real, análisis operativos, paneles y visualizaciones. Estos servicios están diseñados para funcionar en conjunto para brindar una experiencia analítica unificada.
Descargue el documento técnico de IDC para obtener más información sobre AWS Data Analytics Machine Learning. El documento técnico en formato PDF está disponible únicamente en Whitepapers Online.