Comience con el aprendizaje automático

Comience con el aprendizaje automático

  • Big Data
  • febrero 11, 2022
  • No Comment
  • 241
  • 11 minutes read


La IA ética se ha convertido en los últimos años en un área de creciente preocupación para las organizaciones. Los avances en el desarrollo y la aplicación de algoritmos de aprendizaje automático (ML) y aprendizaje profundo (DL) requieren un mayor cuidado para garantizar que no se pierda la ética integrada en los sistemas anteriores basados ​​en reglas. Esto ha llevado a que la IA Ética se convierta en un búsqueda cada vez más popular Concepto y objeto de muchas ramas. Informes de analistas y documentos. Sin embargo, para comprender qué es la IA ética, debemos tener al menos una comprensión básica de ML, los modelos de ML y el ciclo de vida de la ciencia de datos y cómo se relacionan entre sí. Esta publicación de blog tiene como objetivo proporcionar esa comprensión básica.

¿Qué es el aprendizaje automático?

El aprendizaje automático es un subcampo prometedor de la inteligencia artificial (IA) donde los modelos no están predefinidos explícitamente. En cambio, se aprenden entrenando un modelo con datos. El rendimiento del modelo generalmente mejora a medida que se accede a más datos. La fase de entrenamiento del modelo consiste en aplicar un algoritmo de ML a los datos de entrenamiento y determinar los parámetros óptimos del modelo.

Figura 01: Inteligencia artificial – Resumen en una página

ML y el subdominio de DL se pueden aplicar a un número creciente de casos de uso. Estos incluyen análisis de opinión del cliente, mantenimiento predictivo, sistemas de piloto automático de vehículos, detección de fraude y chatbots. Cada uno de estos casos de uso requiere resolver una o más familias de problemas. Algunos de los problemas más comunes son la clasificación, las redes neuronales convolucionales (CNN), las redes neuronales recurrentes (RNN), la regresión, la agrupación, el aprendizaje por refuerzo y la detección de anomalías. Cada uno de estos se cubre con más detalle en este resumen. hoja de trucos.

¿Qué es un modelo de aprendizaje automático?

Un modelo de ML toma datos de entrada (texto, números, imágenes, etc.) y genera datos basados ​​en el comportamiento de lo que se está modelando para proporcionar una predicción.

Figura 02: Cómo funciona un modelo ML

Por ejemplo, considere un modelo que predice el precio de venta esperado de una propiedad. Un modelo simple puede tomar datos como la ubicación de la propiedad, el número de habitaciones y el tamaño de la propiedad y generar el valor de venta esperado. Este es un modelo de regresión porque el resultado es una predicción numérica, el valor de ventas esperado.

Para que un modelo se clasifique como modelo de ML, debe haber sido creado usando un algoritmo de ML y datos de entrenamiento. En el caso del ejemplo del precio de venta de bienes raíces, generalmente seguimos un enfoque de aprendizaje supervisado, donde los datos de entrenamiento contienen valores de entrada y salida.

El modelo se entrena a través de un proceso iterativo que compara algunos errores entre lo que predice el modelo (el valor minorista estimado) y lo que realmente debería ser según los datos de entrenamiento. Con cada iteración, los parámetros que controlan el comportamiento del modelo se ajustan para que la próxima iteración de predicciones sea más precisa.

Capacitación de modelos como parte del ciclo de vida de la ciencia de datos

Antes de que se pueda entrenar un modelo de ML, se deben recopilar y preparar datos, a menudo de múltiples fuentes. Esto puede incluir la eliminación de valores atípicos, el tratamiento de los valores faltantes y el tratamiento del sesgo. También necesitamos comprender el dominio o contexto de lo que se está modelando y examinar los datos para buscar distribuciones y correlaciones significativas. Con esta comprensión básica, necesitamos evaluar y comparar el rendimiento de diferentes algoritmos de ML, entrenar el modelo de mejor rendimiento o combinar los modelos en un conjunto. Luego implementamos el modelo y medimos su rendimiento continuo. Juntas, estas fases forman el ciclo de vida iterativo de la ciencia de datos, como se resume en la Figura 03 a continuación.

Figura 03: El ciclo de vida de la ciencia de datos

Si en cualquier etapa del proceso cambiamos los datos de entrada, cómo se preparan los datos, el algoritmo de ML utilizado para construir el modelo o cómo se ajusta el modelo, es casi seguro que el modelo resultante será diferente. Estas actividades son generalmente una función de las operaciones de ML (ML Ops).

Cuando tenemos una imagen clara y completa de cada fase del ciclo de vida de la ciencia de datos para un modelo, eso representa el linaje del modelo Con el tiempo, a medida que se entrenan nuevos modelos, cada uno tendrá su propio linaje único. El linaje del modelo nos permite rastrear un modelo hasta su origen y tener confianza en sus predicciones.

¿Por qué es importante la ascendencia modelo?

El linaje del modelo es uno de los cinco componentes clave que contribuyen a la gobernanza del modelo. Es probablemente el más importante. Junto con la visibilidad, la explicabilidad, la interpretabilidad y la reproducibilidad del modelo, forman parte de la base necesaria para realizar una IA ética.

Mi próxima publicación de blog se basa en lo que acabamos de discutir y entra en más detalles sobre los cinco componentes de la gobernanza modelo. También explorará cómo Cloudera Machine Learning (CML) admite una gobernanza de modelos sólida e introducirá brevemente algunos elementos de cómo CML admite operaciones de aprendizaje automático eficaces a nivel empresarial.

Para obtener más información sobre el aprendizaje automático, visite Cloudera’s Laboratorios de avance rápido o póngase en contacto con nosotros directamente.

Related post

Aprendizaje eficiente de video-texto con co-tokenización iterativa

Aprendizaje eficiente de video-texto con co-tokenización iterativa

Publicado por AJ Piergiovanni y Anelia Angelova, científicos investigadores, Google Research, Brain Team Los videos son una fuente omnipresente de contenido…
Una introducción a la recuperación ante desastres con la plataforma de datos Cloudera

Una introducción a la recuperación ante desastres con la…

Publicado en Técnicamente | 09 de agosto de 2022 4 leer minuto Durante la última década, la integración de datos y…
Hugo Boss permite a los compradores construir un modelo digital con AR

Hugo Boss permite a los compradores construir un modelo…

Pruébate ropa de alta gama virtualmente con la tecnología PICTOFiT de Reactive Reality. No hay nada peor que comprar una nueva…

Leave a Reply

Tu dirección de correo electrónico no será publicada.