Cómo energizar los datos detrás de la IA

Cómo energizar los datos detrás de la IA

  • Big Data
  • mayo 15, 2022
  • No Comment
  • 27
  • 9 minutes read


La inteligencia artificial (IA) es una de las mayores tendencias tecnológicas de la próxima década. Cada vez más Digital mundo, la difusión y recopilación de datos son el estado estándar de los negocios modernos, y así sucesivamente Internet Actividad. El problema de las empresas ya no es la falta de datos, sino el exceso. A pesar de la enorme cantidad de datos disponibles para las empresas industriales, sus sistemas de inteligencia artificial no brindan la información que la mayoría espera. La solución radica en filtrar los datos para que los datos correctos lleguen a los sistemas de IA. Este enfoque inteligente de los datos permitirá que los sistemas de IA generen el tipo de información que esperamos.

¿Qué son los datos inteligentes?

La IA es un componente clave del cuarto Digital Revolución. La IA saca a la luz conocimientos de big data, conocimientos que ningún ser humano podría sacar a la luz. Cuantos más datos tiene la IA, más variables tiene, más largas son sus escalas de tiempo y mayor es su granularidad, mayor es el conocimiento potencial que tiene.

AI puede usar años de datos para determinar los parámetros óptimos para procesos industriales usando variables de control. Estos conocimientos se pueden utilizar en estos sistemas industriales para que funcionen mejor que antes.

A pesar de la promesa de la IA, muchas empresas industriales aún no se han dado cuenta de los beneficios de difundir y recopilar tanta información. Según MacKinsey, aunque el 75 % de las empresas industriales ha probado algún tipo de sistema de IA, solo el 15 % se ha beneficiado de impactos significativos y escalables de la IA. McKinsey identifica la falta de conocimientos operativos sobre el uso de la IA. Este enfoque puede tener éxito, pero generalmente solo dentro de parámetros muy específicos y, a menudo, con reentrenamiento frecuente, muchos aportes y, a veces, conduce a resultados físicos o poco realistas. Como tal, estos modelos de IA no se pueden usar en el mundo real ni para lograr el tipo de cambios significativos que esperan los usuarios. Lo que obtienes son equipos frustrados con el sistema y perdiendo la fe en la IA.

Los datos inteligentes son la solución. Aprovechar los grandes datos para obtener el tipo de información esperada requiere que los datos tengan menos variables impulsadas por la ingeniería de funciones basada en principios fundamentales. Esta transformación de datos para producir datos inteligentes, complementada con una formación más adecuada, puede resultar en retornos superiores de entre el 5% y el 15%.

Los datos inteligentes se han definido de varias maneras, pero las características esenciales son que se refieren a datos que se prepararon y organizaron donde se recopilaron para que estén listos y optimizados para el análisis de datos con mayor calidad, velocidad e información.

En una conferencia de 2018, Donna Ray, entonces directora ejecutiva de la Oficina de Servicios e Intercambio de Información del Departamento de Seguridad Nacional de EE. UU., dijo que sus equipos dedican aproximadamente el 80 % de su tiempo a buscar, recopilar y preparar datos. análisis. El enfoque de datos inteligentes ha ayudado a las agencias federales a optimizar sus procesos y hacer que sus operaciones sean más rápidas e inteligentes. Datos inteligentes descritos por cable porque Smart Data en realidad significa información significativa.

¿Cómo se generan datos inteligentes?

Veamos cinco pasos para crear datos inteligentes.

Definir los datos

El primer paso para crear datos inteligentes es definir el proceso. Esto significa que los procesos deben dividirse en pasos claramente definidos y los cambios físicos y químicos deben describirse para los ingenieros de planta y los expertos de la empresa. Los instrumentos y sensores críticos para el negocio, como Seguridad inalámbrica, deben identificarse los valores límite, los períodos de mantenimiento, las unidades de medida y su controlabilidad. En los sistemas físicos existen elementos de determinismo regidos por ecuaciones claras. Estas ecuaciones deben anotarse junto con sus variables. Los equipos también necesitan comprender la literatura sobre estas ecuaciones para mejorar su propia comprensión.

Enriquecer los datos

Todos hemos escuchado la frase «entrada de datos incorrectos, salida de datos incorrectos», pero la realidad es que todos los datos son datos incorrectos en algún sentido. Los datos de proceso sin procesar siempre tienen algunos defectos. Así que su tarea es mejorar la calidad de la registro, en lugar de aumentar la cantidad de datos disponibles. La información transitoria debe resolverse agresivamente.

Reducir la dimensionalidad

La IA construye modelos haciendo coincidir los observables con las características. Para obtener un modelo generalizado, el número de observaciones debe exceder con creces el número de características. Las entradas a menudo se combinan para generar nuevas funciones. Teniendo en cuenta la gran cantidad de sensores que tiene una planta típica, el resultado es un gran tesoro de observaciones. Sin embargo, lo que se debe hacer es usar entradas que describan los procesos físicos involucrados, guiados por ecuaciones deterministas para reducir su dimensionalidad mientras se crean características que contienen información sensorial combinada inteligentemente.

Aplicar el aprendizaje automático

Los procesos industriales tienen componentes deterministas y estocásticos. Las funciones basadas en el primer principio proporcionan los componentes deterministas y el aprendizaje automático los estocásticos. Las características deben puntuarse para evaluar su importancia y poder explicativo. Idealmente, las más importantes deberían ser funciones desarrolladas por expertos.

Las mejoras de la planta deben ser el foco de los modelos en lugar de lograr la máxima precisión predictiva. Todos los datos de proceso se caracterizan por altas correlaciones. Por lo tanto, las correlaciones pueden carecer de sentido. Lo que se necesita es aislar los elementos causales y las variables controlables.

Implementar y validar modelos.

Para disfrutar realmente del efecto significativo esperado, se deben implementar modelos. Los resultados deben evaluarse continuamente examinando las características clave para determinar si son consistentes con los procesos físicos. Los diagramas de dependencia parcial también deben verificarse para que podamos aprender sobre la causalidad y los elementos controlables deben confirmarse.

Es necesario consultar a los equipos de operaciones y convertirlos en un miembro crítico del proceso para comprender mejor qué es procesable y qué expectativas de desempeño tienen sentido. Los operadores de la sala de control deben recibir los resultados del modelo a medida que se generan, o los equipos deben realizar pruebas de encendido y apagado para que esto sea posible. administración determinar si vale la pena invertir capital en soluciones completas.

Conclusión

La IA es tremendamente prometedora, y dada la abundancia de datos que se difunden y recopilan hoy en día, ciertamente es contrario a la intuición sugerir que se deben colocar límites o barandillas alrededor de esos datos. Sin embargo, los grandes datos a menudo no brindan información significativa sobre IA. Los datos inteligentes pueden garantizar que la IA pueda tener el impacto significativo que esperamos.

La publicación Cómo energizar los datos detrás de la IA apareció primero en Datafloq.

Related post

Cómo la IA ayudará a abordar los problemas de exceso de existencias del mañana

Cómo la IA ayudará a abordar los problemas de…

El mundo cadena de suministro no es fácil de manejar. Líneas complejas conectan piezas fabricadas y piezas de casi todas las…
Cómo los objetos tecnológicos brillantes distraen la atención de la política climática

Cómo los objetos tecnológicos brillantes distraen la atención de…

Soy ingeniero de formación y me encantan las cosas nuevas. Los últimos gadgets, ideas, diseños. Pero cuando se trata del clima,…
Premios de socios globales de ladrillos de datos 2022

Premios de socios globales de ladrillos de datos 2022

Databricks tiene un ecosistema de socios de más de 600 socios en todo el mundo que son fundamentales para crear y…

Leave a Reply

Tu dirección de correo electrónico no será publicada.