Cómo aumentar la participación de los fanáticos de los deportes con datos e IA

Cómo aumentar la participación de los fanáticos de los deportes con datos e IA

  • Big Data
  • marzo 31, 2022
  • No Comment
  • 56
  • 17 minutes read


Solo tomó una sola diapositiva.

En 2021, el vicepresidente sénior de desarrollo comercial de clubes de la Liga Nacional de Fútbol Americano (NFL), Bobby Gallo, presentó a los propietarios de los equipos de la NFL una sola diapositiva con cinco logotipos de equipos: los Cincinnati Bengals, los Detroit Lions, los Jacksonville Jaguars, los New York Jets y los comandantes de Washington. Era una lista de equipos con al menos 15.000 entradas sin vender de media para la próxima temporada. Gallo instó a todos los equipos de la NFL a pensar en lo que podrían hacer para mejorar la venta de boletos y la participación de los fanáticos, un problema que afecta no solo a la NFL sino a muchos equipos deportivos profesionales en todo el país.

En 2007, un promedio de más de 32.500 aficionados asistieron a cada partido de Major League Baseball (MLB). Desde entonces, la asistencia ha caído un 11 % a 29 000 en 2019 y otro 34 % a 19 000 en 2021, cuando los estadios no funcionaron a su máxima capacidad durante toda la temporada debido al COVID-19, el mínimo en 37 años.

El rendimiento del equipo también provoca fluctuaciones en la asistencia y el compromiso. Cuando comenzó la octava semana de la temporada 2021 de la NFL, los Detroit Lions sin victorias tenían solo 47,000 fanáticos en Ford Field para el juego, que fue la primera vez que la asistencia cayó por debajo de 50,000 en 10 años. Dado que estas tendencias tienen un impacto significativo en los ingresos, ahora es más importante que nunca que los equipos mejoren y cambien la experiencia del estadio. El uso de datos para obtener una ventaja competitiva se ha documentado durante mucho tiempo en los deportes electrónicos, pero lo que a menudo permanece sin explotar es la aplicación de datos e inteligencia artificial para transformar la «experiencia de los fanáticos» para aumentar los ingresos y el ciclo de vida del cliente.

A continuación, se muestra cómo los equipos deportivos profesionales utilizan tecnologías como Databricks para mejorar la experiencia en el estadio, aumentar la participación de los fanáticos y mejorar el valor de por vida de los fanáticos.

El reto

Antes no había nada mejor que ver un partido en el estadio, cancha o arena. Sin embargo, esta experiencia no siempre ha sido la salida más placentera, ya sea debido al aumento de los precios de los boletos, la comida y la cerveza; inclemencias del tiempo o esperas insoportables para ir al baño. Esto es cierto cuando miras las regiones. Por ejemplo, los fanáticos de los equipos del medio oeste que juegan en el invierno pueden tener que soportar asientos incómodos en temperaturas bajo cero, definitivamente no es una experiencia ideal. No hace falta decir que los equipos deportivos enfrentan numerosos desafíos y siempre están buscando formas de mejorar la asistencia y el compromiso de los fanáticos.

En Databricks, hemos tenido la oportunidad de trabajar con muchos equipos deportivos (consulte este blog para saber cómo los equipos de la MLB usan Databricks para la toma de decisiones en tiempo real) y ligas, y aprenda lo que ven como los principales impulsores que afectan la participación de los jugadores. y el juego afectan la asistencia. Por lo general, los equipos enfrentan tres obstáculos que tienen el mayor impacto en la disminución de la participación de los fanáticos:

  1. Experiencia en casa: Los fanáticos en casa disfrutan de una mejor vista de la acción con mayor comodidad y un costo significativamente menor. Las mejoras en la transmisión y la tecnología, como las cámaras Hawkeye que brindan repeticiones y revisiones instantáneas increíblemente detalladas, han contribuido a una mejor comprensión del juego. Considere cómo las emisoras están utilizando los programas de estadísticas para brindar información sobre el juego que los fanáticos en el estadio no pueden obtener: programas como Next Gen Stats de la NFL o Courtoptix de la NBA.
  2. Cambiar la demografía de los fans: Las generaciones más jóvenes simplemente están menos interesadas en ver deportes en vivo dadas sus opciones de entretenimiento preferidas, como jugar videojuegos, desplazarse por las redes sociales o usar servicios de transmisión. Estos fanáticos no están tan comprometidos con sus equipos favoritos como sus padres, y la experiencia de juego estática generalmente no les conviene.
  3. Aficionados al buen tiempo: Los equipos que se desempeñan bien y obtienen más victorias naturalmente tienen más fanáticos en sus juegos. Las temporadas en las que un equipo decide reconstruir no son tan emocionantes. En promedio, los equipos perdedores tienen una tasa de interacción un 50 % más baja en las plataformas de redes sociales que los equipos ganadores. El siguiente gráfico de Rival IQ muestra más esta correlación.
Correlación entre la participación de los fanáticos en las redes sociales y las victorias y pérdidas de los Miami Dolphins:
Fuente: «¿Qué equipo de la NFL tiene más fanáticos cuando hace buen tiempo?» por Rival IQ

Estos obstáculos afectan una de las mayores fuentes de ingresos para los equipos deportivos profesionales: los ingresos generados en los estadios por la venta de entradas, los vendedores y la mercancía. Los equipos deportivos que utilizan Databricks han desarrollado soluciones para abordar estos y otros desafíos. Al innovar la experiencia del estadio, estos equipos están impulsando el futuro de la participación de los fanáticos en los juegos.

Los equipos tienen acceso a una variedad de fuentes de datos que pueden aprovechar para aumentar los ingresos del estadio. Las redes sociales, el CRM, el punto de venta y el historial de compras son los más comúnmente disponibles. Usando una combinación de estos conjuntos de datos y modelos de aprendizaje automático, los equipos pueden comprender mejor a sus fanáticos y crear una experiencia personalizada para ellos. Veamos cómo los equipos usan Databricks para aprovechar estos datos a través de ofertas promocionales en el juego para los fanáticos.

recuperando los datos

Hay muchos puntos de interacción donde los fanáticos crean datos que los equipos valoran. Todo comienza cuando un aficionado compra una entrada. El equipo de un CRM o proveedor de venta de entradas los utiliza para recibir información básica como el precio de compra y el asiento, la dirección de casa, la dirección de correo electrónico y el número de teléfono. Las compras en el estadio de los proveedores dan como resultado un historial de compras para cada cliente, y dado que la mayoría de los estadios han hecho la transición al acceso y las compras móviles, la información de geolocalización también es un punto de datos típico al que pueden acceder los equipos. Aquí hay un ejemplo (ficticio) de qué datos están disponibles:

Un desafío con todos estos conjuntos de datos dispares es tenerlos todos en un solo lugar para usarlos para el análisis. Afortunadamente, Databricks tiene muchos métodos para recopilar diferentes tipos de datos. La forma más fácil de ingerir grandes cantidades de archivos de datos es usar una característica de Databricks llamada AutoLoader, que escanea los archivos de datos desde donde están almacenados en el almacenamiento en la nube y los carga en Databricks, donde los equipos de datos los transforman para poder analizarlos. AutoLoader es fácil de usar e increíblemente confiable cuando se escala para acomodar grandes cantidades de datos tanto en escenarios por lotes como en tiempo real. En otras palabras, AutoLoader funciona igual de bien para pequeñas y grandes cantidades de datos en casos de uso por lotes y en tiempo real. El siguiente código de Python muestra cómo usar AutoLoader para recopilar datos del almacenamiento en la nube.

def ingest_bronze(raw_files_path, raw_files_format, bronze_table_name):
  spark.readStream 
            .format("cloudFiles") 
            .option("cloudFiles.format", raw_files_format) 
            .option("cloudFiles.schemaLocation", f"{cloud_storage_path}/schemas_reco/{bronze_table_name}") 
            .option("cloudFiles.inferColumnTypes", "true") 
            .load(raw_files_path)
        .writeStream 
            .option("checkpointLocation", f"{cloud_storage_path}/chekpoints_reco/{bronze_table_name}") 
            .trigger(once=True).table(bronze_table_name).awaitTermination()

ingest_bronze("/mnt/field-demos/media/stadium/vendors/", "csv", "stadium_vendors")



A menudo vemos situaciones en las que es necesario fusionar varios registros para obtener una imagen completa de una transacción. Por ejemplo, los datos del punto de venta (POS) pueden contener solo un número de artículo, el precio y la hora en que se compró el artículo, y es posible que no contengan una descripción de qué artículo era o quién lo compró.

El soporte multilingüe en Databricks nos permite cambiar entre diferentes lenguajes de programación como SQL y Python para ingerir y fusionar conjuntos de datos. El siguiente ejemplo de SQL conecta las transacciones de ventas en un sistema de punto de venta (que los equipos suelen recibir como archivos de datos en el almacenamiento en la nube) con un registro de información del cliente (normalmente en una base de datos SQL). Este registro combinado permite a los equipos ver todas las compras realizadas por cada cliente. Cuando estos datos están cargados y conectados, los almacenamos en una tabla persistente para seguir trabajando con ellos. El siguiente ejemplo de SQL muestra cómo hacer esto:


%sql
CREATE TABLE IF NOT EXISTS silver_sales AS (
  SELECT * EXCEPT (t._rescued_data, p._rescued_data, s._rescued_data)
    FROM ticket_sales t 
      JOIN point_of_sale p ON t.customer_id = p.customer 
      JOIN stadium_vendors s ON p.item_purchased = s.item_id AND t.game_id = p.game);

Esta tabla permanente se almacena como una tabla de Delta Lake. Delta Lake es un nivel de almacenamiento de formato abierto que brinda confiabilidad, seguridad y rendimiento a un lago de datos para transmisión y procesamiento por lotes, lo que forma la base de una plataforma de datos rentable y altamente escalable. Los equipos de datos usan Delta para versionar sus datos y aplicar requisitos específicos para ejecutar sus análisis mientras los organizan en un formato estructurado y fácil de usar.

Con todas las tecnologías anteriores, los equipos de datos ahora pueden aprovechar este rico conjunto de datos para crear una experiencia personalizada para sus fans e impulsar un mejor compromiso.

modelos de recomendación

Los modelos que predicen qué es más probable que los clientes estén interesados ​​o compren se utilizan en todos los sitios web y plataformas de publicidad dirigida imaginables. Uno de los mayores ejemplos es Netflix, cuya interfaz de usuario se basa casi en su totalidad en modelos de recomendación que sugieren programas o películas a los clientes. Estos modelos predictivos analizan el comportamiento de visualización del cliente y la información demográfica para crear una experiencia personalizada con el objetivo de hacer que un cliente compre o vea algo diferente.

El mismo enfoque se puede aplicar a los casos de uso de análisis de estadios, que utilizan el historial de compras y los datos demográficos para predecir qué artículos es más probable que compre un fanático. Sin embargo, en lugar de construir modelos genéricos, podemos escalar la cantidad de modelos que se construirán con Apache Spark y distribuir el entrenamiento en un clúster para crear un modelo de recomendación único para cada fan y construirlos con un rendimiento óptimo.

Para nuestro caso de uso, podemos usar los datos del punto de venta para determinar lo que los fanáticos compraron previamente en el estadio y, combinados con los datos demográficos, crear una lista de artículos recomendados para la compra de cada fanático. El siguiente código utiliza un algoritmo llamado ALS para predecir qué artículos disponibles para comprar es más probable que compre un fanático. También utiliza MLflow, un marco de aprendizaje automático de código abierto, para almacenar los resultados del modelo y obtener información sobre su rendimiento.

with mlflow.start_run() as run:
  #MLFlow automatically logs all our parameters
  mlflow.pyspark.ml.autolog()
  df = spark.sql("select customer_id, item_id, count(item_id) as item_purchases from silver_sales group by customer_id, item_id")
  # Build the recommendation model using ALS on the training data
  # Note we set cold start strategy to 'drop' to ensure we don't get NaN evaluation metrics
  # rating matrix is derived from another source of information (i.e. it is inferred from other signals), setting implicitPrefs to true to get better results:
  als = ALS(rank=3, userCol="customer_id", itemCol="item_id", ratingCol="item_purchases", implicitPrefs=True, seed=0, coldStartStrategy="nan")
  
  num_cores = sc.defaultParallelism
  als.setNumBlocks(num_cores)
  
  model = als.fit(df)
  
  mlflow.spark.log_model(model, "spark-model", registered_model_name="Stadium_Recommendation")
   #Let's get back the run ID as we'll need to add other figures in our run from another cell
  run_id = run.info.run_id

El modelo devuelve una lista de artículos recomendados para cada aficionado, que se filtra por el número de sección/asiento en el boleto de un aficionado para sugerir un artículo recomendado que esté muy cerca de su asiento.

Aquí hay un ejemplo de los datos disponibles que se pueden usar en este modelo de recomendación:

El modelo devuelve una lista de artículos recomendados para cada aficionado, filtrados por el número de compartimento/asiento en el ticket del aficionado

Finalmente, utilizando el número de teléfono del cliente del sistema CRM, podemos enviar una notificación automática al fan ofreciendo un descuento promocional para el artículo más recomendado.

Acelere el desarrollo de casos de uso con activos de Databricks

Aunque el alcance de este caso de uso es involucrar a los fanáticos para que asistan a un evento deportivo en vivo, el mismo marco se puede aplicar fácilmente a otros escenarios que involucran grandes cantidades de datos de clientes y dispositivos móviles. Los casinos, las líneas de cruceros y las tiendas minoristas pueden impulsar una mayor lealtad de los clientes y aumentar su valor de por vida con modelos de referencia personalizados. Pregunte por nuestro cuaderno acelerador de soluciones de análisis de estadios, que brinda a los equipos de datos todos los recursos que necesitan para crear rápidamente casos de uso como los que se detallan en este blog.



Related post

¿Los «universos saltadores» tienen un comienzo?

¿Los «universos saltadores» tienen un comienzo?

09.08.2022 (Noticias de Nanowerk) Al tratar de comprender la naturaleza del cosmos, algunos teóricos proponen que el universo se expande y…
El mundo va más allá del big data, según la encuesta de Ocient a 500 líderes en tecnología y datos

El mundo va más allá del big data, según…

Ocient, una empresa líder en soluciones de análisis de datos a hiperescala que presta servicios a organizaciones que obtienen valor del…
Una introducción a la recuperación ante desastres con la plataforma de datos Cloudera

Una introducción a la recuperación ante desastres con la…

Publicado en Técnicamente | 09 de agosto de 2022 4 leer minuto Durante la última década, la integración de datos y…

Leave a Reply

Tu dirección de correo electrónico no será publicada.