¡Conozca sus consultas con el nuevo perfil de consulta SQL de Databricks!

¡Conozca sus consultas con el nuevo perfil de consulta SQL de Databricks!

  • Big Data
  • febrero 23, 2022
  • No Comment
  • 155
  • 9 minutes read


Databricks SQL proporciona capacidades de almacenamiento de datos y el mejor soporte de su clase para SQL en la plataforma Databricks Lakehouse, para que los analistas puedan descubrir y compartir nuevos conocimientos más rápido, a una fracción del costo de los almacenamientos de datos en la nube tradicionales.

Este blog es parte de una serie sobre Databricks SQL que cubre características clave relacionadas con el rendimiento, la usabilidad y la gobernanza. En una publicación de blog anterior, cubrimos las mejoras recientes en la experiencia del usuario. En este artículo, cubrimos las mejoras que ayudan a nuestros usuarios a comprender las consultas y el rendimiento de las mismas.

Acelere las consultas mediante la identificación de cuellos de botella en la ejecución

Databricks SQL es excelente para acelerar automáticamente las consultas; de hecho, recientemente establecimos un récord mundial. Incluso con los avances de hoy, todavía hay momentos en los que necesita abrir el capó y observar la ejecución de la consulta (por ejemplo, cuando una consulta es inesperadamente lenta). Es por eso que nos complace presentar Query Profiling, una nueva función que brinda detalles de ejecución para una consulta y métricas detalladas para ver dónde se gastan el tiempo y los recursos informáticos. La interfaz de usuario debe ser familiar para los administradores que hayan usado bases de datos anteriormente.

La interfaz de usuario de SQL de Databricks para la función de perfil de consulta está diseñada específicamente para que los administradores de bases de datos puedan usarla fácilmente.

El perfil de consulta incluye las siguientes características clave:

  • Un desglose de los componentes principales de la ejecución de consultas y las métricas relacionadas: tiempo dedicado a las tareas, filas procesadas y consumo de memoria.
  • Múltiples representaciones gráficas. Esto incluye una vista de árbol condensada para ver las operaciones más lentas de un vistazo y una vista de diagrama para comprender cómo fluyen los datos entre los operadores de consulta.
  • La capacidad de descubrir fácilmente errores comunes en las consultas (por ejemplo, uniones que explotan o escaneos de tablas completos).
  • Mejor colaboración con la capacidad de descargar y compartir un perfil de consulta.

Una forma común de acelerar las consultas es identificar primero los operadores de consulta de ejecución más larga. Estamos más interesados ​​en el tiempo total dedicado a una tarea que en el tiempo exacto del «reloj de pared» de un operador, ya que estamos tratando con un sistema distribuido y los operadores pueden ejecutarse en paralelo.

Perfil de consulta SQL de Databricks de una consulta TPC-H (vista de árbol).

Del perfil de consulta anterior de una consulta TPC-H, es fácil ver el operador de consulta más costoso: escanear el elemento de fila de la tabla. El segundo operador más caro es escanear otra tabla (pedidos).

Perfil de consulta SQL de Databricks de una consulta TPC-H (vista de diagrama).

Cada operador de consulta contiene un conjunto de estadísticas. En el caso de un operador de escaneo, las métricas incluyen la cantidad de archivos o datos leídos, el tiempo dedicado a esperar el almacenamiento en la nube o el tiempo dedicado a leer archivos. Por ejemplo, las preguntas sobre qué tabla se debe optimizar o si se puede mejorar una combinación se pueden responder fácilmente.

Con el perfil de consulta SQL de Databricks, cada operador de consulta tiene un conjunto de métricas que facilitan la respuesta a preguntas como:  B. qué tabla debe optimizarse o si una unión puede mejorarse o no.

Historial de consultas de limpieza de primavera

También nos complace anunciar algunos cambios pequeños pero útiles en el historial de consultas. Hemos mejorado los detalles a los que se puede acceder para cada consulta. Ahora puede ver el estado de una consulta, una instrucción SQL, un desglose de su duración y un resumen de las métricas de ejecución clave.

Con la función de perfil de consulta SQL de Databricks, ahora puede ver el estado de una consulta, una instrucción SQL, un desglose de su duración y un resumen de las métricas de ejecución clave.

Para evitar ir y venir entre el Editor de SQL y el historial de consultas, todas las funciones anunciadas anteriormente también están disponibles directamente en el Editor de SQL.

Mejores prácticas de rendimiento de consultas

El perfil de consulta está disponible hoy en Databricks SQL. Comience ahora con Databricks SQL registrándose para una prueba gratuita. Únase a un seminario web el 24 de febrero para obtener información sobre cómo maximizar el rendimiento de Lakehouse en Databricks SQL. Este seminario web incluye demostraciones, preguntas y respuestas en vivo y experiencias prácticas para que pueda sumergirse y descubrir cómo aprovechar todo el poder de la plataforma Lakehouse.

En este seminario web aprenderá cómo:

  • Ingiera rápida y fácilmente datos críticos para el negocio en su lago y refine continuamente los datos con tablas delta optimizadas para un mejor rendimiento
  • Escriba, comparta y use consultas con la mejor experiencia de desarrollo de SQL nativo en su clase en Databricks SQL, y libere la máxima productividad.
  • Obtenga total transparencia e información sobre la ejecución de consultas con un desglose detallado de los detalles a nivel de operación para que pueda sumergirse

¡Registrarse aquí!



Related post

Nuevo chip de microfluidos puede detectar contaminación en muestras de 100 picolitros

Nuevo chip de microfluidos puede detectar contaminación en muestras…

27 de junio de 2022 (Noticias de Nanowerk) Científicos del Instituto de Tecnología Láser de la Universidad de Osaka han desarrollado…
Una guía completa para la gestión de las relaciones con los clientes

Una guía completa para la gestión de las relaciones…

Cuando se trata de administrar un negocio, una de las cosas más importantes es mantener contentos a sus clientes. No hay…
Nanotechnology Now – Comunicado de prensa: Nodos cuánticos con átomos calientes

Nanotechnology Now – Comunicado de prensa: Nodos cuánticos con…

Inicio > Prensa > Nodo cuántico con átomos calientes Una partícula de luz de la fuente de fotones individuales (abajo) se…

Leave a Reply

Tu dirección de correo electrónico no será publicada.