Saltar al contenido

T-SQL: cuál es la forma más eficiente de recorrer una tabla hasta que se cumpla una condición

Solución:

Debería intentar evitar los bucles en general. Normalmente son menos eficientes que las soluciones basadas en conjuntos, así como menos legibles.

Lo siguiente debería ser bastante eficiente.

Más aún si las columnas de nombre y peso pudieran ser INCLUDE-d en el índice para evitar key búsquedas.

Puede escanear el índice único en orden de turn y calcular el total acumulado de Weight columna – luego use LEAD con los mismos criterios de ordenación para ver cuál será el total acumulado en la siguiente fila.

Tan pronto como encuentre la primera fila donde exceda 1000 o sea NULL (indicando que no hay una fila siguiente), entonces puede detener el escaneo.

WITH T1
     AS (SELECT *,
                SUM(Weight) OVER (ORDER BY turn ROWS UNBOUNDED PRECEDING) AS cume_weight
         FROM   [dbo].[line]),
     T2
     AS (SELECT LEAD(cume_weight) OVER (ORDER BY turn) AS next_cume_weight,
                *
         FROM   T1)
SELECT TOP 1 name
FROM   T2
WHERE  next_cume_weight > 1000
        OR next_cume_weight IS NULL
ORDER  BY turn 

Plan de ejecución

ingrese la descripción de la imagen aquí

En la práctica, parece leer unas pocas filas antes de donde es estrictamente necesario: parece que cada par agregado de carrete de ventana / flujo hace que se lean dos filas adicionales.

Para los datos de muestra en la pregunta, idealmente solo necesitaría leer dos filas del escaneo de índice, pero en realidad dice 6, pero esto no es un problema de eficiencia significativo y no se degrada a medida que se agregan más filas a la tabla (como en esta demostración)

Para aquellos interesados ​​en este tema, una imagen con las filas de salida de cada operador (como se muestra en el query_trace_column_values evento extendido) está debajo, las filas se generan en row_id orden (comenzando en 47 para la primera fila leída por el escaneo de índice y terminando en 113 Para el TOP)

Haga clic en la imagen de abajo para agrandarla o, alternativamente, vea la versión animada para que el flujo sea más fácil de seguir.

Pausando la animación en el punto donde el agregado de la corriente Derecha ha emitido su primera fila (para gary – turn = 1). Parece evidente que estaba esperando recibir su primera fila con un WindowCount diferente (para Jo – turn = 2). Y el carrete de la ventana no libera la primera fila “Jo” hasta que haya leído la siguiente fila con una turn (para thomas – turno = 3)

Por lo tanto, el carrete de ventana y el agregado de flujo hacen que se lea una fila adicional y hay cuatro de estas en el plan, por lo tanto, 4 filas adicionales.

ingrese la descripción de la imagen aquí

A continuación, se muestra una explicación de las columnas que se muestran arriba (basada en la información aquí)

  • NodeName: Escaneo de índice, NodeId: 15, ColumnName: id columna de la tabla base cubierta por índice
  • NodeName: Escaneo de índice, NodeId: 15, ColumnName: turn columna de la tabla base cubierta por índice
  • NodeName: búsqueda de índice agrupado, NodeId: 17, ColumnName: peso columna de la tabla base recuperada de la búsqueda
  • NodeName: búsqueda de índice agrupado, NodeId: 17, ColumnName: nombre columna de la tabla base recuperada de la búsqueda
  • NodeName: Segment, NodeId: 13, ColumnName: Segment1010 Devuelve 1 al comienzo de un nuevo grupo o null de lo contrario. Como no Partition By en el SUM solo la primera fila obtiene 1
  • NodeName: Proyecto de secuencia, NodeId: 12, ColumnName: RowNumber1009row_number() dentro del grupo indicado por el indicador Segment1010. Como todas las filas están en el mismo grupo, se trata de números enteros ascendentes de 1 a 6. Se utilizaría para filtrar las filas del marco derecho en casos como rows between 5 preceding and 2 following. (o en cuanto a LEAD más tarde)
  • NodeName: Segment, NodeId: 11, ColumnName: Segment1011 Devuelve 1 al comienzo de un nuevo grupo o null de lo contrario. Como no Partition By en el SUM solo la primera fila obtiene 1 (igual que Segment1010)
  • NodeName: Window Spool, NodeId: 10, ColumnName: WindowCount1012 Atributo que agrupa filas pertenecientes a un marco de ventana. Este carrete de ventana utiliza el caso de “vía rápida” para UNBOUNDED PRECEDING. Donde emite dos filas por fila de origen. Uno con los valores acumulativos y otro con los valores de detalle. Aunque no hay diferencia visible en las filas expuestas por query_trace_column_values Supongo que las columnas acumulativas están ahí en realidad.
  • NodeName: Stream Aggregate, NodeId: 9, ColumnName: Expr1004Count(*) agrupados por WindowCount1012 según el plan, pero en realidad un recuento continuo
  • NodeName: Stream Aggregate, NodeId: 9, ColumnName: Expr1005SUM(weight) agrupados por WindowCount1012 según el plan, pero en realidad la suma acumulada de peso (es decir, cume_weight)
  • NodeName: Segment, NodeId: 7, ColumnName: Expr1002CASE WHEN [Expr1004]=(0) THEN NULL ELSE [Expr1005] END – No veo como COUNT(*) puede ser 0, por lo que siempre se ejecutará la suma (cume_weight)
  • NodeName: Segment, NodeId: 7, ColumnName: Segment1013 No partition by sobre el LEAD por lo que la primera fila obtiene 1. Todas las restantes obtienen null
  • NodeName: Proyecto de secuencia, NodeId: 6, ColumnName: RowNumber1006row_number() dentro del grupo indicado por el indicador Segment1013. Como todas las filas están en el mismo grupo, se trata de números enteros ascendentes de 1 a 4
  • NodeName: Segment, NodeId: 4, ColumnName: BottomRowNumber1008 RowNumber1006 + 1 como el LEAD requiere la siguiente fila única
  • NodeName: Segment, NodeId: 4, ColumnName: TopRowNumber1007 RowNumber1006 + 1 como el LEAD requiere la siguiente fila única
  • NodeName: Segment, NodeId: 4, ColumnName: Segment1014 No partition by sobre el LEAD por lo que la primera fila obtiene 1. Todas las restantes obtienen null
  • NodeName: Window Spool, NodeId: 3, ColumnName: WindowCount1015 Atributo que agrupa las filas que pertenecen a un marco de ventana utilizando los números de fila anteriores. El marco de la ventana para LEAD tiene un máximo de 2 filas (la actual y la siguiente)
  • NodeName: Stream Aggregate, NodeId: 2, ColumnName: Expr1003LAST_VALUE([Expr1002]) Para el LEAD(cume_weight)

Solo como curiosidad (ya que la pregunta dice T-SQL) también es posible resolver este problema de manera eficiente usando SQLCLR.

La idea es leer las filas de una en una en turn orden hasta el weight excede 1000 (o nos quedamos sin filas), luego para devolver el último name leer.

El código fuente es:

using Microsoft.SqlServer.Server;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;

public partial class UserDefinedFunctions

    [SqlFunction(DataAccess = DataAccessKind.Read,
        SystemDataAccess = SystemDataAccessKind.None,
        IsDeterministic = true, IsPrecise = true)]
    [return: SqlFacet(IsFixedLength = false, IsNullable = true, MaxSize = 255)]
    public static SqlString Elevator()
    
        const string query =
            @"SELECT L.[name], L.[weight]
            FROM dbo.line AS L
            ORDER BY L.turn;";

        using (var con = new SqlConnection("context connection = true"))
        
            con.Open();
            using (var cmd = new SqlCommand(query, con))
            
                var rdr = cmd.ExecuteReader(CommandBehavior.SingleResult);
                var name = SqlString.Null;
                var total = 0;

                while (rdr.Read() && (total += rdr.GetInt32(1)) <= 1000)
                
                    name = rdr.GetSqlString(0);
                
                return name;
            
        
    

El ensamblaje compilado y la función T-SQL:

CREATE ASSEMBLY Elevator AUTHORIZATION [dbo]
FROM 
WITH PERMISSION_SET = SAFE;
GO
CREATE FUNCTION dbo.Elevator ()
RETURNS nvarchar(255)
AS EXTERNAL NAME Elevator.UserDefinedFunctions.Elevator;

Obteniendo el resultado:

SELECT dbo.Elevator();

Te mostramos las reseñas y valoraciones de los lectores

Si estás contento con lo expuesto, puedes dejar una reseña acerca de qué te ha impresionado de esta crónica.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *