Solución:
Debería intentar evitar los bucles en general. Normalmente son menos eficientes que las soluciones basadas en conjuntos, así como menos legibles.
Lo siguiente debería ser bastante eficiente.
Más aún si las columnas de nombre y peso pudieran ser INCLUDE-
d en el índice para evitar key búsquedas.
Puede escanear el índice único en orden de turn
y calcular el total acumulado de Weight
columna – luego use LEAD
con los mismos criterios de ordenación para ver cuál será el total acumulado en la siguiente fila.
Tan pronto como encuentre la primera fila donde exceda 1000 o sea NULL
(indicando que no hay una fila siguiente), entonces puede detener el escaneo.
WITH T1
AS (SELECT *,
SUM(Weight) OVER (ORDER BY turn ROWS UNBOUNDED PRECEDING) AS cume_weight
FROM [dbo].[line]),
T2
AS (SELECT LEAD(cume_weight) OVER (ORDER BY turn) AS next_cume_weight,
*
FROM T1)
SELECT TOP 1 name
FROM T2
WHERE next_cume_weight > 1000
OR next_cume_weight IS NULL
ORDER BY turn
Plan de ejecución
En la práctica, parece leer unas pocas filas antes de donde es estrictamente necesario: parece que cada par agregado de carrete de ventana / flujo hace que se lean dos filas adicionales.
Para los datos de muestra en la pregunta, idealmente solo necesitaría leer dos filas del escaneo de índice, pero en realidad dice 6, pero esto no es un problema de eficiencia significativo y no se degrada a medida que se agregan más filas a la tabla (como en esta demostración)
Para aquellos interesados en este tema, una imagen con las filas de salida de cada operador (como se muestra en el query_trace_column_values
evento extendido) está debajo, las filas se generan en row_id
orden (comenzando en 47
para la primera fila leída por el escaneo de índice y terminando en 113
Para el TOP
)
Haga clic en la imagen de abajo para agrandarla o, alternativamente, vea la versión animada para que el flujo sea más fácil de seguir.
Pausando la animación en el punto donde el agregado de la corriente Derecha ha emitido su primera fila (para gary – turn = 1). Parece evidente que estaba esperando recibir su primera fila con un WindowCount diferente (para Jo – turn = 2). Y el carrete de la ventana no libera la primera fila “Jo” hasta que haya leído la siguiente fila con una turn
(para thomas – turno = 3)
Por lo tanto, el carrete de ventana y el agregado de flujo hacen que se lea una fila adicional y hay cuatro de estas en el plan, por lo tanto, 4 filas adicionales.
A continuación, se muestra una explicación de las columnas que se muestran arriba (basada en la información aquí)
- NodeName: Escaneo de índice, NodeId: 15, ColumnName: id columna de la tabla base cubierta por índice
- NodeName: Escaneo de índice, NodeId: 15, ColumnName: turn columna de la tabla base cubierta por índice
- NodeName: búsqueda de índice agrupado, NodeId: 17, ColumnName: peso columna de la tabla base recuperada de la búsqueda
- NodeName: búsqueda de índice agrupado, NodeId: 17, ColumnName: nombre columna de la tabla base recuperada de la búsqueda
- NodeName: Segment, NodeId: 13, ColumnName: Segment1010 Devuelve 1 al comienzo de un nuevo grupo o null de lo contrario. Como no
Partition By
en elSUM
solo la primera fila obtiene 1 - NodeName: Proyecto de secuencia, NodeId: 12, ColumnName: RowNumber1009
row_number()
dentro del grupo indicado por el indicador Segment1010. Como todas las filas están en el mismo grupo, se trata de números enteros ascendentes de 1 a 6. Se utilizaría para filtrar las filas del marco derecho en casos comorows between 5 preceding and 2 following
. (o en cuanto aLEAD
más tarde) - NodeName: Segment, NodeId: 11, ColumnName: Segment1011 Devuelve 1 al comienzo de un nuevo grupo o null de lo contrario. Como no
Partition By
en elSUM
solo la primera fila obtiene 1 (igual que Segment1010) - NodeName: Window Spool, NodeId: 10, ColumnName: WindowCount1012 Atributo que agrupa filas pertenecientes a un marco de ventana. Este carrete de ventana utiliza el caso de “vía rápida” para
UNBOUNDED PRECEDING
. Donde emite dos filas por fila de origen. Uno con los valores acumulativos y otro con los valores de detalle. Aunque no hay diferencia visible en las filas expuestas porquery_trace_column_values
Supongo que las columnas acumulativas están ahí en realidad. - NodeName: Stream Aggregate, NodeId: 9, ColumnName: Expr1004
Count(*)
agrupados por WindowCount1012 según el plan, pero en realidad un recuento continuo - NodeName: Stream Aggregate, NodeId: 9, ColumnName: Expr1005
SUM(weight)
agrupados por WindowCount1012 según el plan, pero en realidad la suma acumulada de peso (es decir,cume_weight
) - NodeName: Segment, NodeId: 7, ColumnName: Expr1002
CASE WHEN [Expr1004]=(0) THEN NULL ELSE [Expr1005] END
– No veo comoCOUNT(*)
puede ser 0, por lo que siempre se ejecutará la suma (cume_weight
) - NodeName: Segment, NodeId: 7, ColumnName: Segment1013 No
partition by
sobre elLEAD
por lo que la primera fila obtiene 1. Todas las restantes obtienen null - NodeName: Proyecto de secuencia, NodeId: 6, ColumnName: RowNumber1006
row_number()
dentro del grupo indicado por el indicador Segment1013. Como todas las filas están en el mismo grupo, se trata de números enteros ascendentes de 1 a 4 - NodeName: Segment, NodeId: 4, ColumnName: BottomRowNumber1008 RowNumber1006 + 1 como el
LEAD
requiere la siguiente fila única - NodeName: Segment, NodeId: 4, ColumnName: TopRowNumber1007 RowNumber1006 + 1 como el
LEAD
requiere la siguiente fila única - NodeName: Segment, NodeId: 4, ColumnName: Segment1014 No
partition by
sobre elLEAD
por lo que la primera fila obtiene 1. Todas las restantes obtienen null - NodeName: Window Spool, NodeId: 3, ColumnName: WindowCount1015 Atributo que agrupa las filas que pertenecen a un marco de ventana utilizando los números de fila anteriores. El marco de la ventana para
LEAD
tiene un máximo de 2 filas (la actual y la siguiente) - NodeName: Stream Aggregate, NodeId: 2, ColumnName: Expr1003
LAST_VALUE([Expr1002])
Para elLEAD(cume_weight)
Solo como curiosidad (ya que la pregunta dice T-SQL) también es posible resolver este problema de manera eficiente usando SQLCLR.
La idea es leer las filas de una en una en turn
orden hasta el weight
excede 1000 (o nos quedamos sin filas), luego para devolver el último name
leer.
El código fuente es:
using Microsoft.SqlServer.Server;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;
public partial class UserDefinedFunctions
[SqlFunction(DataAccess = DataAccessKind.Read,
SystemDataAccess = SystemDataAccessKind.None,
IsDeterministic = true, IsPrecise = true)]
[return: SqlFacet(IsFixedLength = false, IsNullable = true, MaxSize = 255)]
public static SqlString Elevator()
const string query =
@"SELECT L.[name], L.[weight]
FROM dbo.line AS L
ORDER BY L.turn;";
using (var con = new SqlConnection("context connection = true"))
con.Open();
using (var cmd = new SqlCommand(query, con))
var rdr = cmd.ExecuteReader(CommandBehavior.SingleResult);
var name = SqlString.Null;
var total = 0;
while (rdr.Read() && (total += rdr.GetInt32(1)) <= 1000)
name = rdr.GetSqlString(0);
return name;
El ensamblaje compilado y la función T-SQL:
CREATE ASSEMBLY Elevator AUTHORIZATION [dbo]
FROM 
WITH PERMISSION_SET = SAFE;
GO
CREATE FUNCTION dbo.Elevator ()
RETURNS nvarchar(255)
AS EXTERNAL NAME Elevator.UserDefinedFunctions.Elevator;
Obteniendo el resultado:
SELECT dbo.Elevator();
Te mostramos las reseñas y valoraciones de los lectores
Si estás contento con lo expuesto, puedes dejar una reseña acerca de qué te ha impresionado de esta crónica.