servidor - sql server management studio
Servidor SQL: haga que todo el caso UPPER sea adecuado para el caso/título (14)
¿Es demasiado tarde para volver y obtener los datos sin mayúsculas?
A los de von Neumann, McCain, DeGuzman y Johnson-Smith de su base de clientes puede no gustarles el resultado de su procesamiento ...
Además, supongo que esto pretende ser una actualización de los datos por única vez. Puede ser más fácil exportar, filtrar / modificar y volver a importar los nombres corregidos en la base de datos, y luego puede usar enfoques que no sean SQL para la fijación de nombres ...
Tengo una tabla que se importó como UPPER CASE y me gustaría convertirla en Proper Case. ¿Qué script alguno de ustedes usó para completar esto?
Aquí hay otra variación que encontré en los foros de SQLTeam.com @ http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=47718
create FUNCTION PROPERCASE
(
--The string to be converted to proper case
@input varchar(8000)
)
--This function returns the proper case string of varchar type
RETURNS varchar(8000)
AS
BEGIN
IF @input IS NULL
BEGIN
--Just return NULL if input string is NULL
RETURN NULL
END
--Character variable declarations
DECLARE @output varchar(8000)
--Integer variable declarations
DECLARE @ctr int, @len int, @found_at int
--Constant declarations
DECLARE @LOWER_CASE_a int, @LOWER_CASE_z int, @Delimiter char(3), @UPPER_CASE_A int, @UPPER_CASE_Z int
--Variable/Constant initializations
SET @ctr = 1
SET @len = LEN(@input)
SET @output = ''''
SET @LOWER_CASE_a = 97
SET @LOWER_CASE_z = 122
SET @Delimiter = '' ,-''
SET @UPPER_CASE_A = 65
SET @UPPER_CASE_Z = 90
WHILE @ctr <= @len
BEGIN
--This loop will take care of reccuring white spaces
WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) > 0
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
SET @ctr = @ctr + 1
END
IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @LOWER_CASE_a AND @LOWER_CASE_z
BEGIN
--Converting the first character to upper case
SET @output = @output + UPPER(SUBSTRING(@input,@ctr,1))
END
ELSE
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
END
SET @ctr = @ctr + 1
WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) = 0 AND (@ctr <= @len)
BEGIN
IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @UPPER_CASE_A AND @UPPER_CASE_Z
BEGIN
SET @output = @output + LOWER(SUBSTRING(@input,@ctr,1))
END
ELSE
BEGIN
SET @output = @output + SUBSTRING(@input,@ctr,1)
END
SET @ctr = @ctr + 1
END
END
RETURN @output
END
GO
SET QUOTED_IDENTIFIER OFF
GO
SET ANSI_NULLS ON
GO
Aquí hay un UDF que hará el truco ...
create function ProperCase(@Text as varchar(8000))
returns varchar(8000)
as
begin
declare @Reset bit;
declare @Ret varchar(8000);
declare @i int;
declare @c char(1);
if @Text is null
return null;
select @Reset = 1, @i = 1, @Ret = '''';
while (@i <= len(@Text))
select @c = substring(@Text, @i, 1),
@Ret = @Ret + case when @Reset = 1 then UPPER(@c) else LOWER(@c) end,
@Reset = case when @c like ''[a-zA-Z]'' then 0 else 1 end,
@i = @i + 1
return @Ret
end
Sin embargo, todavía tendrá que usarlo para actualizar sus datos.
Aquí hay una versión que usa una secuencia o una tabla de números en lugar de un bucle. Puede modificar la cláusula WHERE para adaptar sus reglas personales a la hora de convertir un carácter a mayúsculas. Acabo de incluir un conjunto simple que en mayúscula a cualquier letra que proceda por una letra que no sea, con la excepción de los apóstrofes. Esto no quiere decir que 123apple tenga una coincidencia en la "a" porque "3" no es una letra. Si solo desea un espacio en blanco (espacio, tabulación, retorno de carro, avance de línea), puede reemplazar el patrón ''[^az]''
por ''['' + Char(32) + Char(9) + Char(13) + Char(10) + '']''
.
CREATE FUNCTION String.InitCap( @string nvarchar(4000) ) RETURNS nvarchar(4000) AS
BEGIN
-- 1. Convert all letters to lower case
DECLARE @InitCap nvarchar(4000); SET @InitCap = Lower(@string);
-- 2. Using a Sequence, replace the letters that should be upper case with their upper case version
SELECT @InitCap = Stuff( @InitCap, n, 1, Upper( SubString( @InitCap, n, 1 ) ) )
FROM (
SELECT (1 + n1.n + n10.n + n100.n + n1000.n) AS n
FROM (SELECT 0 AS n UNION SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5 UNION SELECT 6 UNION SELECT 7 UNION SELECT 8 UNION SELECT 9) AS n1
CROSS JOIN (SELECT 0 AS n UNION SELECT 10 UNION SELECT 20 UNION SELECT 30 UNION SELECT 40 UNION SELECT 50 UNION SELECT 60 UNION SELECT 70 UNION SELECT 80 UNION SELECT 90) AS n10
CROSS JOIN (SELECT 0 AS n UNION SELECT 100 UNION SELECT 200 UNION SELECT 300 UNION SELECT 400 UNION SELECT 500 UNION SELECT 600 UNION SELECT 700 UNION SELECT 800 UNION SELECT 900) AS n100
CROSS JOIN (SELECT 0 AS n UNION SELECT 1000 UNION SELECT 2000 UNION SELECT 3000) AS n1000
) AS Sequence
WHERE
n BETWEEN 1 AND Len( @InitCap )
AND SubString( @InitCap, n, 1 ) LIKE ''[a-z]'' /* this character is a letter */
AND (
n = 1 /* this character is the first `character` */
OR SubString( @InitCap, n-1, 1 ) LIKE ''[^a-z]'' /* the previous character is NOT a letter */
)
AND (
n < 3 /* only test the 3rd or greater characters for this exception */
OR SubString( @InitCap, n-2, 3 ) NOT LIKE ''[a-z]''''[a-z]'' /* exception: The pattern <letter>''<letter> should not capatolize the letter following the apostrophy */
)
-- 3. Return the modified version of the input
RETURN @InitCap
END
Creo que encontrará que lo siguiente es más eficiente:
IF OBJECT_ID(''dbo.ProperCase'') IS NOT NULL
DROP FUNCTION dbo.ProperCase
GO
CREATE FUNCTION dbo.PROPERCASE (
@str VARCHAR(8000))
RETURNS VARCHAR(8000)
AS
BEGIN
SET @str = '' '' + @str
SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE( @str, '' a'', '' A''), '' b'', '' B''), '' c'', '' C''), '' d'', '' D''), '' e'', '' E''), '' f'', '' F''), '' g'', '' G''), '' h'', '' H''), '' i'', '' I''), '' j'', '' J''), '' k'', '' K''), '' l'', '' L''), '' m'', '' M''), '' n'', '' N''), '' o'', '' O''), '' p'', '' P''), '' q'', '' Q''), '' r'', '' R''), '' s'', '' S''), '' t'', '' T''), '' u'', '' U''), '' v'', '' V''), '' w'', '' W''), '' x'', '' X''), '' y'', '' Y''), '' z'', '' Z'')
RETURN RIGHT(@str, LEN(@str) - 1)
END
GO
La instrucción replace podría cortarse y pegarse directamente en una consulta SQL. Es ultra feo, sin embargo, al reemplazar @str con la columna que le interesa, no pagará un precio por un cursor implícito como lo hará con los ubf publicados. Encuentro que incluso usando mi UDF es mucho más eficiente.
Ah, y en lugar de generar la declaración de reemplazo a mano, usa esto:
-- Code Generator for expression
DECLARE @x INT,
@c CHAR(1),
@sql VARCHAR(8000)
SET @x = 0
SET @sql = ''@str'' -- actual variable/column you want to replace
WHILE @x < 26
BEGIN
SET @c = CHAR(ASCII(''a'') + @x)
SET @sql = ''REPLACE('' + @sql + '', '''' '' + @c+ '''''', '''' '' + UPPER(@c) + '''''')''
SET @x = @x + 1
END
PRINT @sql
De todos modos, depende del número de filas. Me gustaría que pudieras hacer s / / b ([az]) / uc $ 1 /, pero bueno, trabajamos con las herramientas que tenemos.
TENGA EN CUENTA que debería usar esto como lo debería usar como .... SELECCIONE dbo.ProperCase (LOWER (columna)) ya que la columna está en mayúscula. De hecho, funciona bastante rápido en mi tabla de 5.000 entradas (ni siquiera un segundo), incluso con la más baja.
En respuesta a la ráfaga de comentarios sobre internacionalización, presento la siguiente implementación que maneja todos los caracteres ascii que dependen únicamente de la implementación de SQL Server superior e inferior. Recuerde, las variables que estamos usando aquí son VARCHAR, lo que significa que solo pueden contener valores ASCII. Para usar otros alfabetos internacionales, debes usar NVARCHAR. La lógica sería similar, pero necesitaría usar UNICODE y NCHAR en lugar de ASCII Y CHAR, y la instrucción de reemplazo sería mucho más grande ...
-- Code Generator for expression
DECLARE @x INT,
@c CHAR(1),
@sql VARCHAR(8000),
@count INT
SEt @x = 0
SET @count = 0
SET @sql = ''@str'' -- actual variable you want to replace
WHILE @x < 256
BEGIN
SET @c = CHAR(@x)
-- Only generate replacement expression for characters where upper and lowercase differ
IF @x = ASCII(LOWER(@c)) AND @x != ASCII(UPPER(@c))
BEGIN
SET @sql = ''REPLACE('' + @sql + '', '''' '' + @c+ '''''', '''' '' + UPPER(@c) + '''''')''
SET @count = @count + 1
END
SET @x = @x + 1
END
PRINT @sql
PRINT ''Total characters substituted: '' + CONVERT(VARCHAR(255), @count)
Básicamente, la premisa de mi método es la precomputación para la eficiencia. La implementación ASCII completa es la siguiente:
IF OBJECT_ID(''dbo.ProperCase'') IS NOT NULL
DROP FUNCTION dbo.ProperCase
GO
CREATE FUNCTION dbo.PROPERCASE (
@str VARCHAR(8000))
RETURNS VARCHAR(8000)
AS
BEGIN
SET @str = '' '' + @str
SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(@str, '' a'', '' A''), '' b'', '' B''), '' c'', '' C''), '' d'', '' D''), '' e'', '' E''), '' f'', '' F''), '' g'', '' G''), '' h'', '' H''), '' i'', '' I''), '' j'', '' J''), '' k'', '' K''), '' l'', '' L''), '' m'', '' M''), '' n'', '' N''), '' o'', '' O''), '' p'', '' P''), '' q'', '' Q''), '' r'', '' R''), '' s'', '' S''), '' t'', '' T''), '' u'', '' U''), '' v'', '' V''), '' w'', '' W''), '' x'', '' X''), '' y'', '' Y''), '' z'', '' Z''), '' š'', '' Š''), '' œ'', '' Œ''), '' ž'', '' Ž''), '' à'', '' À''), '' á'', '' Á''), '' â'', '' Â''), '' ã'', '' Ã''), '' ä'', '' Ä''), '' å'', '' Å''), '' æ'', '' Æ''), '' ç'', '' Ç''), '' è'', '' È''), '' é'', '' É''), '' ê'', '' Ê''), '' ë'', '' Ë''), '' ì'', '' Ì''), '' í'', '' Í''), '' î'', '' Î''), '' ï'', '' Ï''), '' ð'', '' Ð''), '' ñ'', '' Ñ''), '' ò'', '' Ò''), '' ó'', '' Ó''), '' ô'', '' Ô''), '' õ'', '' Õ''), '' ö'', '' Ö''), '' ø'', '' Ø''), '' ù'', '' Ù''), '' ú'', '' Ú''), '' û'', '' Û''), '' ü'', '' Ü''), '' ý'', '' Ý''), '' þ'', '' Þ''), '' ÿ'', '' Ÿ'')
RETURN RIGHT(@str, LEN(@str) - 1)
END
GO
El enlace que publiqué arriba es una gran opción que aborda el problema principal: que nunca podemos contabilizar programáticamente todos los casos (Smith-Jones, von Haussen, John Smith MD), al menos no de manera elegante. Tony presenta el concepto de un personaje de excepción / corte para tratar estos casos. De todos modos, basándose en la idea de Cervo (todos los caracteres chars inferiores precedidos por el espacio), los enunciados de reemplazo podrían estar encerrados en una sola tabla basada en reemplazar en su lugar. En realidad, cualquier combinación de caracteres baja / alta podría insertarse en @alpha y la declaración no cambiaría:
declare @str nvarchar(8000)
declare @alpha table (low nchar(1), up nchar(1))
set @str = ''ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ''
-- stage the alpha (needs number table)
insert into @alpha
-- A-Z / a-z
select nchar(n+32),
nchar(n)
from dbo.Number
where n between 65 and 90 or
n between 192 and 223
-- append space at start of str
set @str = lower('' '' + @str)
-- upper all lower case chars preceded by space
select @str = replace(@str, '' '' + low, '' '' + up)
from @Alpha
select @str
Esta función:
- "Casos correctos" todas las palabras "MAYÚSCULAS" que están delimitadas por espacios en blanco
- deja "palabras en minúsculas" solo
- funciona correctamente incluso para alfabetos no ingleses
- es portátil, ya que no utiliza características sofisticadas de versiones recientes de SQL Server
- se puede cambiar fácilmente para usar NCHAR y NVARCHAR para soporte Unicode, así como también cualquier longitud de parámetro que considere conveniente
- la definición de espacio en blanco se puede configurar
CREATE FUNCTION ToProperCase(@string VARCHAR(255)) RETURNS VARCHAR(255)
AS
BEGIN
DECLARE @i INT -- index
DECLARE @l INT -- input length
DECLARE @c NCHAR(1) -- current char
DECLARE @f INT -- first letter flag (1/0)
DECLARE @o VARCHAR(255) -- output string
DECLARE @w VARCHAR(10) -- characters considered as white space
SET @w = ''['' + CHAR(13) + CHAR(10) + CHAR(9) + CHAR(160) + '' '' + '']''
SET @i = 1
SET @l = LEN(@string)
SET @f = 1
SET @o = ''''
WHILE @i <= @l
BEGIN
SET @c = SUBSTRING(@string, @i, 1)
IF @f = 1
BEGIN
SET @o = @o + @c
SET @f = 0
END
ELSE
BEGIN
SET @o = @o + LOWER(@c)
END
IF @c LIKE @w SET @f = 1
SET @i = @i + 1
END
RETURN @o
END
Resultado:
dbo.ToProperCase(''ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ'')
-----------------------------------------------------------------
All Upper Case and Some lower Ää Öö Üü Éé Øø Cc Ææ
Estoy un poco retrasado en el juego, pero creo que es más funcional y funciona con cualquier idioma, incluidos ruso, alemán, tailandés, vietnamita, etc. Hará mayúsculas cualquier cosa después de ''o - o. o (o) o espacio (obviamente :).
CREATE FUNCTION [dbo].[fnToProperCase]( @name nvarchar(500) )
RETURNS nvarchar(500)
AS
BEGIN
declare @pos int = 1
, @pos2 int
if (@name <> '''')--or @name = lower(@name) collate SQL_Latin1_General_CP1_CS_AS or @name = upper(@name) collate SQL_Latin1_General_CP1_CS_AS)
begin
set @name = lower(rtrim(@name))
while (1 = 1)
begin
set @name = stuff(@name, @pos, 1, upper(substring(@name, @pos, 1)))
set @pos2 = patindex(''%[- ''''.)(]%'', substring(@name, @pos, 500))
set @pos += @pos2
if (isnull(@pos2, 0) = 0 or @pos > len(@name))
break
end
end
return @name
END
GO
Sé que el diablo está en los detalles (especialmente en lo que respecta a los datos personales de las personas), y que sería muy bueno tener los nombres en mayúscula correctamente, pero el tipo de molestia anterior es la razón por la cual los pragmáticos y conscientes del tiempo utilizan lo siguiente :
SELECT UPPER(''Put YoUR O''So oddLy casED McWeird-nAme von rightHERE here'')
En mi experiencia, las personas están bien viendo SU NOMBRE ... incluso cuando está a la mitad de una oración.
Consulte: los rusos usaron un lápiz!
Sé que esto es una publicación tardía en este hilo, pero vale la pena mirar. Esta función funciona para mí siempre. Así que pensé en compartirlo.
CREATE FUNCTION [dbo].[fnConvert_TitleCase] (@InputString VARCHAR(4000) )
RETURNS VARCHAR(4000)
AS
BEGIN
DECLARE @Index INT
DECLARE @Char CHAR(1)
DECLARE @OutputString VARCHAR(255)
SET @OutputString = LOWER(@InputString)
SET @Index = 2
SET @OutputString = STUFF(@OutputString, 1, 1,UPPER(SUBSTRING(@InputString,1,1)))
WHILE @Index <= LEN(@InputString)
BEGIN
SET @Char = SUBSTRING(@InputString, @Index, 1)
IF @Char IN ('' '', '';'', '':'', ''!'', ''?'', '','', ''.'', ''_'', ''-'', ''/'', ''&'','''''''',''('')
IF @Index + 1 <= LEN(@InputString)
BEGIN
IF @Char != ''''''''
OR
UPPER(SUBSTRING(@InputString, @Index + 1, 1)) != ''S''
SET @OutputString =
STUFF(@OutputString, @Index + 1, 1,UPPER(SUBSTRING(@InputString, @Index + 1, 1)))
END
SET @Index = @Index + 1
END
RETURN ISNULL(@OutputString,'''')
END
Llamadas de prueba:
select dbo.fnConvert_TitleCase(Upper(''ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ'')) as test
select dbo.fnConvert_TitleCase(upper(''Whatever the mind of man can conceive and believe, it can achieve. – Napoleon hill'')) as test
Resultados:
Si está en la importación de datos de SSIS que tienen una combinación de mayúsculas y minúsculas y necesita realizar una búsqueda en una columna con el caso adecuado, notará que la búsqueda falla donde se mezcla la fuente y la fuente de búsqueda es correcta. También notará que no puede usar las funciones derecha e izquierda de SSIS para SQL Server 2008r2 para las columnas derivadas. Aquí hay una solución que funciona para mí:
UPPER(substring(input_column_name,1,1)) + LOWER(substring(input_column_name, 2, len(input_column_name)-1))
Si puede habilitar el CLR en SQL Server (requiere 2005 o posterior), entonces podría crear una función CLR que use la función incorporada de TextInfo.ToTitleCase que le permitiría crear una forma consciente de cultura de hacerlo en solo unos pocos líneas de código.
Tendría sentido mantener una búsqueda de excepciones para cuidar de von Neumann, McCain, DeGuzman y Johnson-Smith.
UPDATE titles
SET title =
UPPER(LEFT(title, 1)) +
LOWER(RIGHT(title, LEN(title) - 1))