slicing - ¿Qué es::(dos puntos) en Python al suscribir secuencias?
range python (9)
qué significa el 3 en somesequence [:: 3]
Depende de en qué clase lo esté usando exactamente porque:
También puede usar esta notación en sus propias clases personalizadas para que haga lo que quiera
class C(object):
def __getitem__(self, k):
return k
# Single argument is passed directly.
assert C()[0] == 0
# Multiple indices generate a tuple.
assert C()[0, 1] == (0, 1)
# Slice notation generates a slice object.
assert C()[1:2:3] == slice(1, 2, 3)
# If you omit any part of the slice notation, it becomes None.
assert C()[:] == slice(None, None, None)
assert C()[::] == slice(None, None, None)
assert C()[1::] == slice(1, None, None)
assert C()[:2:] == slice(None, 2, None)
assert C()[::3] == slice(None, None, 3)
# Tuple with a slice object:
assert C()[:, 1] == (slice(None, None, None), 1)
# Ellipsis class object.
assert C()[...] == Ellipsis
A continuación, podemos abrir objetos de sector como:
s = slice(1, 2, 3)
assert s.start == 1
assert s.stop == 2
assert s.step == 3
Esto se usa notablemente en Numpy para cortar matrices multidimensionales en cualquier dirección.
Por supuesto, cualquier API sana debería usar ::3
con la semántica habitual "cada 3".
Sé que puedo usar algo como string[3:4]
para obtener una subcadena en Python, pero ¿qué significa 3 en somesequence[::3]
?
TL; DR
Este ejemplo visual le mostrará cómo seleccionar cuidadosamente los elementos en una matriz NumPy (matriz bidimensional) de una manera bastante entretenida (lo prometo). El paso 2 a continuación ilustra el uso de esos "dos puntos dobles" ::
en cuestión.
(Precaución: este es un ejemplo específico de NumPy array con el objetivo de ilustrar el caso de uso de "dos puntos dobles" ::
para saltar de elementos en ejes múltiples. Este ejemplo no cubre las estructuras de datos nativas de Python como List
).
Un ejemplo concreto para gobernarlos a todos ...
Digamos que tenemos una matriz NumPy que se ve así:
In [1]: import numpy as np
In [2]: X = np.arange(100).reshape(10,10)
In [3]: X
Out[3]:
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
[20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
[30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
[40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
[50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
[60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
[70, 71, 72, 73, 74, 75, 76, 77, 78, 79],
[80, 81, 82, 83, 84, 85, 86, 87, 88, 89],
[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])
Diga por alguna razón, su jefe quiere que seleccione los siguientes elementos:
"¿Pero cómo?" ... ¡Sigue leyendo! (Podemos hacer esto en un enfoque de 2 pasos)
Paso 1 - Obtener subconjunto
Especifique el "índice de inicio" y el "índice final" en las direcciones en hilera y en hilera.
En codigo:
In [5]: X2 = X[2:9,3:8]
In [6]: X2
Out[6]:
array([[23, 24, 25, 26, 27],
[33, 34, 35, 36, 37],
[43, 44, 45, 46, 47],
[53, 54, 55, 56, 57],
[63, 64, 65, 66, 67],
[73, 74, 75, 76, 77],
[83, 84, 85, 86, 87]])
Fíjate que ahora acabamos de obtener nuestro subconjunto, con el uso de una sencilla técnica de indexación inicial y final. A continuación, cómo hacer eso "saltar" ... (seguir leyendo!)
Paso 2 - Seleccionar elementos (con el argumento "saltar paso")
Ahora podemos especificar los "pasos de salto" en las direcciones de hilera y de columna (para seleccionar elementos de manera "saltar") de esta manera:
En el código (tenga en cuenta los dos puntos dobles):
In [7]: X3 = X2[::3, ::2]
In [8]: X3
Out[8]:
array([[23, 25, 27],
[53, 55, 57],
[83, 85, 87]])
¡Acabamos de seleccionar todos los elementos según sea necesario! :)
Consolidar el Paso 1 (inicio y final) y el Paso 2 ("saltar")
Ahora que conocemos el concepto, podemos combinar fácilmente el paso 1 y el paso 2 en un solo paso consolidado: compacidad:
In [9]: X4 = X[2:9,3:8][::3,::2]
In [10]: X4
Out[10]:
array([[23, 25, 27],
[53, 55, 57],
[83, 85, 87]])
¡Hecho!
Explicación
s[i:j:k]
es, según la documentación , "porción de s de i a j con paso k". Cuando i
y j
están ausentes, se supone toda la secuencia y, por lo tanto, s[::k]
significa "cada elemento k-ésimo".
Ejemplos
Primero, vamos a inicializar una lista:
>>> s = range(20)
>>> s
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
Tomemos cada 3º elemento de s
:
>>> s[::3]
[0, 3, 6, 9, 12, 15, 18]
Tomemos cada 3º elemento de s[2:]
:
>>> s[2:]
[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
>>> s[2::3]
[2, 5, 8, 11, 14, 17]
Tomemos cada 3º elemento de s[5:12]
:
>>> s[5:12]
[5, 6, 7, 8, 9, 10, 11]
>>> s[5:12:3]
[5, 8, 11]
Tomemos cada 3º elemento de s[:10]
:
>>> s[:10]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> s[:10:3]
[0, 3, 6, 9]
Al cortar en Python, el tercer parámetro es el paso. Como mencionan otros, vea Extended Slices para obtener una buena descripción general.
Con este conocimiento, [::3]
solo significa que no ha especificado ningún índice de inicio o fin para su porción. Como ha especificado un paso, 3
, esto tomará cada tercera entrada de something
comience en el primer índice. Por ejemplo:
>>> ''123123123''[::3]
''111''
El tercer parámetro es el paso. Entonces [:: 3] devolvería cada 3er elemento de la lista / cadena.
Las direcciones de segmento de secuencia de Python se pueden escribir como [inicio: final: paso] y se puede descartar cualquiera de inicio, finalización o finalización. a[::3]
es cada tercer elemento de la secuencia.
Python usa :: para separar el final, el inicio y el valor del paso.
significa "nada para el primer argumento, nada para el segundo y salta por tres". Obtiene cada tercer elemento de la secuencia en rodajas. Rebanadas extendidas es lo que quieres. Nuevo en Python 2.3
seq[::n]
es una secuencia de cada enésimo elemento en toda la secuencia.
Ejemplo:
>>> range(10)[::2]
[0, 2, 4, 6, 8]
La sintaxis es:
seq[start:end:step]
Entonces puedes hacer:
>>> range(100)[5:18:2]
[5, 7, 9, 11, 13, 15, 17]