python - transponer - Seleccionar filas y columnas específicas de la matriz NumPy
python matrices tutorial (3)
Me he estado volviendo loco tratando de descubrir qué estupidez estoy haciendo mal aquí.
Estoy usando NumPy, y tengo índices de fila específicos e índices de columna específicos de los que quiero seleccionar. Aquí está la esencia de mi problema:
import numpy as np
a = np.arange(20).reshape((5,4))
# array([[ 0, 1, 2, 3],
# [ 4, 5, 6, 7],
# [ 8, 9, 10, 11],
# [12, 13, 14, 15],
# [16, 17, 18, 19]])
# If I select certain rows, it works
print a[[0, 1, 3], :]
# array([[ 0, 1, 2, 3],
# [ 4, 5, 6, 7],
# [12, 13, 14, 15]])
# If I select certain rows and a single column, it works
print a[[0, 1, 3], 2]
# array([ 2, 6, 14])
# But if I select certain rows AND certain columns, it fails
print a[[0,1,3], [0,2]]
# Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# ValueError: shape mismatch: objects cannot be broadcast to a single shape
¿Por qué está pasando esto? Seguramente debería ser capaz de seleccionar la primera, segunda y cuarta filas, y la primera y tercera columnas? El resultado que estoy esperando es:
a[[0,1,3], [0,2]] => [[0, 2],
[4, 6],
[12, 14]]
Como sugiere Toan, un simple truco sería simplemente seleccionar las filas primero, y luego seleccionar las columnas sobre eso .
>>> a[[0,1,3], :] # Returns the rows you want
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[12, 13, 14, 15]])
>>> a[[0,1,3], :][:, [0,2]] # Selects the columns you want as well
array([[ 0, 2],
[ 4, 6],
[12, 14]])
[Editar] El método np.ix_
: np.ix_
Recientemente descubrí que Numpy te brinda un diseño único integrado para hacer exactamente lo que @Jaime sugirió, pero sin tener que usar la sintaxis de transmisión (que adolece de falta de legibilidad). De los documentos:
Usando ix_ uno puede construir rápidamente matrices de índice que indexarán el producto cruzado.
a[np.ix_([1,3],[2,5])]
devuelve la matriz[[a[1,2] a[1,5]], [a[3,2] a[3,5]]]
.
Entonces lo usa así:
>>> a = np.arange(20).reshape((5,4))
>>> a[np.ix_([0,1,3], [0,2])]
array([[ 0, 2],
[ 4, 6],
[12, 14]])
Y la forma en que funciona es que se encarga de alinear matrices de la manera que sugirió Jaime, para que la transmisión se realice correctamente:
>>> np.ix_([0,1,3], [0,2])
(array([[0],
[1],
[3]]), array([[0, 2]]))
Además, como dice MikeC en un comentario, np.ix_
tiene la ventaja de devolver una vista, lo que no sucedió con mi primera respuesta (previa a la edición). Esto significa que ahora puede asignar a la matriz indexada:
>>> a[np.ix_([0,1,3], [0,2])] = -1
>>> a
array([[-1, 1, -1, 3],
[-1, 5, -1, 7],
[ 8, 9, 10, 11],
[-1, 13, -1, 15],
[16, 17, 18, 19]])
La indexación elegante requiere que proporciones todos los índices para cada dimensión. Está proporcionando 3 índices para el primero, y solo 2 para el segundo, de ahí el error. Quieres hacer algo como esto:
>>> a[[[0, 0], [1, 1], [3, 3]], [[0,2], [0,2], [0, 2]]]
array([[ 0, 2],
[ 4, 6],
[12, 14]])
Por supuesto, es un dolor de escribir, por lo que puede permitir que la transmisión lo ayude:
>>> a[[[0], [1], [3]], [0, 2]]
array([[ 0, 2],
[ 4, 6],
[12, 14]])
Esto es mucho más simple de hacer si indicas con matrices, no listas:
>>> row_idx = np.array([0, 1, 3])
>>> col_idx = np.array([0, 2])
>>> a[row_idx[:, None], col_idx]
array([[ 0, 2],
[ 4, 6],
[12, 14]])
UTILIZAR:
>>> a[[0,1,3]][:,[0,2]]
array([[ 0, 2],
[ 4, 6],
[12, 14]])
O:
>>> a[[0,1,3],::2]
array([[ 0, 2],
[ 4, 6],
[12, 14]])