python - multiplicar - ¿Cuál es la forma más sencilla de extender una matriz numpy en 2 dimensiones?
shape en python (7)
Tengo una matriz 2d que se ve así:
XX
xx
¿Cuál es la forma más eficiente de agregar una fila y columna adicionales?
xxy
xxy
yyy
Para obtener puntos de bonificación, también me gustaría poder eliminar filas y columnas individuales, así que, por ejemplo, en la matriz de abajo me gustaría poder eliminar todas las a''s, dejando solo las x, específicamente estoy tratando de eliminar la enésima fila y la enésima columna al mismo tiempo, y quiero poder hacerlo lo más rápido posible:
xxaxx
xxaxx
aaaaa
xxaxx
xxaxx
El más corto en términos de líneas de código que puedo pensar es para la primera pregunta.
>>> import numpy as np
>>> p = np.array([[1,2],[3,4]])
>>> p = np.append(p, [[5,6]], 0)
>>> p = np.append(p, [[7],[8],[9]],1)
>>> p
array([[1, 2, 7],
[3, 4, 8],
[5, 6, 9]])
Y la para la segunda pregunta
p = np.array(range(20))
>>> p.shape = (4,5)
>>> p
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
>>> n = 2
>>> p = np.append(p[:n],p[n+1:],0)
>>> p = np.append(p[...,:n],p[...,n+1:],1)
>>> p
array([[ 0, 1, 3, 4],
[ 5, 6, 8, 9],
[15, 16, 18, 19]])
Me resulta mucho más fácil "extender" a través de la asignación en una matriz más grande. P.ej
import numpy as np
p = np.array([[1,2], [3,4]])
g = np.array(range(20))
g.shape = (4,5)
g[0:2, 0:2] = p
Aquí están los arreglos:
p
array([[1, 2],
[3, 4]])
g
:
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
y la g
resultante después de la asignación:
array([[ 1, 2, 2, 3, 4],
[ 3, 4, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
Otra solución elegante a la primera pregunta puede ser el comando de insert
:
p = np.array([[1,2],[3,4]])
p = np.insert(p, 2, values=0, axis=1) # insert values before column 2
Lleva a:
array([[1, 2, 0],
[3, 4, 0]])
insert
puede ser más lenta que la append
pero le permite completar toda la fila / columna con un valor fácilmente.
En cuanto a la segunda pregunta , se ha sugerido delete
antes:
p = np.delete(p, 2, axis=1)
Que restaura la matriz original de nuevo:
array([[1, 2],
[3, 4]])
Puedes usar:
>>> np.concatenate([array1, array2, ...])
p.ej
>>> import numpy as np
>>> a = [[1, 2, 3],[10, 20, 30]]
>>> b = [[100,200,300]]
>>> a = np.array(a) # not necessary, but numpy objects prefered to built-in
>>> b = np.array(b) # "^
>>> a
array([[ 1, 2, 3],
[10, 20, 30]])
>>> b
array([[100, 200, 300]])
>>> c = np.concatenate([a,b])
>>> c
array([[ 1, 2, 3],
[ 10, 20, 30],
[100, 200, 300]])
>>> print c
[[ 1 2 3]
[ 10 20 30]
[100 200 300]]
~ - + - ~ - + - ~ - + - ~
A veces, te encontrarás con problemas si un objeto numpy array se inicializa con valores incompletos para su propiedad de forma. Este problema se soluciona asignando a la propiedad de forma la tupla: (array_length, element_length).
Nota: Aquí, ''array_length'' y ''element_length'' son parámetros enteros, en los que se sustituyen los valores. Una ''tupla'' es solo un par de números entre paréntesis.
p.ej
>>> import numpy as np
>>> a = np.array([[1,2,3],[10,20,30]])
>>> b = np.array([100,200,300]) # initialize b with incorrect dimensions
>>> a.shape
(2, 3)
>>> b.shape
(3,)
>>> c = np.concatenate([a,b])
Traceback (most recent call last):
File "<pyshell#191>", line 1, in <module>
c = np.concatenate([a,b])
ValueError: all the input arrays must have same number of dimensions
>>> b.shape = (1,3)
>>> c = np.concatenate([a,b])
>>> c
array([[ 1, 2, 3],
[ 10, 20, 30],
[100, 200, 300]])
Responde a la primera pregunta:
Use numpy.append.
http://docs.scipy.org/doc/numpy/reference/generated/numpy.append.html#numpy.append
Responde a la segunda pregunta:
Use numpy.delete
http://docs.scipy.org/doc/numpy/reference/generated/numpy.delete.html
tal vez lo necesites
>>> x = np.array([11,22])
>>> y = np.array([18,7,6])
>>> z = np.array([1,3,5])
>>> np.concatenate((x,y,z))
array([11, 22, 18, 7, 6, 1, 3, 5])
Una respuesta alternativa útil a la primera pregunta, usando los ejemplos de la respuesta de Tomeedee , sería usar los métodos numpy vstack y column_stack :
Dada una matriz p,
>>> import numpy as np
>>> p = np.array([ [1,2] , [3,4] ])
una matriz aumentada puede ser generada por:
>>> p = np.vstack( [ p , [5 , 6] ] )
>>> p = np.column_stack( [ p , [ 7 , 8 , 9 ] ] )
>>> p
array([[1, 2, 7],
[3, 4, 8],
[5, 6, 9]])
Estos métodos pueden ser prácticos en la práctica que np.append (), ya que permiten agregar matrices 1D a una matriz sin ninguna modificación, en contraste con el siguiente escenario:
>>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ] )
>>> p = np.append( p , [ 7 , 8 , 9 ] , 1 )
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append
return concatenate((arr, values), axis=axis)
ValueError: arrays must have same number of dimensions
En respuesta a la segunda pregunta, una buena manera de eliminar filas y columnas es utilizar la indexación de matriz lógica de la siguiente manera:
Dada una matriz p,
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
supongamos que queremos eliminar la fila 1 y la columna 2:
>>> r , c = 1 , 2
>>> p = p [ np.arange( p.shape[0] ) != r , : ]
>>> p = p [ : , np.arange( p.shape[1] ) != c ]
>>> p
array([[ 0, 1, 3, 4],
[10, 11, 13, 14],
[15, 16, 18, 19]])
Nota: para los usuarios de Matlab reformados, si desea hacer esto en un solo trazo, debe indizar dos veces:
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> p = p [ np.arange( p.shape[0] ) != r , : ] [ : , np.arange( p.shape[1] ) != c ]
Esta técnica también se puede ampliar para eliminar conjuntos de filas y columnas, por lo que si quisiéramos eliminar las filas 0 y 2 y las columnas 1, 2 y 3 podríamos usar la función setdiff1d de numpy para generar el índice lógico deseado:
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> r = [ 0 , 2 ]
>>> c = [ 1 , 2 , 3 ]
>>> p = p [ np.setdiff1d( np.arange( p.shape[0] ), r ) , : ]
>>> p = p [ : , np.setdiff1d( np.arange( p.shape[1] ) , c ) ]
>>> p
array([[ 5, 9],
[15, 19]])