python - transpuesta - numpy tutorial español pdf
Utilice directamente la biblioteca Intel mkl en la matriz dispersa de Scipy para calcular un punto AT con menos memoria (1)
Quiero llamar a mkl.mkl_scsrmultcsr desde python. El objetivo es calcular una matriz dispersa C en formato de filas dispersas dispersas . La matriz dispersa C es el producto de la matriz entre A y la transposición de A, donde A es también una matriz dispersa en formato csr. Al calcular C = A dot (AT) con scipy, scipy parece (?) Asignar nueva memoria para mantener la transposición de A (AT), y definitivamente asigna memoria para una nueva matriz C (Esto significa que no puedo usar una C existente matriz). Por lo tanto, quiero intentar usar la función mkl c directamente para disminuir el uso de la memoria.
Aquí hay una respuesta que funciona para otra función mkl. En esa respuesta, la función mkl fue más rápida en 4 veces.
La siguiente versión finalmente funciona después de trabajar en ella durante 4 días. Quiero saber si desperdicié algún recuerdo. ¿Haría ctype alguna copia de la matriz numpy? ¿Es eso esa conversión csr-> csc en la función de prueba necesaria? La función intel c puede calcular (AT) punto A, o A punto A, pero no A punto (AT).
Gracias de nuevo.
from ctypes import *
import scipy.sparse as spsp
import numpy as np
import multiprocessing as mp
# June 2nd 2016 version.
# Load the share library
mkl = cdll.LoadLibrary("")
def get_csr_handle(A,clear=False):
if clear == True:
A.indptr[:] = 0
A.indices[:] = 0[:] = 0
a_pointer =
# Array containing non-zero elements of the matrix A.
# This corresponds to data array of csr_matrix
# Its length is equal to #non zero elements in A
# (Can this be longer than actual #non-zero elements?)
assert % 16 == 0 # Check alignment
ja_pointer = A.indices.ctypes.data_as(POINTER(c_int))
# Array of column indices of all non-zero elements of A.
# This corresponds to the indices array of csr_matrix
assert % 16 == 0 # Check alignment
ia_pointer = A.indptr.ctypes.data_as(POINTER(c_int))
# Array of length m+1.
# a[ia[i]:ia[i+1]] is the value of nonzero entries of
# the ith row of A.
# ja[ia[i]:ia[i+1]] is the column indices of nonzero
# entries of the ith row of A
# This corresponds to the indptr array of csr_matrix
assert % 16 == 0 # Check alignment
A_data_size =
A_indices_size = A.indices.size
A_indptr_size = A.indptr.size
return (a_pointer, ja_pointer, ia_pointer, A)
def csr_dot_csr_t(A_handle, C_handle, nz=None):
# Calculate (A.T).dot(A) and put result into C
# This uses one-based indexing
# Both and must be in np.float32 type.
# Number of nonzero elements in C must be greater than
# or equal to the size of
# size of C.indptr must be greater than or equal to
# 1 + (num rows of A).
# C_data = np.zeros((nz), dtype=np.single)
# C_indices = np.zeros((nz), dtype=np.int32)
# C_indptr = np.zeros((m+1),dtype=np.int32)
#assert len(c_pointer._obj) >= 1 + A_shape[0]
(a_pointer, ja_pointer, ia_pointer, A) = A_handle
(c_pointer, jc_pointer, ic_pointer, C) = C_handle
#print "CCC",C
#assert type([0]) == np.float32
#assert type([0]) == np.float32
#assert C.indptr.size >= A.shape[0] + 1
#CC =
#assert >= nz
#assert C.indices.size >= nz
trans_pointer = byref(c_char(''T''))
sort_pointer = byref(c_int(0))
(m, n) = A.shape
sort_pointer = byref(c_int(0))
m_pointer = byref(c_int(m)) # Number of rows of matrix A
n_pointer = byref(c_int(n)) # Number of columns of matrix A
k_pointer = byref(c_int(n)) # Number of columns of matrix B
# should be n when trans=''T''
# Otherwise, I guess should be m
b_pointer = a_pointer
jb_pointer = ja_pointer
ib_pointer = ia_pointer
if nz == None:
nz = n*n #*n # m*m # Number of nonzero elements expected
# probably can use lower value for sparse
# matrices.
nzmax_pointer = byref(c_int(nz))
# length of arrays c and jc. (which are data and
# indices of csr_matrix). So this is the number of
# nonzero elements of matrix C
# This parameter is used only if request=0.
# The routine stops calculation if the number of
# elements in the result matrix C exceeds the
# specified value of nzmax.
info = c_int(-3)
info_pointer = byref(info)
request_pointer_list = [byref(c_int(0)), byref(c_int(1)), byref(c_int(2))]
return_list = []
for ii in [0]:
request_pointer = request_pointer_list[ii]
ret = mkl.mkl_scsrmultcsr(trans_pointer, request_pointer, sort_pointer,
m_pointer, n_pointer, k_pointer,
a_pointer, ja_pointer, ia_pointer,
b_pointer, jb_pointer, ib_pointer,
c_pointer, jc_pointer, ic_pointer,
nzmax_pointer, info_pointer)
info_val = info.value
return_list += [ (ret,info_val) ]
return return_list
def show_csr_internal(A, indent=4):
# Print data, indptr, and indices
# of a scipy csr_matrix A
name = [''data'', ''indptr'', ''indices'']
mat = [, A.indptr, A.indices]
for i in range(3):
str_print = '' ''*indent+name[i]+'':/n%s''%mat[i]
str_print = str_print.replace(''/n'', ''/n''+'' ''*indent*2)
def fix_for_scipy(C,A):
n = A.shape[1]
print "fix n", n
nz = C.indptr[n] - 1 # -1 as this is still one based indexing.
print "fix nz", nz
data =[:nz]
C.indptr[:n+1] -= 1
indptr = C.indptr[:n+1]
C.indices[:nz] -= 1
indices = C.indices[:nz]
return spsp.csr_matrix( (data, indices, indptr), shape=(n,n))
def test():
AA= [[1,0,0,1],
AA = np.random.choice([0,1], size=(3,750000), replace=True, p=[0.99,0.01])
A_original = spsp.csr_matrix(AA)
#A = spsp.csr_matrix(A_original, dtype=np.float32)
A = A_original.astype(np.float32).tocsc()
#A_original = A.todense()
A = spsp.csr_matrix( (, A.indices, A.indptr) )
print "A:"
print A.todense()
A.indptr += 1 # convert to 1-based indexing
A.indices += 1 # convert to 1-based indexing
A_ptrs = get_csr_handle(A)
C = spsp.csr_matrix( np.ones((3,3)), dtype=np.float32) =[:16].view()
#C.indptr = C.indptr
C_ptrs = get_csr_handle(C, clear=True)
print "C:"
print "=call mkl function="
return_list= csr_dot_csr_t(A_ptrs, C_ptrs)
print "(ret, info):", return_list
print "C after calling mkl:"
C_fix = fix_for_scipy(C,A)
print "C_fix for scipy:"
print C_fix.todense()
print "Original C after fixing:"
print "scipy''s (A).dot(A.T)"
scipy_ans = (A_original).dot(A_original.T)
#scipy_ans = spsp.csr_matrix(scipy_ans)
print scipy_ans.todense()
if __name__ == "__main__":
[ 1. 1. 1. ..., 1. 1. 1.]
[ 0 0 0 ..., 22673 22673 22673]
[1 0 2 ..., 2 1 2]
[[ 0. 0. 0.]
[ 0. 0. 0.]
[ 0. 0. 0.]
[ 0. 0. 0.]
[ 0. 0. 0.]
[ 0. 0. 0.]]
[ 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0 0 0 0]
[0 0 0 0 0 0 0 0 0]
=call mkl function=
(ret, info): [(2, 0)]
C after calling mkl:
[ 7576. 77. 83. 77. 7607. 104. 83. 104. 7490.]
[ 1 4 7 10]
[1 2 3 1 2 3 1 2 3]
fix n 3
fix nz 9
C_fix for scipy:
[ 7576. 77. 83. 77. 7607. 104. 83. 104. 7490.]
[0 3 6 9]
[0 1 2 0 1 2 0 1 2]
[[ 7576. 77. 83.]
[ 77. 7607. 104.]
[ 83. 104. 7490.]]
Original C after fixing:
[ 7576. 77. 83. 77. 7607. 104. 83. 104. 7490.]
[0 3 6 9]
[0 1 2 0 1 2 0 1 2]
scipy''s (A.T).dot(A)
[ 83 77 7576 104 77 7607 83 104 7490]
[0 3 6 9]
[2 1 0 2 0 1 0 1 2]
[[7576 77 83]
[ 77 7607 104]
[ 83 104 7490]]
Cosas aprendidas:
- el índice comienza desde 1 para las matrices A, B y C.
- Mezclé c_indptr y c_indices en el código original. Debería ser ia = indptr de scipy csr_matrix. ja = índices de scipy csr_matrix.
del código aquí . Todo se pasa al mkl_? Csrmultcsr como un puntero.
mkl_scsrmultcsr(&ta, &r[1], &sort, &m, &m, &m, a, ja, ia, a, ja, ia, c, jc, ic, &nzmax, &info);
Quiero una función mkl que pueda funcionar con índice basado en cero. La función mkl.mkl_scsrmultcsr solo puede funcionar con indexación basada en uno. (O puedo hacer una indexación basada en una sola fuente para todo. Esto significa usar la función intel c en lugar de scipy / numpy para la mayoría de los pasos de álgebra lineal).
Mire el código de Python para el escaso producto scipy. Observe que llama al código compilado en 2 pases.
Parece que el código mkl hace lo mismo
Si request = 1, la rutina calcula solo valores de la matriz ic de longitud m + 1, la memoria para esta matriz debe asignarse de antemano. Al salir, el valor ic (m + 1) - 1 es el número real de los elementos en las matrices c y jc.
Si request = 2, se ha llamado previamente a la rutina con el parámetro request = 1, las matrices de salida jc y c están asignadas en el programa de llamada y tienen una longitud ic (m + 1) - 1 como mínimo.
Primero asignó ic
función del número de filas de C
(lo sabe de las entradas), y llama al código mkl con request=1
Para request=2
, debe asignar matrices c
y jc
, según el tamaño en ic(m+1) - 1
. Esto no es lo mismo que la cantidad de nnz
en las matrices de entrada.
Está utilizando request1 = c_int(0)
, que requiere que las matrices c
tengan el tamaño correcto, lo que usted no sabe sin realizar realmente el dot
(o una request 1
File: /usr/lib/python3/dist-packages/scipy/sparse/
Definition: A._mul_sparse_matrix(self, other)
pase 1 asigna indptr
(tamaño de nota) y pasa los punteros (los datos no importan en este pase)
indptr = np.empty(major_axis + 1, dtype=idx_dtype)
fn = getattr(_sparsetools, self.format + ''_matmat_pass1'')
fn(M, N,
np.asarray(self.indptr, dtype=idx_dtype),
np.asarray(self.indices, dtype=idx_dtype),
np.asarray(other.indptr, dtype=idx_dtype),
np.asarray(other.indices, dtype=idx_dtype),
nnz = indptr[-1]
el pase 2 asigna indptr
(tamaño diferente) y se basa en indices
y data
indptr = np.asarray(indptr, dtype=idx_dtype)
indices = np.empty(nnz, dtype=idx_dtype)
data = np.empty(nnz, dtype=upcast(self.dtype, other.dtype))
fn = getattr(_sparsetools, self.format + ''_matmat_pass2'')
fn(M, N, np.asarray(self.indptr, dtype=idx_dtype),
np.asarray(self.indices, dtype=idx_dtype),,
np.asarray(other.indptr, dtype=idx_dtype),
np.asarray(other.indices, dtype=idx_dtype),,
indptr, indices, data)
Por último crea una nueva matriz usando estas matrices.
return self.__class__((data,indices,indptr),shape=(M,N))
La biblioteca mkl
debe usar de la misma manera.
tiene el código c para csr_matmat_pass1
y csr_matmat_pass2
En caso de que ayude, aquí hay una implementación pura de Python de estos pases. Una traducción literal sin ningún intento de aprovechar cualquier operación de matriz.
def pass1(A, B):
for i in range(nrow):
for jj in range(Aptr[i],Aptr[i+1]):
for kk in range(Bptr[j],Bptr[j+1]):
if mask[k]!=i:
row_nnz += 1
nnz += row_nnz
return Cp
def pass2(A,B,Cnnz):
next = np.zeros(ncol,int)-1
sums = np.zeros(ncol,A.dtype)
nnz = 0
for i in range(nrow):
head = -2
length = 0
for jj in range(Ap[i], Ap[i+1]):
j, v = Aj[jj], Ax[jj]
for kk in range(Bp[j], Bp[j+1]):
k = Bj[kk]
sums[k] += v*Bx[kk]
if (next[k]==-1):
next[k], head=head, k
length += 1
print(i,sums, next)
for _ in range(length):
if sums[head] !=0:
Cj[nnz], Cx[nnz] = head, sums[head]
nnz += 1
temp = head
head = next[head]
next[temp], sums[temp] = -1, 0
Cp[i+1] = nnz
return Cp, Cj, Cx
def pass0(A,B):
Cp = pass1(A,B)
nnz = Cp[-1]
N,M=A.shape[0], B.shape[1]
C=sparse.csr_matrix((Cx, Cj, Cp), shape=(N,M))
return C
Tanto A
como B
tienen que ser csr
. Utilizando una transposición, necesita conversión, por ejemplo, B = ATtocsr()