una tiempo proceso medir funcion ejecucion como comando capturar calcular python numpy machine-learning statistics data-science

proceso - tiempo de ejecucion python



¿Cómo optimizar el código MAPE en Python? (1)

Aquí hay un enfoque vectorizado con masking -

def mape_vectorized(a, b): mask = a <> 0 return (np.fabs(a[mask] - b[mask])/a[mask]).mean()

Probablemente uno más rápido con masking después del cálculo de la division .

def mape_vectorized_v2(a, b): mask = a <> 0 return (np.fabs(a - b)/a)[mask].mean()

Prueba de tiempo de ejecución

In [217]: a = np.random.randint(-10,10,(10000)) ...: b = np.random.randint(-10,10,(10000)) ...: In [218]: %timeit mape(a,b) 100 loops, best of 3: 11.7 ms per loop In [219]: %timeit mape_vectorized(a,b) 1000 loops, best of 3: 273 µs per loop In [220]: %timeit mape_vectorized_v2(a,b) 1000 loops, best of 3: 220 µs per loop

Necesito tener una función MAPE, sin embargo, no pude encontrarla en paquetes estándar ... A continuación, mi implementación de esta función.

def mape(actual, predict): tmp, n = 0.0, 0 for i in range(0, len(actual)): if actual[i] <> 0: tmp += math.fabs(actual[i]-predict[i])/actual[i] n += 1 return (tmp/n)

No me gusta, no es súper óptimo en términos de velocidad. ¿Cómo reescribir el código para que sea más de manera pitonica y aumente la velocidad?