libreria - ¿Cuáles son las diferencias entre Pandas y NumPy+SciPy en Python?
pandas python (3)
De hecho, pandas proporciona herramientas de manipulación de datos de alto nivel creadas sobre NumPy. NumPy en sí mismo es una herramienta de bajo nivel, y será muy similar al uso de MATLAB. pandas, por otro lado, ofrece una rica funcionalidad de series de tiempo, alineación de datos, estadísticas amigables para NA, métodos groupby, merge y join, y muchas otras comodidades. Se ha vuelto muy popular en los últimos años en aplicaciones financieras. Tendré un capítulo dedicado al análisis de datos financieros usando pandas en mi próximo libro.
Ambos parecen muy similares y tengo curiosidad sobre qué paquete sería más beneficioso para el análisis de datos financieros.
Los pandas (y prácticamente todas las herramientas numéricas para Python) requieren Numpy. Scipy no es estrictamente necesario para los pandas, pero figura como una "dependencia opcional". No diría que los pandas son una alternativa a Numpy y / o Scipy. Más bien, es una herramienta adicional que proporciona una forma más simplificada de trabajar con datos numéricos y tabulares en Python. Puedes usar estructuras de datos de pandas pero dibujar libremente en las funciones Numpy y Scipy para manipularlas.
Los pandas ofrecen una excelente manera de manipular tablas, ya que puedes hacer binning fácil ( binning un marco de datos en pandas en Python ) y calcular estadísticas. Otra cosa que es genial en los pandas es la clase Panel, en la que puedes unir series de capas con diferentes propiedades y combinarlas usando la función groupby.