pandas - plotting - Remuestreo de datos de minutos
python pandas plots (1)
Tengo datos de OHLCV basados en minutos para el rango de apertura / primera hora (9: 30-10: 30 AM EST). Estoy buscando volver a muestrear esta información para poder obtener un valor de 60 minutos y luego calcular el rango.
Cuando llamo a la función dataframe.resample () en los datos, obtengo dos filas y la fila inicial comienza a las 9:00 a.m. Estoy buscando solo una fila que comience a las 9:30 a.m.
Nota: los datos iniciales comienzan a las 9:30.
Editar: Agregar código:
# Extract data for regular trading hours (rth) from the 24 hour data set
rth = data.between_time(start_time = ''09:30:00'', end_time = ''16:15:00'', include_end = False)
# Extract data for extended trading hours (eth) from the 24 hour data set
eth = data.between_time(start_time = ''16:30:00'', end_time = ''09:30:00'', include_end = False)
# Extract data for initial balance (rth) from the 24 hour data set
initial_balance = data.between_time(start_time = ''09:30:00'', end_time = ''10:30:00'', include_end = False)
Me quedé atascado, intenté separar el rango de apertura por fecha individual y obtuve el saldo inicial
conversion = {''Open'' : ''first'', ''High'' : ''max'', ''Low'' : ''min'', ''Close'' : ''last'', ''Volume'' : ''sum''}
sample = data.between_time(start_time = ''09:30:00'', end_time = ''10:30:00'', include_end = False)
sample = sample.ix[''2007-05-07'']
sample.tail()
sample.resample(''60Min'', how = conversion)
Por defecto, la remuestreo comienza al comienzo de la hora. Me gustaría que comience desde donde comienzan los datos.
Puede usar el argumento base
de resample
:
sample.resample(''60Min'', how=conversion, base=30)
Desde el enlace de documentos anterior :
base
:int
, predeterminado 0
Para frecuencias que subdividen uniformemente 1 día, el "origen" de los intervalos agregados.
Por ejemplo, para la frecuencia ''5min'', la base podría oscilar entre 0 y 4. Por defecto es 0