pandas - plotting - Remuestreo de datos de minutos

python pandas plots (1)

Tengo datos de OHLCV basados en minutos para el rango de apertura / primera hora (9: 30-10: 30 AM EST). Estoy buscando volver a muestrear esta información para poder obtener un valor de 60 minutos y luego calcular el rango.

Cuando llamo a la función dataframe.resample () en los datos, obtengo dos filas y la fila inicial comienza a las 9:00 a.m. Estoy buscando solo una fila que comience a las 9:30 a.m.

Nota: los datos iniciales comienzan a las 9:30.

Editar: Agregar código:

# Extract data for regular trading hours (rth) from the 24 hour data set rth = data.between_time(start_time = ''09:30:00'', end_time = ''16:15:00'', include_end = False) # Extract data for extended trading hours (eth) from the 24 hour data set eth = data.between_time(start_time = ''16:30:00'', end_time = ''09:30:00'', include_end = False) # Extract data for initial balance (rth) from the 24 hour data set initial_balance = data.between_time(start_time = ''09:30:00'', end_time = ''10:30:00'', include_end = False)

Me quedé atascado, intenté separar el rango de apertura por fecha individual y obtuve el saldo inicial

conversion = {''Open'' : ''first'', ''High'' : ''max'', ''Low'' : ''min'', ''Close'' : ''last'', ''Volume'' : ''sum''} sample = data.between_time(start_time = ''09:30:00'', end_time = ''10:30:00'', include_end = False) sample = sample.ix[''2007-05-07''] sample.tail() sample.resample(''60Min'', how = conversion)

Por defecto, la remuestreo comienza al comienzo de la hora. Me gustaría que comience desde donde comienzan los datos.

Puede usar el argumento base de resample :

sample.resample(''60Min'', how=conversion, base=30)

Desde el enlace de documentos anterior :

base : int , predeterminado 0
Para frecuencias que subdividen uniformemente 1 día, el "origen" de los intervalos agregados.
Por ejemplo, para la frecuencia ''5min'', la base podría oscilar entre 0 y 4. Por defecto es 0