我想在 InfluxDB 中存储交易以及最佳卖价/买价数据,后者的更新速度比前者快得多。
如果可能的话,我想使用一种允许我查询的模式:“对于市场 X 上的每笔交易,找到市场 Y 上的最佳卖价/买价,其时间戳 <= 交易的时间戳”。
(我将使用任何版本的 Influx。)
例如,交易可能如下所示:
Time Price Volume Direction Market
00:01.000 100 5 1 foo-bar
00:03.000 99 50 0 bar-baz
00:03.050 99 25 0 foo-bar
00:04.000 101 15 1 bar-baz
刻度数据可能看起来更像这样:
Time Ask Bid Market
00:00.763 100 99 bar-baz
00:01.010 101 99 foo-bar
00:01.012 101 98 bar-baz
00:01.012 101 99 foo-bar
00:01:238 100 99 bar-baz
...
00:03:021 101 98 bar-baz
我希望能够以某种方式加入某个市场的每笔交易,例如foo-bar,仅包含其他市场上的最新卖价/买价数据点,例如bar-baz,并得到如下结果:
Time Trade Price Ask Bid
00:01.000 100 100 99
00:03.050 99 101 98
这样我就可以计算市场 foo-bar 上的交易价格与市场 bar-baz 上最近报价的要价或买价之间的差异。
现在,我将交易存储在一个时间序列中,将要/出价数据点存储在另一个时间序列中,然后在客户端将它们合并,逻辑如下:
function merge(trades, quotes, data_points)
next_trade, more_trades = first(trades), rest(trades)
quotes = drop-while (quote.timestamp < next_trade.timestamp) quotes
data_point = join(next_trade, first(quotes))
if more_trades
return merge(more_trades, quotes, data_points + data_point)
return data_points + data_point
问题是客户必须丢弃大量的询价/出价数据点,因为它们更新如此频繁,而且只有交易前的最新更新才相关。
有数十个市场,我可能想将其最近的卖价/买价与交易进行比较,否则我只会将最近的卖价/买价存储在与交易相同的系列中。
是否可以用 Influx 或其他时间序列数据库做我想做的事?产生较低质量结果的另一种解决方案是按某个时间间隔(例如 250 毫秒)对卖价/买价数据进行分组,并从每个时间间隔中取出最后一个,以至少对客户之前必须放弃的报价数量施加上限找到最接近下一笔交易的那个。
最佳答案
注意。只是对 InfluxDB 术语的澄清。您可能正在以不同的度量(类似于表格)存储交易和报价数据。系列是基于标签值进行测量的分割。例如
Time Ask Bid Market
00:00.763 100 99 bar-baz
是一个系列
Time Ask Bid Market
00:01.010 101 99 foo-bar
是另一个系列(假设您将市场名称/ID 存储为标签而不是字段)
回答
也许您可以在客户端做的不是请求一段时间内的所有报价数据并丢弃大部分数据,而是针对每个交易和市场发出请求以准确获取(与交易有关的最新)要/出价数据点你需要的。类似:
function merge(trades, market)
points = <empty list>
for next_trade in trades
quote = db.query("select last(ask), last(bid) from tick_data where time<=next_trade.timestamp and Market=market and time>next_trade.timestamp - 1m")
// or to get a list per market with one query
// quote_per_market = db.query("select last(ask), last(bid) from tick_data where time<=next_trade.timestamp group by Market")
points = points + join(next_trade, quote)
return points
当然,您会有更频繁地查询数据库的开销,但根据交易数量和您的资源限制,它可能更有效。注意。这里的一个潜在陷阱是
ask
和 bid
以这种方式检索不是作为一对检索而是独立检索,当它们作为一对返回时,它们可能具有不同的时间戳。如果由于某种原因由于某些时间戳您只有 ask
或 bid
价格你可能会遇到这个问题。但是,只要您成对编写并且没有丢失数据就可以了。关于database - 在influxdb中合并不同粒度的时间序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58758835/