选购指南

最佳的 Polymarket 订单簿数据,以及如何挑选

你能找到的大多数 Polymarket 数据,只是每小时采样一次的最新价——画个图还行,拿来回测则毫无用处。下面讲清楚:一个真正能拿来交易的 Polymarket 数据源,和一个只是看起来像数据的数据源,本质差别究竟在哪里。

决定数据能否回测的五大标准

1. 分辨率:事件驱动,而非按固定间隔采样

按固定时钟采样的快照——每小时、每分钟、每隔几百毫秒一次——会漏掉两次采样之间发生的一切。Polymarket 的短期市场在 5 到 60 分钟内就结算完毕,所以按间隔采样在一个市场的整个生命周期里只能捕到寥寥几帧。

DepthFeedDepthFeed 在每一笔订单簿和价格变动事件发生时就记录下来——Polymarket 上中位交付约 10ms,Kalshi 上持续进行全深度轮询——因此两次采样之间的任何东西都不会丢失。

2. 订单簿深度,而非最新价

最新成交价(或单一中间价)掩盖了买卖价差,也掩盖了每个价位上挂着的量。没有完整的盘口阶梯,你无法测算滑点;而一个假设你按中间价成交的回测,就是一个会骗你的回测。

DepthFeedDepthFeed 提供完整的买/卖盘订单簿,双边、每一档——Kalshi 上每侧多达 100 levels——这样成交量就对着当时真实存在的流动性来撮合。

3. 覆盖范围:一套 schema,覆盖所有场所与所有标的

单一场所的数据集逼着你为每个市场拼凑一种不同的格式,每加一个市场就得重写一次加载器。标的覆盖不全,还会在不知不觉中限死你究竟能测哪些策略。

DepthFeedDepthFeed 用一套稳定的列式 schema 提供 Polymarket、Kalshi 和 Limitless 三家场所、覆盖七个标的——BTC、ETH、SOL、XRP、DOGE、BNB、HYPE——同一套代码就能读取每一家场所。

4. 交付方式:实时 API 加数据流,而非静态文件

一个可下载的 CSV 或 Parquet 文件就是一张冻结的快照——它会过期,你得重新下载,而且它永远变不成你真正拿来交易的那个东西。研究用的格式和生产用的格式最终各不相同,于是为了上线你得把一切重新接管一遍。

DepthFeedDepthFeed 是一个按量计费的 REST API(用于历史数据)加一个实时 WebSocket 流(用于当下),两者输出完全相同的 JSON。先回测,再把同一套代码指向实时数据流,开始交易。

5. 可信赖的真实成交还原

回测的全部意义,就在于搞清楚一个策略当时能否成交、以什么价成交。只有当你回放策略当时真正会撮合的那个订单簿、并且时间戳精细到足以与驱动行情的那一下波动对齐时,这个答案才存在。

DepthFeed每一张 DepthFeed 快照都带有以 epoch-millis 计的交易所时间戳和接收时间戳,并关联到一条高频标的价格,因此订单簿状态与现货走势能逐 tick 对齐。

常见选项的短板所在

人们找 Polymarket 数据时,通常会从四类东西里挑一个。每一类都有它的用处——但没有一类是你真正能拿来回测的订单簿。

交易所自家的 API
提供当前市场、成交以及实时盘口顶档,但不提供历史订单簿快照——根本没办法回放当时那个状态的订单簿。
免费的每小时归档
给你的是每小时采样一次的最新价。对一个可能只存活了五分钟的市场来说,那只是一帧——没有价差、没有深度,没有任何东西可供撮合成交。
最新价与成交流水 API
告诉你成交打印了什么,而不是当时挂着什么。你看得见已成交的交易,却永远看不到它们背后的流动性,所以滑点和成交概率始终是看不见的。
单一场所的文件转储
往往带有真实深度,但只针对一家场所、采用一种定制格式、以静态下载的形式提供——没有实时数据流、没有第二家场所,而且一落地就已过期。

为什么选 DepthFeed

DepthFeed 正是为越过 Polymarket 这全部五道门槛而打造的数据源:事件驱动的全深度采集,既以历史数据形式通过简洁的 REST API 提供,也以实时 WebSocket 流的形式交付,两者输出完全相同的 JSON。完整的 Polymarket 订单簿与价格数据,可直接对着真实流动性回测,再用同一套代码上线交易。

你的疑问,已解答。

最佳数据源应当:记录每一次订单簿变动(而非按固定间隔采样);提供双边完整的买/卖盘阶梯(而非只有最新价);用一套 schema 覆盖你交易的场所与标的;并以相同格式交付历史与实时数据,让你能用回测过的代码直接交易。DepthFeed 正是为 Polymarket 做到这一点而打造的,Polymarket 上实时中位交付约 10ms,Kalshi 上持续进行全深度采集。