Merge pull request #1585 from 1122455801/cta

[Add] cta策略说明文档
2019-04-12 20:57:28 +08:00 · 2019-04-12 20:57:28 +08:00 · be0baed091
commit be0baed091
parent fa16ceb15f e7c1496edf
1 changed files with 684 additions and 6 deletions
--- a/docs/cta_strategy.md
+++ b/docs/cta_strategy.md
@ -1,23 +1,701 @@
 # CTA策略模块


-## 模块构成
+## 1. 模块构成
+
+CTA策略模块主要由7部分构成，如下图：
+
+- base：定义了CTA模块中用到的一些基础设置，如引擎类型（回测/实盘）、回测模式（K线/Tick）、本地停止单的定义以及停止单状态（等待中/已撤销/已触发）。
+  
+- template：定义了CTA策略模板（包含信号生成和委托管理）、CTA信号（仅负责信号生成）、目标仓位算法（仅负责委托管理，适用于拆分巨型委托，降低冲击成本）。
+- strategies: 官方提供的cta策略示例，包含从最基础的双均线策略，到通道突破类型的布林带策略，到跨时间周期策略，再到把信号生成和委托管理独立开来的多信号策略。
+- backesting：包含回测引擎和参数优化。其中回测引擎定义了数据载入、委托撮合机制、计算与统计相关盈利指标、结果绘图等函数。
+- converter：定义了针对上期所品种平今/平昨模式的委托转换模块；对于其他品种用户也可以通过可选参数lock切换至锁仓模式。
+- engine：定义了CTA策略实盘引擎，其中包括：RQData客户端初始化和数据载入、策略的初始化和启动、推送Tick订阅行情到策略中、挂撤单操作、策略的停止和移除等。
+- ui：基于PyQt5的GUI图形应用。
+
+![enter image description here](https://vnpy-community.oss-cn-shanghai.aliyuncs.com/forum_experience/yazhang/cta_strategy/seix_elementos.png "enter image title here")
+
+&nbsp;
+
+## 2. 历史数据


-## 历史数据
+&nbsp;
+
+## 3. 策略开发
+CTA策略模板提供完整的信号生成和委托管理功能，用户可以基于该模板自行开发策略。新策略可以放在根目录下vnpy\app\cta_strategy\strategies文件夹内，也可以放在用户运行的文件内（VN Station模式）。注意：策略文件命名是以下划线模式，如boll_channel_strategy.py；而策略类命名采用的是驼峰式，如BollChannelStrategy。
+
+下面通过BollChannelStrategy策略示例，来展示策略开发的具体步骤：
+
+### 3.1 参数设置
+
+定义策略参数并且初始化策略变量。策略参数为策略类的公有属性，用户可以通过创建新的实例来调用或者改变策略参数。
+
+如针对rb1905品种，用户可以创建基于BollChannelStrategy的策略示例，如RB_BollChannelStrategy，boll_window可以由18改成30。
+
+创建策略实例的方法有效地实现了一个策略跑多个品种，并且其策略参数可以通过品种的特征进行调整。
+```
+    boll_window = 18
+    boll_dev = 3.4
+    cci_window = 10
+    atr_window = 30
+    sl_multiplier = 5.2
+    fixed_size = 1
+
+    boll_up = 0
+    boll_down = 0
+    cci_value = 0
+    atr_value = 0
+
+    intra_trade_high = 0
+    intra_trade_low = 0
+    long_stop = 0
+    short_stop = 0
+```
+
+### 3.2 类的初始化
+初始化分3步：
+- 通过super( )的方法继承CTA策略模板，在__init__( )函数传入CTA引擎、策略名称、vt_symbol、参数设置。
+- 调用K线生成模块:通过时间切片来把Tick数据合成1分钟K线数据，然后更大的时间周期数据，如15分钟K线。
+- 调用K线时间序列管理模块：基于K线数据，如1分钟、15分钟，来生成相应的技术指标。
+  
+```
+    def __init__(self, cta_engine, strategy_name, vt_symbol, setting):
+        """"""
+        super(BollChannelStrategy, self).__init__(
+            cta_engine, strategy_name, vt_symbol, setting
+        )
+
+        self.bg = BarGenerator(self.on_bar, 15, self.on_15min_bar)
+        self.am = ArrayManager()
+```
+
+### 3.3 策略的初始化、启动、停止
+通过“CTA策略”组件的相关功能按钮实现。
+
+注意：函数load_bar(10)，代表策略初始化需要载入10个交易日的历史数据。该历史数据可以是Tick数据，也可以是K线数据。
+
+```
+    def on_init(self):
+        """
+        Callback when strategy is inited.
+        """
+        self.write_log("策略初始化")
+        self.load_bar(10)
+
+    def on_start(self):
+        """
+        Callback when strategy is started.
+        """
+        self.write_log("策略启动")
+
+    def on_stop(self):
+        """
+        Callback when strategy is stopped.
+        """
+        self.write_log("策略停止")
+```
+### 3.4 Tick数据回报
+策略订阅某品种合约行情，交易所会推送Tick数据到该策略上。
+
+由于BollChannelStrategy是基于15分钟K线来生成交易信号的，故收到Tick数据后，需要用到K线生成模块里面的update_tick函数，通过时间切片的方法，聚合成1分钟K线数据，并且推送到on_bar函数。
+
+```
+    def on_tick(self, tick: TickData):
+        """
+        Callback of new tick data update.
+        """
+        self.bg.update_tick(tick)
+```
+
+### 3.5 K线数据回报
+
+收到推送过来的1分钟K线数据后，通过K线生成模块里面的update_bar函数，以分钟切片的方法，合成15分钟K线数据，并且推送到on_15min_bar函数。
+```
+    def on_bar(self, bar: BarData):
+        """
+        Callback of new bar data update.
+        """
+        self.bg.update_bar(bar)
+```
+
+### 3.6 15分钟K线数据回报
+
+负责CTA信号的生成，由3部分组成：
+- 清空未成交委托：为了防止之前下的单子在上一个15分钟没有成交，但是下一个15分钟可能已经调整了价格，就用cancel_all()方法立刻撤销之前未成交的所有委托，保证策略在当前这15分钟开始时的整个状态是清晰和唯一的。
+- 调用K线时间序列管理模块：基于最新的15分钟K线数据来计算相应计算指标，如布林带通道上下轨、CCI指标、ATR指标
+- 信号计算：通过持仓的判断以及结合CCI指标、布林带通道、ATR指标在通道突破点挂出停止单委托（buy/sell)，同时设置离场点(short/cover)。
+
+注意：CTA策略具有低胜率和高盈亏比的特定：在难以提升胜率的情况下，研究提高策略盈亏比有利于策略盈利水平的上升。
+
+```
+    def on_15min_bar(self, bar: BarData):
+        """"""
+        self.cancel_all()
+
+        am = self.am
+        am.update_bar(bar)
+        if not am.inited:
+            return
+
+        self.boll_up, self.boll_down = am.boll(self.boll_window, self.boll_dev)
+        self.cci_value = am.cci(self.cci_window)
+        self.atr_value = am.atr(self.atr_window)
+
+        if self.pos == 0:
+            self.intra_trade_high = bar.high_price
+            self.intra_trade_low = bar.low_price
+
+            if self.cci_value > 0:
+                self.buy(self.boll_up, self.fixed_size, True)
+            elif self.cci_value < 0:
+                self.short(self.boll_down, self.fixed_size, True)
+
+        elif self.pos > 0:
+            self.intra_trade_high = max(self.intra_trade_high, bar.high_price)
+            self.intra_trade_low = bar.low_price
+
+            self.long_stop = self.intra_trade_high - self.atr_value * self.sl_multiplier
+            self.sell(self.long_stop, abs(self.pos), True)
+
+        elif self.pos < 0:
+            self.intra_trade_high = bar.high_price
+            self.intra_trade_low = min(self.intra_trade_low, bar.low_price)
+
+            self.short_stop = self.intra_trade_low + self.atr_value * self.sl_multiplier
+            self.cover(self.short_stop, abs(self.pos), True)
+
+        self.put_event()
+```
+
+### 3.7 委托回报、成交回报、停止单回报
+
+在策略中可以直接pass，其具体逻辑应用交给回测/实盘引擎负责。
+```
+    def on_order(self, order: OrderData):
+        """
+        Callback of new order data update.
+        """
+        pass
+
+    def on_trade(self, trade: TradeData):
+        """
+        Callback of new trade data update.
+        """
+        self.put_event()
+
+    def on_stop_order(self, stop_order: StopOrder):
+        """
+        Callback of stop order update.
+        """
+        pass
+```



-## 策略开发

+&nbsp;

-## 回测研究
+## 4. 回测研究
+backtesting.py定义了回测引擎，下面主要介绍相关功能函数，以及回测引擎应用示例：
+
+### 4.1 加载策略
+
+把CTA策略逻辑，对应合约品种，以及参数设置（可在策略文件外修改）载入到回测引擎中。
+```
+    def add_strategy(self, strategy_class: type, setting: dict):
+        """"""
+        self.strategy_class = strategy_class
+        self.strategy = strategy_class(
+            self, strategy_class.__name__, self.vt_symbol, setting
+        )
+```
+&nbsp;
+
+### 4.2 载入历史数据
+
+负责载入对应品种的历史数据，大概有4个步骤：
+- 根据数据类型不同，分成K线模式和Tick模式；
+- 通过select().where()方法，有条件地从数据库中选取数据，其筛选标准包括：vt_symbol、 回测开始日期、回测结束日期、K线周期（K线模式下）；
+- order_by(DbBarData.datetime)表示需要按照时间顺序载入数据；
+- 载入数据是以迭代方式进行的，数据最终存入self.history_data。
+
+```
+    def load_data(self):
+        """"""
+        self.output("开始加载历史数据")
+
+        if self.mode == BacktestingMode.BAR:
+            s = (
+                DbBarData.select()
+                .where(
+                    (DbBarData.vt_symbol == self.vt_symbol) 
+                    & (DbBarData.interval == self.interval) 
+                    & (DbBarData.datetime >= self.start) 
+                    & (DbBarData.datetime <= self.end)
+                )
+                .order_by(DbBarData.datetime)
+            )
+            self.history_data = [db_bar.to_bar() for db_bar in s]
+        else:
+            s = (
+                DbTickData.select()
+                .where(
+                    (DbTickData.vt_symbol == self.vt_symbol) 
+                    & (DbTickData.datetime >= self.start) 
+                    & (DbTickData.datetime <= self.end)
+                )
+                .order_by(DbTickData.datetime)
+            )
+            self.history_data = [db_tick.to_tick() for db_tick in s]
+
+        self.output(f"历史数据加载完成，数据量：{len(self.history_data)}")
+```
+&nbsp;
+
+### 4.3 撮合成交
+
+载入CTA策略以及相关历史数据后，策略会根据最新的数据来计算相关指标。若符合条件会生成交易信号，发出具体委托（buy/sell/short/cover），并且在下一根K线成交。
+
+根据委托类型的不同，回测引擎提供2种撮合成交机制来尽量模仿真实交易环节：
+
+- 限价单撮合成交：（以买入方向为例）先确定是否发生成交，成交标准为委托价>= 下一根K线的最低价；然后确定成交价格，成交价格为委托价与下一根K线开盘价的最小值。
+
+- 停止单撮合成交：（以买入方向为例）先确定是否发生成交，成交标准为委托价<= 下一根K线的最高价；然后确定成交价格，成交价格为委托价与下一根K线开盘价的最大值。
+
+&nbsp;
+
+下面展示在引擎中限价单撮合成交的流程：
+- 确定会撮合成交的价格；
+- 遍历限价单字典中的所有限价单，推送委托进入未成交队列的更新状态；
+- 判断成交状态，若出现成交，推送成交数据和委托数据；
+- 从字典中删除已成交的限价单。
+
+```
+    def cross_limit_order(self):
+        """
+        Cross limit order with last bar/tick data.
+        """
+        if self.mode == BacktestingMode.BAR:
+            long_cross_price = self.bar.low_price
+            short_cross_price = self.bar.high_price
+            long_best_price = self.bar.open_price
+            short_best_price = self.bar.open_price
+        else:
+            long_cross_price = self.tick.ask_price_1
+            short_cross_price = self.tick.bid_price_1
+            long_best_price = long_cross_price
+            short_best_price = short_cross_price
+
+        for order in list(self.active_limit_orders.values()):
+            # Push order update with status "not traded" (pending)
+            if order.status == Status.SUBMITTING:
+                order.status = Status.NOTTRADED
+                self.strategy.on_order(order)
+
+            # Check whether limit orders can be filled.
+            long_cross = (
+                order.direction == Direction.LONG 
+                and order.price >= long_cross_price 
+                and long_cross_price > 0
+            )
+
+            short_cross = (
+                order.direction == Direction.SHORT 
+                and order.price <= short_cross_price 
+                and short_cross_price > 0
+            )
+
+            if not long_cross and not short_cross:
+                continue
+
+            # Push order udpate with status "all traded" (filled).
+            order.traded = order.volume
+            order.status = Status.ALLTRADED
+            self.strategy.on_order(order)
+
+            self.active_limit_orders.pop(order.vt_orderid)
+
+            # Push trade update
+            self.trade_count += 1
+
+            if long_cross:
+                trade_price = min(order.price, long_best_price)
+                pos_change = order.volume
+            else:
+                trade_price = max(order.price, short_best_price)
+                pos_change = -order.volume
+
+            trade = TradeData(
+                symbol=order.symbol,
+                exchange=order.exchange,
+                orderid=order.orderid,
+                tradeid=str(self.trade_count),
+                direction=order.direction,
+                offset=order.offset,
+                price=trade_price,
+                volume=order.volume,
+                time=self.datetime.strftime("%H:%M:%S"),
+                gateway_name=self.gateway_name,
+            )
+            trade.datetime = self.datetime
+
+            self.strategy.pos += pos_change
+            self.strategy.on_trade(trade)
+
+            self.trades[trade.vt_tradeid] = trade
+```
+
+&nbsp;
+
+### 4.4 计算策略盈亏情况
+
+基于收盘价、当日持仓量、合约规模、滑点、手续费率等计算总盈亏与净盈亏，并且其计算结果以DataFrame格式输出，完成基于逐日盯市盈亏统计。
+
+下面展示盈亏情况的计算过程
+
+- 浮动盈亏 = 持仓量 \*（当日收盘价 - 昨日收盘价）\*  合约规模
+- 实际盈亏 = 持仓变化量  \* （当时收盘价 - 开仓成交价）\* 合约规模
+- 总盈亏 = 浮动盈亏 + 实际盈亏
+- 净盈亏 = 总盈亏 - 总手续费 - 总滑点
+
+```
+    def calculate_pnl(
+        self,
+        pre_close: float,
+        start_pos: float,
+        size: int,
+        rate: float,
+        slippage: float,
+    ):
+        """"""
+        self.pre_close = pre_close
+
+        # Holding pnl is the pnl from holding position at day start
+        self.start_pos = start_pos
+        self.end_pos = start_pos
+        self.holding_pnl = self.start_pos * \
+            (self.close_price - self.pre_close) * size
+
+        # Trading pnl is the pnl from new trade during the day
+        self.trade_count = len(self.trades)
+
+        for trade in self.trades:
+            if trade.direction == Direction.LONG:
+                pos_change = trade.volume
+            else:
+                pos_change = -trade.volume
+
+            turnover = trade.price * trade.volume * size
+
+            self.trading_pnl += pos_change * \
+                (self.close_price - trade.price) * size
+            self.end_pos += pos_change
+            self.turnover += turnover
+            self.commission += turnover * rate
+            self.slippage += trade.volume * size * slippage
+
+        # Net pnl takes account of commission and slippage cost
+        self.total_pnl = self.trading_pnl + self.holding_pnl
+        self.net_pnl = self.total_pnl - self.commission - self.slippage
+```
+&nbsp;



-## 参数优化
+### 4.5 计算策略统计指标
+calculate_statistics函数是基于逐日盯市盈亏情况（DateFrame格式）来计算衍生指标，如最大回撤、年化收益、盈亏比、夏普比率等。
+
+```
+            df["balance"] = df["net_pnl"].cumsum() + self.capital
+            df["return"] = np.log(df["balance"] / df["balance"].shift(1)).fillna(0)
+            df["highlevel"] = (
+                df["balance"].rolling(
+                    min_periods=1, window=len(df), center=False).max()
+            )
+            df["drawdown"] = df["balance"] - df["highlevel"]
+            df["ddpercent"] = df["drawdown"] / df["highlevel"] * 100
+
+            # Calculate statistics value
+            start_date = df.index[0]
+            end_date = df.index[-1]
+
+            total_days = len(df)
+            profit_days = len(df[df["net_pnl"] > 0])
+            loss_days = len(df[df["net_pnl"] < 0])
+
+            end_balance = df["balance"].iloc[-1]
+            max_drawdown = df["drawdown"].min()
+            max_ddpercent = df["ddpercent"].min()
+
+            total_net_pnl = df["net_pnl"].sum()
+            daily_net_pnl = total_net_pnl / total_days
+
+            total_commission = df["commission"].sum()
+            daily_commission = total_commission / total_days
+
+            total_slippage = df["slippage"].sum()
+            daily_slippage = total_slippage / total_days
+
+            total_turnover = df["turnover"].sum()
+            daily_turnover = total_turnover / total_days
+
+            total_trade_count = df["trade_count"].sum()
+            daily_trade_count = total_trade_count / total_days
+
+            total_return = (end_balance / self.capital - 1) * 100
+            annual_return = total_return / total_days * 240
+            daily_return = df["return"].mean() * 100
+            return_std = df["return"].std() * 100
+
+            if return_std:
+                sharpe_ratio = daily_return / return_std * np.sqrt(240)
+            else:
+                sharpe_ratio = 0
+```
+&nbsp;
+
+### 4.6 统计指标绘图
+通过matplotlib绘制4幅图：
+- 资金曲线图
+- 资金回撤图
+- 每日盈亏图
+- 每日盈亏分布图
+
+```
+    def show_chart(self, df: DataFrame = None):
+        """"""
+        if not df:
+            df = self.daily_df
+        
+        if df is None:
+            return
+
+        plt.figure(figsize=(10, 16))
+
+        balance_plot = plt.subplot(4, 1, 1)
+        balance_plot.set_title("Balance")
+        df["balance"].plot(legend=True)
+
+        drawdown_plot = plt.subplot(4, 1, 2)
+        drawdown_plot.set_title("Drawdown")
+        drawdown_plot.fill_between(range(len(df)), df["drawdown"].values)
+
+        pnl_plot = plt.subplot(4, 1, 3)
+        pnl_plot.set_title("Daily Pnl")
+        df["net_pnl"].plot(kind="bar", legend=False, grid=False, xticks=[])
+
+        distribution_plot = plt.subplot(4, 1, 4)
+        distribution_plot.set_title("Daily Pnl Distribution")
+        df["net_pnl"].hist(bins=50)
+
+        plt.show()
+```
+
+&nbsp;
+
+### 4.7 回测引擎使用示例
+
+- 导入回测引擎和CTA策略
+- 设置回测相关参数，如：品种、K线周期、回测开始和结束日期、手续费、滑点、合约规模、起始资金
+- 载入策略和数据到引擎中，运行回测。
+- 计算基于逐日统计盈利情况，计算统计指标，统计指标绘图。


+```
+from vnpy.app.cta_strategy.backtesting import BacktestingEngine
+from vnpy.app.cta_strategy.strategies.boll_channel_strategy import (
+    BollChannelStrategy,
+)
+from datetime import datetime

-## 实盘运行
+engine = BacktestingEngine()
+engine.set_parameters(
+    vt_symbol="IF88.CFFEX",
+    interval="1m",
+    start=datetime(2018, 1, 1),
+    end=datetime(2019, 1, 1),
+    rate=3.0/10000,
+    slippage=0.2,
+    size=300,
+    pricetick=0.2,
+    capital=1_000_000,
+)
+
+engine.add_strategy(AtrRsiStrategy, {})
+engine.load_data()
+engine.run_backtesting()
+df = engine.calculate_result()
+engine.calculate_statistics()
+engine.show_chart()
+```
+
+&nbsp;
+
+## 5. 参数优化
+参数优化模块主要由3部分构成：
+
+### 5.1 参数设置
+
+- 设置参数优化区间：如boll_window设置起始值为18，终止值为24，步进为2，这样就得到了[18, 20, 22, 24] 这4个待优化的参数了。
+- 设置优化目标字段：如夏普比率、盈亏比、总收益率等。
+- 随机生成参数对组合：使用迭代工具产生参数对组合，然后把参数对组合打包到一个个字典组成的列表中
+
+```
+class OptimizationSetting:
+    """
+    Setting for runnning optimization.
+    """
+
+    def __init__(self):
+        """"""
+        self.params = {}
+        self.target_name = ""
+
+    def add_parameter(
+        self, name: str, start: float, end: float = None, step: float = None
+    ):
+        """"""
+        if not end and not step:
+            self.params[name] = [start]
+            return
+
+        if start >= end:
+            print("参数优化起始点必须小于终止点")
+            return
+
+        if step <= 0:
+            print("参数优化步进必须大于0")
+            return
+
+        value = start
+        value_list = []
+
+        while value <= end:
+            value_list.append(value)
+            value += step
+
+        self.params[name] = value_list
+
+    def set_target(self, target_name: str):
+        """"""
+        self.target_name = target_name
+
+    def generate_setting(self):
+        """"""
+        keys = self.params.keys()
+        values = self.params.values()
+        products = list(product(*values))
+
+        settings = []
+        for p in products:
+            setting = dict(zip(keys, p))
+            settings.append(setting)
+
+        return settings
+```
+
+&nbsp;
+
+### 5.2 参数对组合回测
+
+多进程优化时，每个进程都会运行optimize函数，输出参数对组合以及目标优化字段的结果。其步骤如下：
+- 调用回测引擎
+- 输入回测相关设置
+- 输入参数对组合到策略中
+- 运行回测
+- 返回回测结果，包括：参数对组合、目标优化字段数值、策略统计指标
+
+```
+def optimize(
+    target_name: str,
+    strategy_class: CtaTemplate,
+    setting: dict,
+    vt_symbol: str,
+    interval: Interval,
+    start: datetime,
+    rate: float,
+    slippage: float,
+    size: float,
+    pricetick: float,
+    capital: int,
+    end: datetime,
+    mode: BacktestingMode,
+):
+    """
+    Function for running in multiprocessing.pool
+    """
+    engine = BacktestingEngine()
+    engine.set_parameters(
+        vt_symbol=vt_symbol,
+        interval=interval,
+        start=start,
+        rate=rate,
+        slippage=slippage,
+        size=size,
+        pricetick=pricetick,
+        capital=capital,
+        end=end,
+        mode=mode
+    )
+
+    engine.add_strategy(strategy_class, setting)
+    engine.load_data()
+    engine.run_backtesting()
+    engine.calculate_result()
+    statistics = engine.calculate_statistics()
+
+    target_value = statistics[target_name]
+    return (str(setting), target_value, statistics)
+```
+
+&nbsp;
+
+### 5.3 多进程优化
+
+- 根据CPU的核数来创建进程：若CPU为4核，则创建4个进程
+- 在每个进程都调用apply_async( )的方法运行参数对组合回测，其回测结果添加到results中 （apply_async是异步非阻塞的，即不用等待当前进程执行完毕，随时根据系统调度来进行进程切换。）
+- pool.close()与pool.join()用于进程跑完任务后，去关闭进程。
+- 对results的内容通过目标优化字段标准进行排序，输出结果。
+
+```
+        pool = multiprocessing.Pool(multiprocessing.cpu_count())
+
+        results = []
+        for setting in settings:
+            result = (pool.apply_async(optimize, (
+                target_name,
+                self.strategy_class,
+                setting,
+                self.vt_symbol,
+                self.interval,
+                self.start,
+                self.rate,
+                self.slippage,
+                self.size,
+                self.pricetick,
+                self.capital,
+                self.end,
+                self.mode
+            )))
+            results.append(result)
+
+        pool.close()
+        pool.join()
+
+        # Sort results and output
+        result_values = [result.get() for result in results]
+        result_values.sort(reverse=True, key=lambda result: result[1])
+
+        for value in result_values:
+            msg = f"参数：{value[0]}, 目标：{value[1]}"
+            self.output(msg)
+
+        return result_values
+```
+
+&nbsp;
+
+## 6. 实盘运行