j代表供给、需求、库存和价差中的一个大类;Classj-期货涨停板规则
j代表供给、需求、库存和价差中的一个大类;Classj-期货涨停板规则铅宏观属性偏弱,苛重环绕基础面开展来往。正在消费规模聚合,铅基础面逻辑相对纯洁,适合实行基础面量化摸索。勾结铅基础面考虑履历,本文通过量化机谋,构修了四个大类因子,借助阈值开仓门径天生开仓信号,并最终以等权体例取得大类合成因子的开仓信号,正在测试集和锻练集上赢得了预期恶果。
需求因子:我邦85%的铅用于临蓐铅酸蓄电池,需求类因子苛重囊括铅锭及铅下逛产物出口、铅酸蓄企业开工、企业和经销商制品库存,汽车、通讯基站等终端品产量以及苛重电池型号价值。
需要因子:原/再生铅炼厂的原料、开工、产量都邑影响供应,于是供应因子苛重囊括铅精矿供应(产量+进口)、银价、银精矿进口、废电瓶价值、原/再生铅炼厂利润、原/再生铅炼厂开工等数据。
库存因子:库存是供需平均的最终出现,首要性不问可知。苛重体贴炼厂原料和制品库存,铅锭来往所和社会库存以及口岸库存。
价差因子:价差反应分歧限日、分歧种类之间的供求不同,苛重囊括限日价差、现货升贴水、精废价差。铅和其他有色种类相干度低,跨种类价差可纰漏。
基础面因子的预经管和大类因子的搭修本文先构修基础面因子,再通过肯定体例加权乞降,酿成四个大类因子的期间序列,然后遵循这四个大类因子期间序列酿成结果的来往政策。原始基础面因子80个,数据从2012年岁首先河,不断截至目前,频率为日度、周度和月度。个别数据早期尚未先河征采,各因子除频率分歧外,时序长度也有不同。日度数据当日收盘后可得,连贯性强;周度数据周五收盘后可得,个中SMM铅锭社库每周一、周五更新;月度数据如产量、产制品库存、进出口公布滞后,所含讯息量较少,遇节假日或者会略有调剂。
原始因子序列期间戳都是日度的,周度和月度数据有多量空值,团结用前值补全,取得一共因子的日度序列。
数据中的极值往往会影响正在线性模子假设下的拟合,同时对待照射相干也存正在缺点揣度的或者,因而咱们将高于时序数据3倍程序差的数值调剂为均匀值±3倍程序差。
铅价从2020年往后的变动幅度清楚缩窄,颠簸改动频率亲热周度。从信号天生和调仓频率角度开赴,团结取因子每周的均值行动该周周五的值,结果只保存周五的这个值,从而完成了统统因子统历来周度转换,再将周度数据合成周度的大类因子序列。
对待来往标的,取沪铅主力合约每周五的收盘价,同样调剂为周度。这也意味着基础面政策将以周度为单元实行。
基础面因子和沪铅价值一共更动成周度数据今后,斟酌分歧因子的量级和量纲不同较大,量级较大的目标或者导致量级较小的目标被纰漏,当量级差异很大时,歼灭量纲影响也有须要。用因子确当期值减去肯定窗口期的均值来低浸因子量级的影响,同时通过计较因子窗口期内环比变动抹除量纲影响,从而完成了基础面因子的程序化。
完全构制体例如下:单个基础面因子i的构制为 ,沪铅周度收益率序列的构制为 。个中fi,t外现基础面因子i正在t期的原始值;windows外现窗口期,因为前期仍然将频率转为周度,windows=3则代外窗口期为3周;Mean外现过去窗口期内因子值的均匀数;Fi,t外现某因子的t期的原始值减去窗口期均值;Factori,t外现基础面因子i经历程序化今后t期的值;Ppb,t外现沪铅正在t期的收盘价;Ppb,t外现沪铅的周度收益率。云云就取得了分歧基础面因子、沪铅收益率的期间序列。沪铅收益率便是需求预测的量,数学上也称被诠释变量;构制的基础面因子能够理会成基础面上的已知讯息,属于诠释变量。
对统统因子团结实行延后一阶经管,即用t-1期的基础面因子来预测t期的沪铅收益率,以避免利用异日数据。
每个因子的期间序列先河期间不所有肖似,为了保障锻练集宽度足以笼罩窗口期,固定住锻练集的闭幕期间为2020年12月25日,测试集则利用2021—2023年的数据。
遍历1—52周的窗口期,构制该因子对应的分歧期间序列,然后正在锻练集上计较该因子对应讯息系数IC、胜率、盈亏比,以此行动筛选程序,抉择最优窗口期,并最终确定对应的因子序列。个中讯息系数IC为基础面因子和沪铅收益率的pearson闭连系数。即使IC0,意味着因子和沪铅收益率正闭连,因子值越大,对应下一期沪铅收益率或者越高;而因子值越小,对应下一期的沪铅收益率或者越低,以至收益为负。反之亦然。
为了省略开仓次数,采用阈值开仓法,只要价值冲破阈值上沿或者下沿才会浮现开仓信号;因子未冲破阈值的景况下,对应平仓或不开仓。
个中1是买入信号,-1是卖出信号,0是平仓或不开仓信号;upper和lower是阈值的上沿和下沿。
上、下阈值的抉择是通过计较机遍历分歧的上、下分位数,采纳预测胜率最高的阈值行动该因子最优阈值,并记实对应的胜率和盈亏比。
统一个因子,分歧的窗口期构修出来的期间序列分歧,正在锻练集上的IC、胜率、盈亏比也分歧。团结遵循如下标切确定最优窗口期:当IC值变大、胜率变高时,遵循胜率最高确定最优窗口期;当IC值变大,胜率变小时,盈亏比作辅助剖断程序,或者还会勾结肯定的基础面履历,来确定最优窗口期。
最优窗口期确定后,基础面因子最终期间序列就确定下来,接下来先容怎样构修需求、库存、需要、价差这4个大类因子。
勾结因子正在锻练集上的IC、胜率、盈亏比,以及基础面逻辑,咱们挑选出了41个首要的基础面因子,用来构制最终的大类因子。下面临个中少少因子从基础面的角度实行探析。
需要类因子中,大个别单因子IC为正,意味着供应变动和标的价值的变动正闭连,苛重外现正在月度供应数据和邦产铅精矿价值上,违背常识。从基础面角度开赴来看,因月度供应数据发布往往滞后10—20天,正在数据发布之前,商场会遵循冶炼厂检修动态预判供应边际变动,而滞后的产量数据彰着无法反应商场预判行径。铅精矿虽属供应端,但订价是期货价值减TC,铅精矿TC往往永久安定,铅精矿的价值自然就和期货价值同向改动。窗口期方面,不含税再生铅利润和进口铅精矿价值的最优窗口期为12周,往往接续面对蚀本才会加快炼厂减产落地。铅精矿加工费的最优窗口期为51周,且IC值为负,铅精矿供应苛重受时节性影响,TC是矿山和冶炼厂博弈的结果,原生铅炼厂开工往往较稳固,TC也往往永久褂讪,往往TC浮现异常出现时影响才更清楚。
需求类因子中,月度数据占比最高,数据变动迂缓,窗口期正在40周左近,往往和铅价同向运动。周度数据为铅酸蓄电池价值,电池价值的上下反应终端消费的强弱,窗口期为10周时,IC为负值。终端消费较差,经销商抑价促销,会导致铅价的同步走低,而铅价走低之后,冶炼厂惜售心绪抬升,减产预期走强,反而或者刺激下一期的铅价走强。
库存类因子中,数据频率分散较平均,最优窗口期众正在30—40周,社会库存数据对异日行情的剖断有肯定的指引性,往往库存越高意味着商场供大于求的形状更苛苛,铅下行压力越大,该类因子IC为负,合适基础面逻辑。
价差类因子都是日度数据,蕴涵现货价、近远月价差和现货升贴水、精废价差等,铅价的振幅不足其他金属,价差数据往往较小,程序化经管今后,固然抵消了个别量纲和量级的变动,也抹除了个别特有的因子讯息。跨期价差的IC值较为担心定,跟着窗口期的改动正负切换较为经常。而精废价差正在分歧学口期的IC值均为负,这也合适基础面逻辑,当铅价走低,再生铅利润被压缩,惜售心绪抬升,对原生铅贴水收窄,以至浮现精废价值倒挂,下逛偏向采购原生铅,铅可交割品牌库存省略,带头下一期铅价低位反弹。窗口期方面,除LME3-15升贴水的窗口期低于10周以外,其余窗口期基础正在40—50周。
筛选出首要的基础面因子后,下面通过因子正在锻练集上的胜率加权取得四个大类的因子:
个中,j代外需要、需求、库存和价差中的一个大类;Classj,t代外构制的最终大类因子正在t期的值,由该大类中统统基础面因子的t期值通过胜率加权乞降取得;Fatorj,i,t是大类中的因子i正在t期的因子值;win_ratioi代外因子正在锻练集上的胜率,由此取得四个大类因子的期间序列。正在锻练集上,通过迭代,阔别找到四个大类因子对应的最优开仓阈值,酿成来往信号。统计浮现,需要、需求、库存以及价差大类单因子的胜率阔别为0.68、0.71、0.68以及0.73。
剖释单个基础面因子对其所正在大类因子的孝敬,能够浮现,对需要大类因子而言,最优阈值往往切近史乘序列的最大、最小值,这意味着因子值浮现异常变动时开仓的胜率会有擢升。需要大类中每个单因子的胜率基础坚持正在0.61左近,而废电瓶价值占再生精铅价值比这个基础面因子的胜率最高为0.65,因为再生铅产能过剩,废电瓶接续求过于供,废电瓶往往比铅更扛跌。行动再生铅的临蓐原料,废电瓶价值占再生精铅价值的比越高,再生铅利润越薄,炼厂挺价志愿越强。SMM再生铅月度产量的盈亏比最高为5.66,正在类似胜率下,该因子的收益更好。再生铅占比仍然高出了53%,再生企业利润薄,检修本钱低,能够活跃打算检修;而原生铅检修本钱高,开工合座稳固,商场往往愈加体贴再生铅炼厂临蓐动态,来调剂对异日供应边际变动的预期。
需求大类因子的阈值以及胜率景况均和需要大类因子类似,胜率最高的是SMM铅蓄电池企业月度制品库存天数,约为0.67,基础面上看,铅蓄电池企业月度制品库存天数越高,注脚电池贩卖越差,需求越弱,对铅价的影响斗劲直观。而中邦起动型铅蓄电池月度出口量这个基础面因子的盈亏比最高,为6.16,片刻无法从基础面逻辑中给出更众合理会释。
价差大类的基础面因子胜率均值是0.59, 0-2价差和C01(即次月合约收盘价)胜率最高,同时C01的盈亏比相对亮眼为4.01。次月合约和主力合约收盘价正在比来的两次换月中央是重合的,因为对因子做了滞后一周经管, C01因子的胜率和盈亏比高,某种水准也外现了沪铅价值的动量效应。
库存大类中的基础面因子胜率合座略高于其他大类中的因子,大都位于0.62左近,个中胜率最高的是LME铅刊出仓单,而LME铅注册仓单的盈亏比最优。库存是供求平均的最终外现,注册、刊出仓单是供需动态调剂的结果,于是预测胜率较好也合理。
每周五,阔别斗劲四个大类因子的最新值和其对应的最优阈值,天生四个大类因子的开仓信号。
为了省略开仓次数,通过计较机正在锻练集上迭代出最优阈值,只要当因子值高出肯定阈值,才会浮现开仓信号;因子未冲破阈值的景况下,对应平仓或不开仓。
然后将四个大类的开仓信号等权相加酿成最终的大类合成信号。完全示希图睹下外。
下图涌现了2023年1—3月这三个月的期间内,通过以上来往政策,阔别取得的需要、需求、库存、价差大类因子供应的开仓信号。并由四个大类因子的开仓信号等权相加取得的大类合成因子的开仓信号。
遵循咱们构修的大类因子和大类合成因子,运用阈值开仓法正在锻练集和测试集实行实证磨练。正在2021年今后的锻练集上,价差因子、库存因子出现出了斗劲好的剩余性,需要大类因子出现平淡,而需求大类因子正在锻练集上出现欠好。
从基础面上理会,价差和库存因子频率较高,讯息保存较扫数,能更好左右周度的颠簸和趋向,于是出现较好。遵循铅基础面考虑履历,商场正在来往实际和预期之间经常切换,再生炼厂通度日跃安排检修谋略来变化商场对异日供应的预期,纯净遵循需要端的数据行动开仓根据,缺乏预期指引,需要大类因子正在测试集上很难延续锻练聚合的出现。需求端大类因子中,月度数据占比卓殊高,数据公布滞后,讯息含量亏空,很难捕获沪铅正在周度下的商场反应。
合成大类因子信号由四个大类因子信号等权乞降得来,因参与了需求因子,政策累计收益低落,不外得益于归纳了基础面的每个大类因子,收入颠簸低浸,夏普比降低。总体而言,合成大类因子正在测试集上照旧赢得了年化收益6%、回撤2%、夏普比3%的不错恶果。
加入新手交流群:
添加助理微信,一对一专业指导:/
相关推荐: