北向资金能否预示股市涨跌?
沪深港通已经开通多年,市场一度把北向资金称为聪明钱,用来预示股市的涨跌。那么时至今日,北向资金是否仍然是一个有效的指标?
1. 获取北向资金数据
首先从tushare获取北向资金的数据。
import tushare as ts pro = ts.pro_api('your token')
严格地验证指标的有效性一般要求跨越牛熊周期,随着A股波动性的加大,牛熊周期也越来越短。这里我们简单地取3年时间做个验证。
df=pro.moneyflow_hsgt(start_date=20190330, end_date=20220330) df
由于tushare的限制,一次只能取300条,所以我们还需要多取几次数据,并把它们合起来。
df1=pro.moneyflow_hsgt(start_date=20190330, end_date=20201216) df = df.append(df1) df1=pro.moneyflow_hsgt(start_date=20190330, end_date=20190905) df = df.append(df1) df
2. 获取大盘指数
我们可以去tushare获取指数信息。
indexes = pro.index_basic() len(indexes), ','.join(indexes['name'].to_list())
可以看到,tushare至少提供了8000种指数供选择。
其中如上证指数、深证成指、沪深300、创业板指、上证50、中证500、中小板指、上证180、深证100等都是比较常用的大盘指数。
先找出这些指数的代码。
index_names = ['上证指数','深证成指','沪深300','创业板指','上证50','中证500','中小板指','上证180','深证100'] indexes[indexes['name'].isin(index_names)][['name', 'ts_code']]
我们先来获取上证180的数据。
s180 = pro.index_daily(ts_code=indexes['ts_code'][19], start_date=20190330, end_date=20220330, fields='trade_date, close') s180
然后我们来结构性地获取大盘指数。
index_names = ['上证指数','深证成指','沪深300','创业板指','上证50','中证500','中小板指','上证180','深证100'] trade_cal = pro.trade_cal(start_date=20190330, end_date=20220330, is_open=1) index_data = trade_cal[['cal_date']] index_data.columns = ['trade_date'] for name in index_names: index_new = pro.index_daily(ts_code=list(indexes[indexes['name']==name]['ts_code'])[0], start_date=20190330, end_date=20220330, fields='trade_date, close') index_new.columns = ['trade_date', name] index_data = pd.merge(index_data, index_new, on='trade_date') index_data
3. 探索性分析
将北向资金与大盘指数通过日期关联起来。
data = pd.merge(df[['trade_date', 'north_money']], index_data, on='trade_date', how='right') data
注意,这里的how要设置为right,大盘指数用的是上市日历,而北向资金存在数据缺失。
通过正面代码可以看到哪些日期的数据存在缺失。
data[data['north_money'].isna()]
简单地用pandas的默认方法做个插值。
data.interpolate(inplace=True)
可以看到,原来存在缺失的第13行已经完成了线性插值。
将大盘指数表示成收益率维度,并且放弃第一行。
data_return = data.copy() data_return[data.columns[2:]] = data_return[data.columns[2:]]/data_return[data.columns[2:]].shift(1)-1 data_return.drop(0, axis=0, inplace=True) data_return
计算北向资金与大盘指数的相关系统。
data_return.corr()
可以看到,从近三年来看,北向资金与各大盘指数的相关性已经非常弱,绝对值已经都在0.1以下。
我们的题目是北向资金能否预示股市涨跌,如果是日线级的预示,需要北向资金领先一天。
data_return = data.copy() data_return[data.columns[2:]] = data_return[data.columns[2:]]/data_return[data.columns[2:]].shift(1)-1 data_return['north_money'] = data_return['north_money'].shift(1) data_return.drop(0, axis=0, inplace=True) data_return
可以看到,相关性虽然有所提升,但仍然非常弱。
参考文献1的设定,我们也来尝试下120日滚动窗口。
data_return[data_return.columns[1:]].rolling(120).corr().tail(10)
可以看到,相关性仍然非常弱,且北向资金跟大部分指数都是负相关的。
事实上,无论是10日、20日、30日、60日,相关性也仍然非常弱。
可见,北向资金已经基本无法预示股市涨跌。当然,也许还有更好的特征提取方法,希望有机会看到。
参考文献:
https://mp.weixin.qq.com/s/Vb9Ecejdtvez_V9oCEK8Vw
https://blog.csdn.net/weixin_43887421/article/details/112508666
https://www.jb51.net/article/151590.htm
Python 金融专区
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。