2024年4月23日发(作者:尉迟晔)
大数据系列策略指数i300和i100发布及介绍
【根据网上资料整理】
【编制方案】
大数据系列指数编制方案 (2014年9月)
为反映大数据选股策略的市场表现,向市场提供更丰富的指数化投资标的,编制大数据
系列指数。大数据系列指数包括纯价格指数和全收益指数,纯价格指数通过深交所行情系统
发布实时行情数据,全收益指数通过巨潮指数网发布收盘行情数据。
一、指数代码与名称
指数代码:399415
指数简称:i100
指数中文名称:大数据100指数
指数英文名称:CNI BIG DATA 100 INDEX
指数代码:399416
指数简称:i300
指数中文名称:大数据300指数
指数英文名称:CNI BIG DATA 300 INDEX
二、基日与基点
大数据系列指数以2010年1月29日为基日,基日指数为1000。
三、选股原则
大数据系列指数样本股分别由在深圳证券交易所[微博]、上海证券交易所[微博]上
市的100只、300只A股组成,按照下列原则选取:
1. 入围标准
1
(1)非ST、*ST的A股;
(2)有一定上市交易日期,一般为一年。
2. 选样方法
对样本空间的股票,按照财务因子得分、市场驱动因子得分和大数据得分进行模型
优化,然后将计算的综合得分从高到低排序,选取排名在前100名的股票构成大数据100
指数初始样本股,选取排名在前300名的股票构成大数据300指数初始样本股。
在综合得分排名相似的情况下,综合考虑公司的行业代表性及所属行业的发展前
景、公司盈利记录等,优先选取指标优良的上市公司股票作为样本股。
单个股票的综合评分如下:
(1) 财务因子得分:计算最新市盈率PE、净资产收益率ROE、年度营业收入同
比增长率、年度净利润同比增长率,剔除PE、ROE排名靠后的股票、剔除营业收入同比增
长为负和年度净利润同比增长为负的股票;计算主营业收入和净利润同比和环比预测结果增
长相对上期该指标的幅度变化作为业绩加速得分;通过因子模型计算上述得分作为财务因子
总得分。
(2) 市场驱动因子得分:计算最近一个月股票换手率、波动率、价格变化率、
流动性因子,通过量化因子模型计算得分作为市场驱动因子的总得分。
(3) 新浪大数据得分:根据新浪财经频道下的股票页面访问热度计算单个股票
的热度得分、根据财经频道下的新闻报道正负面影响计算单个股票新闻报道得分、根据股票
在微博上的正负面文章影响计算单个股票微博得分,综合上述得分并根据历史回测优化结果
作为大数据得分。
四、指数计算方法
大数据系列指数平均分配样本股权重,采用派氏加权法,依据下列公式逐日连锁实
2
2024年4月23日发(作者:尉迟晔)
大数据系列策略指数i300和i100发布及介绍
【根据网上资料整理】
【编制方案】
大数据系列指数编制方案 (2014年9月)
为反映大数据选股策略的市场表现,向市场提供更丰富的指数化投资标的,编制大数据
系列指数。大数据系列指数包括纯价格指数和全收益指数,纯价格指数通过深交所行情系统
发布实时行情数据,全收益指数通过巨潮指数网发布收盘行情数据。
一、指数代码与名称
指数代码:399415
指数简称:i100
指数中文名称:大数据100指数
指数英文名称:CNI BIG DATA 100 INDEX
指数代码:399416
指数简称:i300
指数中文名称:大数据300指数
指数英文名称:CNI BIG DATA 300 INDEX
二、基日与基点
大数据系列指数以2010年1月29日为基日,基日指数为1000。
三、选股原则
大数据系列指数样本股分别由在深圳证券交易所[微博]、上海证券交易所[微博]上
市的100只、300只A股组成,按照下列原则选取:
1. 入围标准
1
(1)非ST、*ST的A股;
(2)有一定上市交易日期,一般为一年。
2. 选样方法
对样本空间的股票,按照财务因子得分、市场驱动因子得分和大数据得分进行模型
优化,然后将计算的综合得分从高到低排序,选取排名在前100名的股票构成大数据100
指数初始样本股,选取排名在前300名的股票构成大数据300指数初始样本股。
在综合得分排名相似的情况下,综合考虑公司的行业代表性及所属行业的发展前
景、公司盈利记录等,优先选取指标优良的上市公司股票作为样本股。
单个股票的综合评分如下:
(1) 财务因子得分:计算最新市盈率PE、净资产收益率ROE、年度营业收入同
比增长率、年度净利润同比增长率,剔除PE、ROE排名靠后的股票、剔除营业收入同比增
长为负和年度净利润同比增长为负的股票;计算主营业收入和净利润同比和环比预测结果增
长相对上期该指标的幅度变化作为业绩加速得分;通过因子模型计算上述得分作为财务因子
总得分。
(2) 市场驱动因子得分:计算最近一个月股票换手率、波动率、价格变化率、
流动性因子,通过量化因子模型计算得分作为市场驱动因子的总得分。
(3) 新浪大数据得分:根据新浪财经频道下的股票页面访问热度计算单个股票
的热度得分、根据财经频道下的新闻报道正负面影响计算单个股票新闻报道得分、根据股票
在微博上的正负面文章影响计算单个股票微博得分,综合上述得分并根据历史回测优化结果
作为大数据得分。
四、指数计算方法
大数据系列指数平均分配样本股权重,采用派氏加权法,依据下列公式逐日连锁实
2