3)样本集为华兴源创,用到百度指数构建模型,AUC为0.74,未用到百度指数构建模型(其他入参变量与对照组1一致),AUC为0.73,说明百度指数对应预测有提升效果。(具体信息见下图)
根据上述案例,我们发现添加外部的非公开信息,确实能够提升股票预测能力。
对量化投资来讲,传统量化投资大部分的时间都浪费在了数据清洗和数据整理上,且对外获取的数据,由于不清楚数据来源,数据质量和数据安全存在重大隐患,量化策略可能因为数据质量(数据更新不及时,数据获取方式非法)而带来反向影响(触犯个人隐私、由于数据缺失造成量化策略不稳健)。
利用安全多方计算的方式,量化公司就可以使用外部数据源直接进行联邦学习,数据方会根据量化投资者需求,前期进行数据的加工和处理,对于量化公司来说,一是可以有效减少数据清洗和整理时间,二是直接对接数据源,确保了数据安全和数据质量,三是可以确保业务合规,保证量化模型效果稳定,四是可以通过外部数据,构建非公开数据相关的量化策略和指标,获取更多的超额收益。
展望
本文只是大数据量化建模的初探,隐私计算技术能够提供给量化交易更为广泛、有效的基础资源、技术支持,有机会促进大数据技术基础下量化交易策略的快速发展。本篇文章仅仅是通过非公开信息,利用安全多方计算技术对量化研究工作进行的初步探究,探究方法还比较粗糙,后期作者将基于安全多方计算对量化交易进行更加深入的探究和分析,希望感兴趣的朋友们持续关注后续相关系列文章。