捕鼠者说:大数据三步锁定老鼠仓

www.yingfu001.com 2014-03-04 06:11 赢富财经我要评论

  监管层与违法者斗智斗勇,“猫捉老鼠”在资本市场上不断上演。如今,监管层已能得心应手地将大数据监控系统运用于捕鼠——马乐案发便源于交易所的大数据监管。

  目前上交所和深交所各有一套证券交易监控系统,主要就是分析各种看似杂乱而无关的分散信息,利用各种算法将数据进行自动关联、聚类、分类和重排,寻找各种违规交易的蛛丝马迹。

  这些系统多年前就已经在运转,有接近交易所人士对中国基金报记者称,其实过去交易所也曾通过这些技术手段找出过不少老鼠仓,但因为金额很小或是账户亏损,而且当时“利用非公开信息交易罪”尚未纳入刑法,最后相关人士只受到内部处分,并未被公开。

  系统仍在不断升级更新,交易所间的信息互换将使这种挖掘更加深入和广泛,仍然潜伏在暗处的“老鼠”们,要小心点了,随着大数据分析效率越来越高,各种内幕交易或利益输送行为,将无所遁形。

  三步捕鼠

  和过去多例老鼠仓不同,将马乐捕入网中的,是一套自动运行的庞大的数据监控系统。

  公开资料显示,上交所和深交所各有一套证券交易监控系统,系统集成了交易、登记、结算数据和上市公司、证券公司等相关信息。上交所异动指标分为4大类72项,敏感信息分为3级,共11大类154项;深交所建立了9大报警指标体系,合计204个具体项目,其中包括典型内幕交易指标7个,市场操纵指标17个,价量异常指标15个。交易所针对老鼠仓等交易行为还建立了专项核查和定期报告制度。

  曾在交易所从事信息挖掘的研究人员李川(化名)称,“交易所有两套分析系统,分别针对网络上可以公开获得的信息和交易所内部各账户的交易信息,这些都属于大数据。”他介绍说,大数据捕鼠大致分三步:首先是通过对网络信息和交易数据的分析挖掘出可疑账户,其次通过分析交易IP、开户人身份、社会关系等进一步确认;最后进入调查阶段。

  在交易所博士后站点每年进驻的博士里,都会有两三个人专做与数据挖掘有关的工作。深交所总经理宋丽萍曾说,“原来就是通过交易数据来监控,现在文字的东西多了,信息多了,必须把它连在一起,这就需要文本挖掘的技术,构建市场监控综合数据模型。”

  吉贝克信息技术有限公司也参与了上交所战略咨询和挖掘分析工作,董事长刘世平对中国基金报记者说:“以前更多是对结构化数据进行分析,现在分析内容增加了非结构化数据,包括传真、照片、各种文字和文本等。”

  但交易数据仍是最扎实可信的证据,李川说,这是打击老鼠仓的关键,“比如说我发现两个交易账户,交易的品种、时间、频次、手法非常接近,而其中一个是基金账户,那另一个就很有可能是老鼠仓。”交易金额、开户时间、账户资金规模等都在监控范围内。

  此外,区分真假老鼠仓,需要看较长时段的交易数据,这可能长达3年。如果说在这期间,两个账户的交易时间、标的股票和操作手法都很接近,则基本可以确定两个账户间存在关联关系。监管层也会据此进一步稽查。

  试错过程

  马乐案令交易所数据监控系统为大众所关注,但事实上,这些系统多年前就已经在运转,只是近年来得到了不断升级更新。有接近交易所人士对记者称,其实过去交易所也曾通过这些技术手段找出过不少老鼠仓,但因为金额很小或是账户亏损,而且当时“利用非公开信息交易罪”尚未纳入刑法,最后相关人士只受到内部处分,并未被公开。

  对交易数据的挖掘已是一门成熟学科,在这方面,交易所能够做的甚至比美国监管机构还多,因为美国的证券交易所并不能完全掌握交易明细数据,而在中国是可以的。

  深沪证券交易所掌握信息之全和速度之快,也超出市场想象。据刘世平称,下午3点收市,4点钟,基金公司的数据就会传到证监会基金部。

  不过,交易所监控系统虽然可以监测到非常细微的可疑之处,但经系统初筛出的可疑账户数量很多,而且其中有一些是被“误伤”的,刘世平说,“错误率不低”。这一方面需要监管层进一步核查,另一方面,监控系统本身也需要不断升级来降低错误率。

  “其实主要就是调整时间窗,也就是说,到底监控多长时间窗内同进同出的账户,是一天内,还是一周内、两周内?时间设置太短,可能会漏掉真老鼠,时间设置太长,进入监控视野的账户又会太多。”刘世平说。

  在这个交易时间窗上,老鼠仓的操作手法是不一样的。比如,李旭利涉案账户中4700多万元工商银行股票是在基金买入之前约10分钟下单的,而马乐涉案账户的多只股票则比相关基金提前了1到5天。

  因此,设置时间窗的监控点,需要智慧和经验。用刘世平的话说,“这是个试错的过程,是个技巧活,没有标准。”

  此外,系统也不会真的监控所有账户,进入监控范围的账户可能是达到一定金额级别以上的,否则,小散户数万元的账户数量也太多。

  而沪深两个交易所之间的数据还不能实现共享,也在一定程度上削弱了数据捕鼠的杀伤力。“现在两个交易所彼此都不掌握对方的信息,如果我们有一个系统能囊括上交所、深交所和中金所的数据,那结果就更有说服力。”李川说。

  道高一尺

  老鼠仓在不断升级,捕鼠者也在不断进化。

  马乐案中,证监会于2013年4月11日启动对相关账户异常交易案的初查工作,2013年6月21日立案稽查,交由深圳证监局承办。仅仅两个多月就能锁定老鼠仓,可见大数据的威力。

  李川说:“老鼠仓避开大数据监察的可能性当然存在,就看这个人本身有多‘聪明’。”而要降低这种可能性,就要让信息进一步聚合,比如实现网络数据分析和交易信息分析的完全衔接,以及各个交易所之间的信息共享。

  上交所副总裁、首席技术官白硕在2010年曾表示,上交所和中金所已有能力实施联合监管,每一天,上交所和中金所都需要交换大量的数据,以便双方在必要时候可以实施联合监管,通过对比历史数据来挖掘异常交易。

  当然,如果银行对账单、公安部门的户籍数据等各种有用信息也能实现跨部门共享,老鼠仓就会更容易、更快被发现。

  此外,从理论上讲,大数据不但能自我学习,很快掌握新的破解方式,甚至还可以预测老鼠仓的发生。

  宋丽萍在去年两会期间曾对媒体表示,“资本市场任何交易行为,信息发布行为都会留痕。如有异常,我们设计的这个指标就会自动跳出来,就会自动报到证监会,证监会就要立案,关键是办案的程序我们希望能快一点,投资者能够得到补偿。”

    相关新闻
    • 征稿启事 | 合作伙伴 | 友情链接 | 联系我们 | 广告服务 | 关于我们 | 法律声明 | 网址导航 | 虞凌云
    • 赢富财经网:www.yingfu001.com 简易域名:简易域名 版权所有 翻版必究!Copyright©2008-2022 沪ICP备10023616号-1
    • 赢富财经网所载文章、数据仅供参考,使用前务请仔细阅读免责声明,风险自负。广告商的言论和行为与赢富财经网无关,投资有风险,选择需谨慎。
    • 特别提示:赢富财经网不作任何“加入会员、承诺收益、利润分成”以及其他非法操作方式进行非法的理财服务。
    • 您有任何建议或意见,欢迎随时与我们联系!联系我们
    • 上海网警网络110工商备案360安全检测