扬子晚报广告部   扬子晚报广告部  
您当前的位置:传媒广告网时事聚焦 → 文章内容 → 互联网海量数据蕴藏“金矿” “造假 门”频现

互联网海量数据蕴藏“金矿” “造假 门”频现

作者:佚名  来源:新华网传媒频道  发布时间:2011/6/2 16:18:25
扬子晚报在线支付

扭曲的数据

    《网络传播》杂志供稿 文|郭晶 闫芳

    如同电视领域的收视率调查一般,网络流量统计而今日益演变为衡量网站媒体价值与广告投放的标杆。因此,在不断升温的互联网“眼球经济”之下,第三方数据统计公司近年来已备受业界关注,不仅仅因为其在很大程度上决定了网站运营的实际效果,更在于大量公诸于众的数据调查报告在深刻地影响和变革着互联网上下游的产业发展。

    科学、公正、透明、诚信,这本是作为第三方监测机构理应恪守的商业信誉和企业理念。然而,现实情况并非如此,在数据统计分析领域出于种种原因的造假事件频现,已成为行业通病和发展桎梏。如何积极良性地挖掘中国互联网数据背后的“金矿”,如何由粗放的宏观统计向微观数据分析转变,如何逐步建立统一有序的评价标准和体系,这些都将是中国互联网的第三只眼(即数据统计)在未来亟待改进之处。

    互联网海量数据蕴藏“金矿”

    在我国,有着十几年发展历程的互联网仍然是新兴产业,而与之相随的数据统计更可谓是新产业中的新行业。第三方数据统计目前还处于不成熟期,同时也潜藏着巨大的能量,在海量数据的背后蕴含着无限的商机,只是暂时未能被充分挖掘与开发。对网站而言,网络数据一方面可体现自身媒体价值和吸引广告客户,另一方面也是预测和制定相关发展规划的可靠依据和参考。这些是由互联网特性所决定的,也是其可跟踪、可计量监测的优势所在。

    国内第三方数据统计分析服务提供商——CNZZ执行总裁张志强曾说过,数据流量统计从互联网诞生的第一天开始就已经有了,而且它是一个与互联网相伴相生,永远都没有办法消除的存在,只是以前它仅仅被人们理解成一个纯技术工具,而它真正的作用和商业价值却没有被深刻挖掘出来,至于对互联网产业生产力的促进作用就更无从谈起。

    数据统计伴随着互联网的发展应运而生,它与网络广告、网络营销有着千丝万缕的联系,是网站对外宣传推广的有力工具。因此,在网络广告进入快速发展期的同时,网络营销服务作为新兴行业逐步壮大。在互联网企业和消费者之间,网络营销通过数据统计分析所产生的商业价值获得生存空间。有别于传统媒体的数据统计,互联网作为媒介具有着交互性和可计量性的特点,因此网民在网上的每一步访问都可被记录,从而有利于数据监测方充分挖掘到有效信息。

    关于网络营销价值的作用,缔元信网络数据CEO秦雯认为是优化传播价值与提升消费价值。诚然,网络营销不仅仅是指网络广告,更重要的是通过种种方法和手段为营销而搭建的平台,以及最终实现对网站的用户管理等产生的积极引导。互联网上每天都有大量的数据信息产生,对于互联网企业来说,掌握的数据信息越多,可供加工、分析的方向也越多,潜在的商业价值也越高。

    以腾讯为例,经过多年的努力,腾讯的每一种应用都已经积累了一个庞大的用户数据库,这个数据库具有十分巨大的互联网营销价值。随着互联网上各种应用的丰富,电脑已经取代电视、报纸成为最有效的用户界面(用户获取产品、服务、资讯的界面),也是实现有效的网络营销的基础。马化腾曾说,腾讯很早就在深圳成立了研究院,专门进行互联网基础研究,其中包括数据的挖掘与分析,也包括各个数据库的实时互联。 

  数据“造假 门”频现,已成行业通病

    作为第三方监测公司,数据统计服务商本应独立于企业之外,应该科学、公正、透明地监测互联网企业发展过程中的一些真实有效的数据。然而现实情况却是,目前行业发展中显现了许多不成熟与无序的竞争状态。业内人士认为,国内互联网数据服务的第三方市场仍处于非常初级的阶段,行业参与者的水平高低不齐、良莠混杂。

    迄今为止,国内已有多家独立的第三方研究机构和数据监测公司,这些机构所提供的服务在中国互联网产业发展中起到了应有的作用,但也必须看到由于受到互联网应用的复杂性、海量数据处理技术的高技术门槛和基于庞大的互联网用户群建立数据采集样本的难度等客观因素限制,给数据的真实可靠带来极大的挑战。目前,某些第三方数据机构和互联网公司为短期利益丧失应有的公正性和客观性,从而导致整个互联网数据服务市场总体上还处于一种低信用状态。主要表现在以下两方面:一、数据服务机构或用行业排名要挟网站进行获利,或无原则地为客户编制假数据;二、一些网站靠流量作弊提高公开排名来忽悠投资人,用虚假流量欺骗广告主,作为非正当竞争的手段。

    近年来,数据造假事件频繁出现,第三方公司针对同一对象做出不同的数据统计结果,事后让公众无从辨别,进而产生了对于第三方监测公司的信任危机。例如,2008年奥运会后,四大门户网站均表示自己在奥运会新闻报道方面流量取得“第一”的好成绩,每家网站都以“第一”自称,但是 “四个”非并列的“第一”却把公众搞得不知所云。新浪称数据来自ChinaRank、艾瑞咨询、缔元信数据、PiperJaffray等机构,搜狐称数据来自CTR、艾瑞咨询、缔元信等调查机构,腾讯则表明数据来自Alexa、清华大学媒介调查实验室、艾瑞咨询、赛迪顾问,网易随后也亮出ChinaRank、万瑞数据的调查报告。在这一组组数据公司的排列中,究竟谁家的“第一”才是货真价实恐怕已无人能辨。

    但不难发现,四大门户网站均引用了多家市场调研公司的数据,而同一家数据公司的数据居然自相矛盾地在证明着多个“第一”。有调研机构的分析师事后表示,其实这几个版本的数据都是真实的,只不过每个版本形成的调查方式和采样方法不一样。第三方公司的数据研究都是基于客户需要的,数据最终的所有权是客户所有,所以数据公司根本无法限制客户从哪个角度来呈现数据结果。对此,业内人士表示,行业内统计方法无法统一是造成数据乱象的主要原因之一。有些第三方数据企业,通过粗放的调查得出数据,比如抽样或是填调查问卷的形式,虽然不能达到企业对精确性的要求,却也具有一定的代表性。然后经过研究发掘,寻找新的标准或是利用各种方式使企业在同行业中脱颖而出。

    数据造假的频繁出现,无疑是对整个第三方数据行业公信力的重创。对此,一位第三方数据公司的高层也曾表示,数据造假已经成为一种行业通病,“在市场发展过程中,企业和第三方形成了一种微妙的关系,企业在宣传和招商引资过程中需要一些数据或排名来证明自己的发展态势,这就有了需求。在利益面前,就会有企业为这种需求提供服务。久而久之,第三方企业很有可能沦为企业的宣传工具,为了用户的需求去定制自己的理论和观点。”

    早前,Alexa造假、赛迪顾问上市公司造假,视频网站为了争夺“世界杯”第一发生口水大战,这些案例一次次将第三方数据公司的公信力推向舆论的风口浪尖,也逐步将行业内的潜规则呈现在公众的视线之中。当越来越多的第三方数据无法服众时,这个还处于初级阶段的新兴行业将不可避免地陷入一场信任危机中。

  数据分析,从宏观统计走向微观挖掘

    人们习惯把互联网称之为“眼球经济”,从中不难看出流量对于网站生存与发展的意义,因为流量聚合成的网络广告是其主要收入,广告商以巨大流量为参考依据选择投放与否。网站流量的考量来源于第三方数据统计,因为独立于企业之外的身份使其拥有了自身的市场价值和地位。

    如果说网络流量的高低决定了网站的当前价值,那么网络流量统计分析的精准度则可能决定网站的未来潜力。因为通过微观深入的统计和分析所得出的调研报告是极具参考价值的,这些对于一个网站的设计和优化都非常重要。当然,其前提是统计和分析是准确和科学的。目前国内第三方数据统计服务公司众多,优质的统计分析服务不但可以提供网站流量的数据展示,而且可以清晰地统计出网民的访问行为以及兴趣点,为企业今后升级网站提供可靠的参考依据。同时,通过对微观数据统计的分析挖掘,也能够更好的指引网络媒体和网络广告投放市场进入良性发展,甚至让整个互联网产业链的上下游形成互动与衔接。

    反观数据造假现象的不断发生,其实可以窥探出行业内浮躁和短视心理的存在。从长远发展来看,数据统计分析完全可以由目前的粗放宏观型转向微观深入挖掘,不再是为了数据而数据,不必沉浸于各类的排行之中,而是要用深入扎实的微观数据分析来指引网站的经营管理行为。

    在第三方数据领域,沿用传统互联网采样调查的模式,或将面临越来越多且层出不穷的互联网新形式的严峻挑战。近日,艾瑞咨询总裁杨伟庆公开承认,由于受到技术手段的限制,艾瑞在统计微博的活跃用户数和浏览时长时,只能抽样统计到基于网页页面的数据,但是对于大量从即时聊天工具(比如 QQ)和手机软件等客户端过来的数据,艾瑞的检测却没有将之统计在列。对此,有业内专家认为,基于传统PC网页的数据采集和挖掘工作,在目前移动终端大行其道的今天已经有些吃力,尤其是 3G网络使用和智能手机不断兴起,来自手机端的访问已经逐渐成为主流,这种移动应用的趋势将逐渐替代传统PC浏览,而数据统计技术也将结合更多的手机终端软件来实现。

    因此,寻找差异化的手段和掌握更为先进的技术占领崭新的市场,这或许是第三方数据服务未来亟需开拓的领域。如同互联网事业需要源源不断注入创新力量一样,数据统计也要提高创新能力,从而获得更快的增长和挖掘更大的商业价值。目前的网络流量数据统计工具还未曾深入探究产业的良性发展模式,产品技术和模式创新也有待进一步开发。面对数据市场的蓝海,借助互联网高速发展的产业环境,第三方数据服务理应抓住“眼球经济”这一核心竞争力不断挖掘价值。

 
 
 

    数据统计标准与评价体系 亟待统一与监督

    众所周知,传统媒体中电视收视率的调查统计经过多年的积累已有清晰的行业标准,而互联网数据统计在这方面却始终良莠不齐。行业缺乏科学统一的行业标准和评价体系,而实践中机械地将电视收视率评价体系平移到互联网上更不可取,这必然会对网络营销产生诸多不利之处,也对产业上下游的良性发展有负面影响。

    数据服务作为第三方企业,初衷是为了规范市场秩序,而现在行业自身乱象丛生,潜规则肆意成风,这不得不将人们的视线拉回到行业基础的统计标准和评价体系,内因是找到问题的根本所在。有业内人士称,数据统计行业目前处于一种标准比较混乱,甚至总体来说缺乏行业标准的状况,尽管近年来有些数据服务公司开始有所调整和改进,但实际上离行业的需求还是有很大的差距。与此同时,行业标准之上的应用层评价体系也是欠缺之处。

    3月25日,北京网络新闻信息评议会召开,评议会围绕第三方数据服务的话题展开探讨,对于企业自律和行业标准的制定达成共识。其中强调,第三方数据公司除加强自律,不断提升自身的公信力外,还应不断提升自身的专业素质,即做到方法科学、数据准确、分析客观。同时,要逐步建立起行业标准,使数据服务有一个共同的良好环境。

    评议会指出,从上世纪90年代中期开始,伴随互联网行业大规模的商业化进程,专门从事行业宏观或微观数据的搜集、统计、分析的公司也得到长足发展。这些数据,既是互联网行业发展的见证,也被广泛地应用于项目投资决策、网站运营分析与价值评测、竞争态势比较、市场走势和行业发展评估,更广泛地服务于产业链上下游的商业活动。互联网行业发展的历史表明,随着行业规模迅速扩大、产业结构不断丰富、商业模式渐臻成熟,市场竞争日趋激烈,产业上下游各个环节将越来越依赖于多层次、全方位的数据作为企业经营、市场和产业发展研究甚至行业管理的决策依据。因此,一个科学、公正、透明的行业数据生态环境是促进互联网行业健康发展的必要条件。

    据了解,目前数据造假的情况时有发生。在市场竞争环境中,企业轻视数据分析在业务决策过程中的作用,过分重视用于市场公关的数据,且只愿花钱购买对自己有利的数据,无疑助长了某些第三方数据机构的造假之风。而这一点,与国内互联网整体环境和更大范围的社会诚信环境密切相关。因此,建立公正透明的第三方数据服务环境,不仅仅是对第三方数据公司的自律要求,也是全行业应该重视并解决的问题。必须认识到,互联网的各项服务只有建立在诚信的基础上,才能得到长久发展并取得佳绩。

   北京网络媒体协会有关负责人强调,第三方数据公司除加强自律,不断提升自身的公信力外,还应不断提升自身的专业素质,即做到方法科学、数据准确、分析客观。同时,要逐步建立起行业标准,使数据服务有一个共同的良好环境。业界各方应本着积极参与、不断完善、相互支持、共同分享的基本原则,推动中国互联网数据标准与数据体系的建立与健康发展。互联网企业应在业务发展过程中,积极采用相对统一的第三方数据标准和数据服务,向上下游企业以及其他相关各方提供真实、可靠和准确的数据,共同维护中国互联网行业发展的良好氛围和信用环境。

    同时,据中国互联网协会李增海介绍,工信部已经在2010年底发布了我国第一个互联网服务统计标准的基本指标,包括五个基本指标。相信这些倡议和已经公布的统计标准会对今后的践行大有裨益,是为第三方数据服务营造良好市场环境投石问路。

    诚信助推行业良性发展

    回首上世纪末,我国的互联网事业快速发展,商业化进程不断加剧,由此衍生了专门从事行业数据统计分析的第三方服务。伴随着互联网产业的大踏步前行,数据服务既是互联网行业发展的见证,也被广泛地应用于项目投资决策、网站运营分析与价值评测、竞争态势比较、市场走势和行业发展评估,更广泛地服务于产业链上下游的商业活动。

    因此,建立科学、公正、透明的第三方数据服务市场环境刻不容缓,对第三方数据公司来说,不仅仅是要提高自律要求,同时也要创新机制和技术研发,挖掘行业更多潜在价值以利长期发展。整个互联网行业也应该加大力度重视并解决此问题,毕竟,互联网产业只有建立在诚信的基础上,才能得到长久发展并取得佳绩。对此,北京网络媒体协会会长闵大洪曾这样评价,“互联网的前途在于诚信,互联网的发展依赖于诚信,互联网各种有效应用的基础都在诚信。”

    数据统计与互联网相伴相生,在创新与诚信的共同前提下,一个科学、公正、透明的行业数据生态环境是促进互联网行业健康发展的必要条件。第三方数据服务的未来,应从纯粹的技术驱动和工具理性转向以诚信为依托的产业化方向发展。在不远的未来,数据统计在互联网领域将扮演着多层次、全方位的专家角色,将为企业经营与管理提供智力支持,是真正的中国互联网发展的第三只眼。

扬子晚报在线支付

<互联网海量数据蕴藏“金矿” “造假 门”频现>-:百度搜索 gooolge搜索 雅虎搜索 QQ搜索 狗狗搜索 有道搜索
文章评论 (评论内容只代表网友观点,与本站立场无关!)

用户名: 查看更多评论

分 值:100分 85分 70分 55分 40分 25分 10分 0分

内 容:

         (注“”为必填内容。) 验证码: 验证码,看不清楚?请点击刷新验证码