信息化技术与基础设施

调查称多样性是大数据利用的主要障碍

日期:2014-07-16

|  来源:【字号:

  

  据一项有111位数据科学家参加的调查显示,数据科学家面临的最大挑战不是数据量,而是数据多样性,各种各样的数据可能使得数据科学家束手无策。调查称目前大家都把关注点集中在数据量上,而忽略了数据分析的真正挑战。只有解决了数据多样性的问题,才能充分发挥数据分析的巨大潜力。 

  参与调查的数据科学家中,有71%的人认为大数据使得数据分析更加困难,最主要的因素就是数据多样性。48%的参与者使用过Hadoop及其处理引擎Spark。其中76%的人认为用Hadoop编程的速度太慢、需要太多精力或存在其他局限。36%的参与者表示需要花费太多的时间才能从数据集中获得见解,这些数据集因过于庞大而无法用分析软件进行处理。 

  来源:datanami网站 

  如需了解详细内容,请联系:xxhkb@cashq.ac.cn 

附件: