加入
我们
投稿
反馈
评论 返回
顶部

内容字号: 默认 大号超大号

段落设置: 段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

怎样进行大数据的入门级学习?

2019-01-10 12:25 出处:未知 人气: 评论(

  入门大数据,要对大数据的概念、应用、前景、入门与进阶策略的相关信息有所掌握。

  大数据是海量数据的结合,和传统数据库中存储的数据以及相应的增删改查操作不同,大数据的特点就是数据量大,大到海量。我们现在使用的移动硬盘是TB级别,而大数据的数据量大到了PB(1024TB)。PB量级的数据用传统的数据库软件处理,几乎是不可能的,仅仅一个查询就要一上午,就算能够查询到那条数据可能“黄瓜菜都凉了”。所以:

  说到大数据,很容易联系到计算机科学,因为需要运算和存储;同时还能够联系到统计学与科学计算。与传统的抽样统计不同,大数据的样本容量可以涵盖全部统计对象,可以说大数据统计的结果信度和效度更强,而且统计量更加多元化,同时还可以对数据进行深度挖掘。

  所以入门大数据,自身需要具备一定的知识基础,比如C语言、R语言、Java语言、Python语言等,具备一定的计算机软硬件、互联网技术知识。C语言是所有编程语言的基础,用C去理解数据结构和算法是不错的途径;R语言是统计学相关专业必修的一门课程,它是开源的,而且可以运行于Windows,是统计分析、绘图的常用语言,有条件的同学建议去了解。

  大数据需要用到Hadoop集群,而Hadoop是开源的,是用Java语言的开发的,所以有扎实的Java语言基础是学习大数据的前提;对于海量数据的数据挖掘,可能会涉及到神经网络、机器学习,所以要求有扎实的算法功底以及Python编程的功底。好,说了这么多,开始介绍大数据的知识体系框架:

  大数据也是存储与计算的模式,存储为HDFS分布式文件存储;MapReduce作为计算引擎;Hive作为数据仓库工具可以帮助开发者用SQL对MapReduce进行操控;HBase则是hadoop集群中用于存储数据的数据库。在大数据的基础上,运用人工智能技术便可以进行数据挖掘和深度分析,可见大数据与人工智能的关系越来越紧密,这也可以做为学习者未来的学习方向。总之,建立整体的技术体系对未来的职业发展也有积极影响。返回搜狐,查看更多

分享给小伙伴们:
本文标签:

更多文章

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。


Copyright © 2002-2011 DEDECMS. IT之家 版权所有 Power by DedeCms