大数据基础问答

什么是大数据?
用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。

创新互联于2013年成立,先为洪江等服务建站,洪江等地企业,进行企业商务咨询服务。为洪江企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

学习大数据需要什么基础呢?
Java基础(Javase):类、类、继承、I/O、反射、泛型等;
Linux基础(Linux的操作):创建文件、目录、vi编辑器的使用;

Java和大数据都有哪些关系呢?
基于Java语言开发→→→ Hadoop体系结构、原理、编程
第一阶段:HDFS、MapReduce、HBase(NoSql数据库)
第二阶段:数据分析引擎 ---> Hive、Pig
数据采集引擎 ---> Sqoop、Flume
第三阶段:HUE:Web管理工具
ZooKeeper:实现Hadoop的HA
Oozie: 工作流引擎*
基于Java语言开发→→→Scala语言→→→Spark
Spark的学习
第一个阶段:Scala编程语言
第二个阶段:Spark Core-----> 基于内存,数据的计算
第三个阶段:Spark SQL -----> 类似Oracle中的SQL语句
第四个阶段:Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂

Apache Storm:类似Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂
NOSQL:redis基于内存的数据库


新闻名称:大数据基础问答
转载来于:http://hxwzsj.com/article/peodgo.html

其他资讯

Copyright © 2025 青羊区翔捷宏鑫字牌设计制作工作室(个体工商户) All Rights Reserved 蜀ICP备2025123194号-14
友情链接: 企业手机网站建设 温江网站设计 定制网站建设多少钱 网站建设方案 广安网站设计 网站建设公司 营销型网站建设 网站建设公司 成都网站制作 外贸网站建设 成都网站制作 网站建设 成都网站制作 企业网站建设 外贸营销网站建设 成都网站制作 网站设计 重庆网站设计 成都网站设计 重庆网站制作 成都网站制作 成都网站建设