首页
架构
后端
大数据
前端
面试
开源
运维
专栏
Search...
大数据
收录了 大数据 栏目下的 1592 篇文章
聚焦大数据最前沿技术,涵盖Flink,CDC,MPP,Doris,StarRocks,Spark,数仓等最新发展技术,通过互联网分享知识,让更多开发者从中受益。
推荐
数仓
数据湖
Hive
Flink
HBase
Spark
Hadoop
Kafka
MPP
MapReduce 字符数示例
先决条件,执行 MapReduce 字符计数示例的步骤,文件:WC_Mapper.java,文件:WC_Reducer.java,文件:WC_Runner.java,下载源代码。, 在 MapReduce 字符计数示例中,我们找出了每个
Apache CN
2023/05/01 21:13
MapReduce
MapReduce 字数示例
先决条件,执行 MapReduce 字数示例的步骤,文件:WC_Mapper.java,文件:WC_Reducer.java,文件:WC_Runner.java,下载源代码。, 在 中,我们找出了每个单词的出现频率。在这里,Mapper
Apache CN
2023/05/01 21:13
MapReduce
Hadoop 教程
Hadoop 索引,先决条件,观众,问题, ![Big Data Hadoop] Hadoop 是一个开源框架。它由 Apache 提供,用于处理和分析非常庞大的数据量。它是用 Java 写的,目前被谷歌、脸书、领英、雅虎、推特等使用。
Apache CN
2023/05/01 21:13
Hadoop 安装
1) Java 安装,2) SSH 安装,3) Hadoop 安装,Hadoop 所需的环境:Hadoop 的生产环境是 UNIX,但也可以在使用 Cygwin 的 Windows 中使用。运行 MapReduce 程序需要 J
Apache CN
2023/05/01 21:13
HDFS 是什么
在哪里使用 HDFS,哪里不用 HDFS,HDFS 概念,从 HDFS 开始,HDFS 基本文件操作,HDFS 其他命令,Hadoop 附带了一个名为 HDFS 的分布式文件系统。在 HDFS,数据分布在几台机器上并被复制,以确保它们的
Apache CN
2023/05/01 21:13
HDFS
实现
映射器类,MapReduce 减速器类,MapReduce 作业类,映射器类的方法,减速器类的方法,作业分类方法, 在本节中,我们将重点讨论 MapReduce 应用编程接口。在这里,我们了解了 MapReduce 编程中使用的类和方法
Apache CN
2023/05/01 21:13
MapReduce
MapReduce 教程
什么是 MapReduce?,mapreduce 中的步骤,排序和洗牌,MapReduce 的使用,先决条件,观众,问题,提供了 MapReduce 的基本概念和高级概念。我们的 MapReduce 教程是为初学者和专业人士设计的。
Apache CN
2023/05/01 21:13
MapReduce
Hadoop面试题总结三MapReduce
,Hadoop面试题总结三——MapReduce,待我代码写成,便娶你为妻。,1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?,2、FileInputFormat切片机制☆☆☆☆☆,3、在一个运行的Hadoop 任务
大数据技术派
2022/11/20 15:00
YARN调度器Scheduler详解
,YARN调度器(Scheduler)详解,1. Yarn调度器介绍,2.Yarn调度器配置,待我代码写成,便娶你为妻。,1.1. FIFO Scheduler(先进先出调度器),1.2.Capacity Scheduler(容量调度器
大数据技术派
2022/11/20 15:00
彻底解决Hive小文件问题
,彻底解决Hive小文件问题,待我代码写成,便娶你为妻。,小文件产生的原因,小文件的危害,小文件的解决方案,推测可能是有小文件。 去`hdfs`目录查看了一下该目录: ![](https://static.oomspot.com/i
大数据技术派
2022/11/20 15:00
数据仓库
1
2
3
>>
推荐作者
更多
Apache CN
Apache InLong
Apache RocketMQ
热门标签
更多
java
python
spring
springcloud
jvm
数据库
mysql
redis
数仓
hadoop
hive
hbase
kafka
clickhouse
doris
elasticsearch
flink
javascript
jquery
html
git
linux