相关文章
Spark练习-RDD创建,读取hdfs上的数据,指定rdd分区
目录
RDD的创建
读取HDFS上文件数据
RDD分区指定 RDD的创建
将python数据转为rdd
# 将Python数据转为rdd
data [1,2,3,4]
res sum(data) # 使用python的方法计算时,采用的单机资源计算,如果数据量较大时,可以将python数据转为spark的r…
建站知识
2024/11/28 12:33:04
java脚手架系列6--openfeign
之所以想写这一系列,是因为之前工作过程中有几次项目是从零开始搭建的,而且项目涉及的内容还不少。在这过程中,遇到了很多棘手的非业务问题,在不断实践过程中慢慢积累出一些基本的实践经验,认为这些与业务无关的基本的…
建站知识
2024/11/28 12:45:05
Git 根据远程分支拉取并创建本地分支
文章目录 1 关联远程仓库2 获取最新更改,并创建分支3 clone时直接指定远程分支 1 关联远程仓库
git remote add remote_repo ssh:git***.git2 获取最新更改,并创建分支
查看本地分支和远程分支
git branch -a获取最新更改
git fetch remote_repo根据…
建站知识
2024/11/28 12:30:21
linux内存优化[2]_buffer_cache_写文件释放cache
关联文章: 1_读缓存cache优化
1.问题与验证
问题现象
1.htop free命令发现系统 buffer/cache 内存占用高 free -h total used free shared buff/cache available Mem: 61Gi 15Gi 569Mi 1.7Gi 45Gi 43Gi Swap: 30Gi 0.0Ki 30Gi cat /proc/meminfo or grep -E "Buff|Cach…
建站知识
2024/11/28 12:33:45
高效数据处理:MapReduce与Hive的实战应用
文章目录 hive分析汇总互联网日志分析1.项目需求2.数据说明3.算法思路 用户电影推荐1.项目需求2.数据说明3.算法思路4.解题步骤 简单数据统计WordCount数据说明 疫情数据分析1.项目需求2.数据说明step1:创建ods层数据表step2:创建dwd层数据表step3:创建d…
建站知识
2024/11/28 6:02:27
C语言从头学66—学习头文件 <stdio.h>(二)
关于可变参数,我们曾经在《C语言从头学27》中接触过,下面学习能够接收可变参数作为 参数的几个函数。 一、printf函数的能够接收可变参数的变体函数: 1、函数vprintf() 功能:按照给定格式,将可变参数中的内容输…
建站知识
2024/11/28 12:42:40