Hadoop综合大作业-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Hadoop综合大作业

阅读量：5135 次

发布时间：2019-06-13

本文共 339 字，大约阅读时间需要 1 分钟。

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

由于爬虫大作业做的中文分析词云，所以这里采用下载长篇英文小说 The old man and sea来进行词频统计。

首先要启动dfs：

在hdfs上创建文件夹oldman：

查看hdfs的所有文件

上传到hdfs

打开hive创建oldman数据表

添加数据到oldman数据表

创建分析表统计

查看分析统计结果

2.用Hive对爬虫大作业产生的csv文件进行数据分析，写一篇博客描述你的分析过程和分析结果。

查看前10个数据

启动hive

将csv导入到数据表

显示查看数据

转载于:https://www.cnblogs.com/weixingna/p/9085207.html

你可能感兴趣的文章

转载 C#文件中GetCommandLineArgs()

list control控件的一些操作

精读《useEffect 完全指南》

SNF快速开发平台MVC-EasyQuery-拖拽生成SQL脚本

DrawerLayout实现双向侧滑

MySQL入门很简单-触发器

LVM快照(snapshot)备份

绝望的第四周作业

一月流水账

数论四大定理

npm 常用指令

20几个正则常用正则表达式

TextArea中定位光标位置

非常棒的Visual Studo调试插件:OzCode 2.0 下载地址

判断字符串在字符串中

hdu4374One hundred layer （DP+单调队列）

类间关系总结

properties配置文件读写，追加

Linux环境下MySql安装和常见问题的解决

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-19 02:34:31 当前IP: 3.139.97.97 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我