博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据系列9:Mahout – 机器学习
阅读量:5775 次
发布时间:2019-06-18

本文共 1541 字,大约阅读时间需要 5 分钟。

hot3.png

wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz

tar -xzvf mahout-distribution-0.8.tar.gz

cd mahout-distribution-0.8

sudo vi /etc/profile

增加:

    export PATH=$PATH:/home/ysc/mahout-distribution-0.8/bin

source /etc/profile

数据:hadoop fs -put clustering_material.txt testdata/clustering_material.txt

聚类1mahoutorg.apache.mahout.clustering.syntheticcontrol.kmeans.Job

分析1mahout clusterdump --input output/clusters-10-final --pointsDir output/clusteredPoints --output output/clusteranalyze_kmeans.txt

查看:

    hadoopfs -lsr output

    more  output/clusteranalyze_kmeans.txt

    VL-19代表这是一个clustern=161代表该cluster161个点,c=[...]代表该cluster的中心向量点,r=[...]代表cluster的半径

聚类2mahout org.apache.mahout.clustering.syntheticcontrol.canopy.Job

分析2mahout clusterdump --input output/clusters-0-final --pointsDir output/clusteredPoints --output output/clusteranalyze_canopy.txt

聚类3mahout org.apache.mahout.clustering.syntheticcontrol.fuzzykmeans.Job

分析3mahout clusterdump --input output/clusters-6-final --pointsDir output/clusteredPoints --output output/clusteranalyze_fuzzykmeans.txt

聚类4mahout org.apache.mahout.clustering.syntheticcontrol.dirichlet.Job

分析4mahout clusterdump --input output/clusters-5-final --pointsDir output/clusteredPoints --output output/clusteranalyze_dirichlet.txt

聚类5mahout org.apache.mahout.clustering.syntheticcontrol.meanshift.Job

分析5mahout clusterdump --input output/clusters-3-final --pointsDir output/clusteredPoints --output output/clusteranalyze_meanshift.txt

 

 

 

 

 

 

 

 

 

 

 

 

转载于:https://my.oschina.net/apdplat/blog/396682

你可能感兴趣的文章
【348天】每日项目总结系列086(2018.01.19)
查看>>
【294天】我爱刷题系列053(2017.11.26)
查看>>
Microsoft发布了Azure Bot Service和LUIS的GA版
查看>>
Google发布Puppeteer 1.0
查看>>
.NET开源现状
查看>>
可替换元素和非可替换元素
查看>>
2016/08/25 The Secret Assumption of Agile
查看>>
(Portal 开发读书笔记)Portlet间交互-PortletSession
查看>>
搭建vsftpd服务器,使用匿名账户登入
查看>>
AMD改善Linux驱动,支持动态电源管理
查看>>
JAVA中循环删除list中元素的方法总结
查看>>
Java虚拟机管理的内存运行时数据区域解释
查看>>
人人都会深度学习之Tensorflow基础快速入门
查看>>
ChPlayer播放器的使用
查看>>
js 经过修改改良的全浏览器支持的软键盘,随机排列
查看>>
Mysql读写分离
查看>>
Oracle 备份与恢复学习笔记(5_1)
查看>>
Oracle 备份与恢复学习笔记(14)
查看>>
分布式配置中心disconf第一部(基本介绍)
查看>>
Scenario 9-Shared Uplink Set with Active/Active uplink,802.3ad(LACP)-Flex-10
查看>>