不到一百行的代码教你在spark平台中使用scala实现kmeans算法。
简单易懂,大量注释。
适合初学者参考理解。
本程序在intelliJIDEA2016.1.1中编程,运行在spark1.6.1scala2.10.4本地模式下运行成功。
数据集:(其实‘,’前面的1.00.0没用,不过不能删除,除非你修改代码中的数据解析代码)1.0,0.01.10.10.0,2.01.0-1.00.0,2.01.31.01.0,0.01.2-0.51.0,1.01.40.81.0,0.31.51.10.0,2.11.0-1.00.0,1.02.31.31.0,0.20.2-1.51.0,1.01.42.8
1