博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python机器学习(1):KMeans聚类
阅读量:4954 次
发布时间:2019-06-12

本文共 937 字,大约阅读时间需要 3 分钟。

Python进行KMeans聚类是比较简单的,首先需要import numpy,从sklearn.cluster中import KMeans模块:

import numpy as npfrom sklearn.cluster import KMeans

然后读取txt文件,获取相应的数据并转换成numpy array:

X = []f = open('rktj4.txt')for v in f:    regex = re.compile('\s+')    X.append([float(regex.split(v)[3]), float(regex.split(v)[6])])X = np.array(X)

设置类的数量,并聚类:

n_clusters = 5cls = KMeans(n_clusters).fit(X)

完整代码:

import numpy as npfrom sklearn.cluster import KMeansimport matplotlib.pyplot as pltimport reX = []f = open('rktj4.txt')for v in f:    regex = re.compile('\s+')    X.append([float(regex.split(v)[3]), float(regex.split(v)[6])])X = np.array(X)n_clusters = 5cls = KMeans(n_clusters).fit(X)cls.labels_markers = ['^','x','o','*','+']for i in range(n_clusters):    members = cls.labels_ == i    plt.scatter(X[members, 0], X[members, 1], s=60, marker=markers[i], c='b', alpha=0.5)    print     plt.title('')plt.show()

运行结果:

转载于:https://www.cnblogs.com/mstk/p/7755635.html

你可能感兴趣的文章
zoj 1649 Rescue (BFS)(转载)
查看>>
2124: 等差子序列 - BZOJ
查看>>
字符串匹配算法综述
查看>>
Linux centosVMware shell 管道符和作业控制、shell变量、环境变量配置文件
查看>>
【设计模式】工厂模式
查看>>
两个表格中数据不用是一一对应关系--来筛选不同数据,或者相同数据
查看>>
javascript 继承
查看>>
String类型转int类型方法
查看>>
客户数据库出现大量cache buffer chains latch
查看>>
機械の総合病院 [MISSION LEVEL: C]
查看>>
实战练习细节(分行/拼接字符串/字符串转int/weak和copy)
查看>>
Strict Standards: Only variables should be passed by reference
查看>>
hiho_offer收割18_题解报告_差第四题
查看>>
AngularJs表单验证
查看>>
静态方法是否属于线程安全
查看>>
fegin 调用源码分析
查看>>
Linux的基本命令
查看>>
02号团队-团队任务3:每日立会(2018-12-05)
查看>>
SQLite移植手记1
查看>>
C# windows程序应用与JavaScript 程序交互实现例子
查看>>