国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > python聚类算法是什么

python聚类算法是什么

python聚类算法

头像

小妮浅浅

2021-09-03 10:33:135091浏览 · 0收藏 · 0评论

说明

1、聚类常用于数据探索或挖掘前期,在没有先验经验的背景下进行探索性分析。

也适用于样本量大的数据预处理。

2、常用的聚类算法分为基于划分、层次、密度、网格、统计、模型等类型的算法。典型算法包括K均值(经典聚类算法)、DBSCAN、两步聚类等。

聚类分析可以解决的问题包括:数据集可以分为几类,每个类别有多少样本,不同类别中每个变量的强弱关系,不同类别的典型特征是什么。

聚类算法之K均值实例

import numpy as np
import matplotlib.pyplot as plt
 
# 两点距离
def distance(e1, e2):
    return np.sqrt((e1[0]-e2[0])**2+(e1[1]-e2[1])**2)
 
# 集合中心
def means(arr):
    return np.array([np.mean([e[0] for e in arr]), np.mean([e[1] for e in arr])])
 
# arr中距离a最远的元素,用于初始化聚类中心
def farthest(k_arr, arr):
    f = [0, 0]
    max_d = 0
    for e in arr:
        d = 0
        for i in range(k_arr.__len__()):
            d = d + np.sqrt(distance(k_arr[i], e))
        if d > max_d:
            max_d = d
            f = e
    return f
 
# arr中距离a最近的元素,用于聚类
def closest(a, arr):
    c = arr[1]
    min_d = distance(a, arr[1])
    arr = arr[1:]
    for e in arr:
        d = distance(a, e)
        if d < min_d:
            min_d = d
            c = e
    return c
 
 
if __name__=="__main__":
    ## 生成二维随机坐标,手上有数据集的朋友注意,理解arr改起来就很容易了
    ## arr是一个数组,每个元素都是一个二元组,代表着一个坐标
    ## arr形如:[ (x1, y1), (x2, y2), (x3, y3) ... ]
    arr = np.random.randint(100, size=(100, 1, 2))[:, 0, :]
 
    ## 初始化聚类中心和聚类容器
    m = 5
    r = np.random.randint(arr.__len__() - 1)
    k_arr = np.array([arr[r]])
    cla_arr = [[]]
    for i in range(m-1):
        k = farthest(k_arr, arr)
        k_arr = np.concatenate([k_arr, np.array([k])])
        cla_arr.append([])
 
    ## 迭代聚类
    n = 20
    cla_temp = cla_arr
    for i in range(n):    # 迭代n次
        for e in arr:    # 把集合里每一个元素聚到最近的类
            ki = 0        # 假定距离第一个中心最近
            min_d = distance(e, k_arr[ki])
            for j in range(1, k_arr.__len__()):
                if distance(e, k_arr[j]) < min_d:    # 找到更近的聚类中心
                    min_d = distance(e, k_arr[j])
                    ki = j
            cla_temp[ki].append(e)
        # 迭代更新聚类中心
        for k in range(k_arr.__len__()):
            if n - 1 == i:
                break
            k_arr[k] = means(cla_temp[k])
            cla_temp[k] = []
 
    ## 可视化展示
    col = ['HotPink', 'Aqua', 'Chartreuse', 'yellow', 'LightSalmon']
    for i in range(m):
        plt.scatter(k_arr[i][0], k_arr[i][1], linewidth=10, color=col[i])
        plt.scatter([e[0] for e in cla_temp[i]], [e[1] for e in cla_temp[i]], color=col[i])
    plt.show()

以上就是python聚类算法的介绍,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

大地资源二中文在线播放第一集| 《夜班护士》结局| 晚上打扑克视频| B站夫妻进入高峰期需要多久 | 小柔与王叔的第一次相遇是第几集 | B站暴躁少女CSGO| 双龙戏珠3父子免费阅读全文| 扌雷辶鬲的小说章节| YSL蜜桃色6696是纯还是仿| 同学的母亲中字ID| 按摩师把我添高潮了6次| 小雨和公做爰22章| 簧片| 《巨大荫蒂》免费| 风流夫人免费观看高清电视剧| 妈妈的职业4免费观看完整版高清| 《大度》韩版免费| 有夫之妇精油按摩的功效与作用| 《性房纵欲》在线观看| 《湿点》未增减板相似| 迪拜的女孩| 角色 电影| 蜜桃| 妈妈与儿子高清免费版电视剧| 女生胸前两颗大大的包是什么| 男生困困进女生困困洞视频| 少妇WWVB操BBBB操BBBB| 漫蛙漫画(网页入口)| 《年轻朋友的妻子3》| 妈妈总是晚上装睡配合孩子| 蘑菇花园H5部分阅读目录大全| 日剧《轮流取珠》| BOBO浏览器| 新婚压床被别人开了苞| 疯狂二人房间荷尔蒙爆发原声| 《公的浮之手中字》免费| BOBO浏览器老司机模式改版特..| 电影免费观看高清完整版在线观看| 外国网站| 中文字幕在线观看| 情趣内衣