机器学习_聚类(PPT36页)课件

PPT
  • 阅读 69 次
  • 下载 0 次
  • 页数 36 页
  • 大小 4.662 MB
  • 2022-11-15 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档25.00 元 加入VIP免费下载
此文档由【小橙橙】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
机器学习_聚类(PPT36页)课件
可在后台配置第一页与第二页中间广告代码
机器学习_聚类(PPT36页)课件
可在后台配置第二页与第三页中间广告代码
机器学习_聚类(PPT36页)课件
可在后台配置第三页与第四页中间广告代码
机器学习_聚类(PPT36页)课件
机器学习_聚类(PPT36页)课件
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 36
  • 收藏
  • 违规举报
  • © 版权认领
下载文档25.00 元 加入VIP免费下载
文本内容

【文档说明】机器学习_聚类(PPT36页)课件.ppt,共(36)页,4.662 MB,由小橙橙上传

转载请保留链接:https://www.ichengzhen.cn/view-13125.html

以下为本文档部分文字说明:

机器学习——聚类汇报人:杨光1.聚类任务有一天老板给你一堆数据,然后他说,你给我分类(聚类)出来21.聚类任务聚类算法是一种无监督学习,我们区分监督学习和无监督学习的方法是看IN数据有无标签(Label)。31.聚类任务4在实际工作中,我们需要处理很多

数据,标签获取需要极大的人工工作量。1.聚类任务引言聚类算法会将数据集中的样本划分成为若干个通常不相交的子集,每一个子集我们称之为“簇”。在聚类过程自动形成簇结构后,我们会发现每个簇里会存在一些潜在的概念,比如“黄种人”、“白种人”,“女性”、“男性”,这些是我们事先未知

的,这些概念也是由使用者来把握和命名的。51.聚类任务引言62.性能度量引言目标:尽量使聚类结果的“簇内相似度高”且“簇间相似度低”两类指标:7外部指标:与某个“参考模型”比较内部指标:直接考察聚类结果(不利用参考模型)2.性能度量引言外部指标:

82.性能度量引言92.性能度量引言10内部指标:2.性能度量引言113.距离计算引言距离度量dist(.,.)需要满足一些性质:12非负性:dist(xi,xj)≥0同一性:dist(xi,xj)=0当且仅当xi=xj对称性:dist(xi,xj)=dist(

xj,xi)直递性:dist(xi,xj)≤dist(xi,xk)+dist(xk,xj)3.距离计算引言闵可夫斯基距离:当给定样本我们最常用的是“闵可夫斯基距离”p≥1时,“闵可夫斯基距离”公式满足上述4个性质。p=1时,“闵可夫斯基距离”即“曼哈顿距离”

。p=2时,“闵可夫斯基距离”即“欧氏距离”。133.距离计算引言有序属性:{1,2,3}闵可夫斯基距离无序属性:{飞机,火车,轮船}VDM143.距离计算引言153.距离计算引言164.原型聚类k-mean

s引言174.原型聚类k-means引言184.原型聚类k-means引言194.原型聚类k-means引言204.原型聚类LVQ引言214.原型聚类LVQ引言224.原型聚类LVQ引言234.原型聚类LVQ引言244.原型聚类LVQ引言255.密度聚类引言265.密度聚类引言275.密度聚类引

言285.密度聚类引言295.密度聚类引言305.密度聚类引言316.层次聚类引言32给定聚类簇Ci,Cj,可以通过下面的式子来计算距离:6.层次聚类引言336.层次聚类引言34以西瓜数据集4.0为例,令AGNES算法一直执行到所有样本出现在同一个簇中,即k=1,可以得到下面这个树

状图9.126.层次聚类引言35THANKYOU2018.4.3参考资料:周志华《机器学习》CSDN:https://blog.csdn.net/u014664226/article/details/51944092https://blog.cs

dn.net/cxmscb/article/details/62420615Wikipedia:https://zh.wikipedia.org/wiki/DBSCAN知乎:https://www.zhih

u.com/question/42044303/answer/10783631336

小橙橙
小橙橙
文档分享,欢迎浏览!
  • 文档 25747
  • 被下载 7
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?