当前位置: 首页 > news >正文

朝阳市网站建设_网站建设公司_自助建站_seo优化

阿里云服务器建站,网站建设包括什么,长春网站建设公司哪个好,深圳制作公司网站聚类算法的性能度量 聚类算法就是根据数据中样本与样本之间的距离或相似度#xff0c;将样本划分为若干组#xff0f;类#xff0f;簇#xff0c;其划分的原则#xff1a;簇内样本相似、簇间样本不相似#xff0c;聚类的结果是产生一个簇的集合。 其划分方式主要分为两…聚类算法的性能度量 聚类算法就是根据数据中样本与样本之间的距离或相似度将样本划分为若干组类簇其划分的原则簇内样本相似、簇间样本不相似聚类的结果是产生一个簇的集合。 其划分方式主要分为两种 嵌套类型 非嵌套类型 其中簇往往分为三种情况 基于中心的簇簇内的点和其“中心”较为相近或相似和其他簇的“中心”较远这样的一组样本形成的簇基于邻接的簇相比其他任何簇的点每个点都至少和所属簇的某一个点更近基于密度的簇簇是由高密度的区域形成的簇之间是一些低密度的区域 簇的相似性与距离度量 若采用距离为度量 闵可夫斯基距离 d i s t ( x i , x j ) ( ∑ d 1 D ∣ x i , d − x j , d ∣ p ) 1 / p dist(x^i,x^j)\left(\sum_{d1}^D|x_{i,d}-x_{j,d}|^p\right)^{1/p} dist(xi,xj)(∑d1D​∣xi,d​−xj,d​∣p)1/p 当 p 2 p2 p2时为欧氏距离 : d i s t ( x i , x j ) ∑ d 1 D ( x i , d − x j , d ) 2 :dist(x^i,x^j)\sqrt{\sum_{d1}^D\left(x_{i,d}-x_{j,d}\right)^2} :dist(xi,xj)∑d1D​(xi,d​−xj,d​)2 ​ 当 p 1 p1 p1时为曼哈顿距离 d i s t ( x i , x j ) ∑ d 1 D ∣ x i , d − x j , d ∣ dist(x^i,x^j)\sum_{d1}^D\left|x_{i,d}-x_{j,d}\right| dist(xi,xj)∑d1D​∣xi,d​−xj,d​∣ 这类距离函数对特征的旋转和平移变换不敏感对数值尺度敏感 若采用余弦相似度量 两变量 x i , x j x^i,x^j xi,xj,看作D维空间的两个向量这两个向量间的夹角余弦可用下式进行计算 s ( x i , x j ) ∑ d 1 D x i , d x j , d ∑ d 1 D x i , d 2 ∑ d 1 D x j , d 2 ( x i ) T x j ∥ x i ∥ ∥ x j ∥ s(x^i,x^j)\frac{\sum_{d1}^Dx_{i,d}x_{j,d}}{\sqrt{\sum_{d1}^Dx_{i,d}^2}\sqrt{\sum_{d1}^Dx_{j,d}^2}}\frac{(x^i)^Tx^j}{\|x^i\|\|x^j\|} s(xi,xj)∑d1D​xi,d2​ ​∑d1D​xj,d2​ ​∑d1D​xi,d​xj,d​​∥xi∥∥xj∥(xi)Txj​ 若采用相关系数 r ( x i , x j ) c o v ( x i , x j ) σ x i σ x j E [ ( x i − μ i ) ( x j − μ j ) ] σ x i σ x j ∑ d 1 D ( x i , d − μ i , d ) ( x j , d − μ j , d ) ∑ d 1 D ( x i , d − μ i , d ) 2 ∑ d 1 D ( x j , d − μ j , d ) 2 \begin{gathered} r(x^i,x^j)\frac{cov(x^i,x^j)}{\sigma_{x_i}\sigma_{x_j}}\frac{\mathbb{E}[(x^i-\mu^i)(x^j-\mu^j)]}{\sigma_{x_i}\sigma_{x_j}} \\ \begin{aligned}\frac{\sum_{d1}^D(x_{i,d}-\mu_{i,d})(x_{j,d}-\mu_{j,d})}{\sqrt{\sum_{d1}^D\left(x_{i,d}-\mu_{i,d}\right)^2\sum_{d1}^D\left(x_{j,d}-\mu_{j,d}\right)^2}}\end{aligned} \end{gathered} r(xi,xj)σxi​​σxj​​cov(xi,xj)​σxi​​σxj​​E[(xi−μi)(xj−μj)]​∑d1D​(xi,d​−μi,d​)2∑d1D​(xj,d​−μj,d​)2 ​∑d1D​(xi,d​−μi,d​)(xj,d​−μj,d​)​​​ 当数据采用中心化处理后 μ i μ j 0 \mu_i\mu_j0 μi​μj​0相关系数等于余弦相似度 对聚类算法的性能评价指标 参考模型 设存在数据集 D { x 1 , x 2 , . . . x N } D\{x^1,x^2,...x^N\} D{x1,x2,...xN}聚类结果 : C { C 1 , C 2 , . . . C K } :C\{\mathcal{C}_1,\mathcal{C}_2,...\mathcal{C}_K\} :C{C1​,C2​,...CK​},其中 C k \mathcal{C}_k Ck​表示属于类别 k k k的样本的集合其中参考模型的分类结果为 C ∗ { C 1 ∗ , . . . , C K ∗ } \mathcal{C}^*\{\mathcal{C}_1^*,...,\mathcal{C}_K^*\} C∗{C1∗​,...,CK∗​}, λ \lambda λ 和 λ ∗ \lambda^* λ∗ 分别为 c c c和 c ∗ c^* c∗ 的标记向量 其中聚类结果有4种情况 a { ( x i , x j ) ∣ x i , x j ∈ C k ; x i , x j ∈ C l ∗ } 在两种聚类结果中两个样本的所属的簇相同 d { ( x i , x j ) ∣ x i ∈ C k 1 , x j ∈ C k 2 ; x i ∈ C l 1 ∗ , x j ∈ C l 2 ∗ } 在两种聚类结果中两个样本的所属的簇不同 b { ( x i , x j ) ∣ x i , x j ∈ C k ; x i ∈ C l 1 ∗ , x j ∈ C l 2 ∗ } c { ( x i , x j ) ∣ x i ∈ C k 1 , x j ∈ C k 2 ; x i , x j ∈ C l ∗ } \begin{aligned} a\begin{Bmatrix}(x^i,x^j)|x^i,x^j\in\mathcal{C}_k;x^i,x^j\in\mathcal{C}_l^*\end{Bmatrix}\\ \text{在两种聚类结果中两个样本的所属的簇相同}\\ d\{(x^i,x^j)|x^i\in\mathcal{C}_{k1},x^j\in\mathcal{C}_{k2};\:x^i\in\mathcal{C}_{l1}^*,x^j\in\mathcal{C}_{l2}^*\}\\ \text{在两种聚类结果中两个样本的所属的簇不同}\\ b\big\{(x^i,x^j)|x^i,x^j\in\mathcal{C}_k;\:x^i\in C_{l1}^*,x^j\in\mathcal{C}_{l2}^*\big\}\\ c\big\{(x^i,x^j)|x^i\in\mathcal{C}_{k1},x^j\in\mathcal{C}_{k2};\:x^i,x^j\in\mathcal{C}_l^*\big\} \end{aligned} adbc​{(xi,xj)∣xi,xj∈Ck​;​xi,xj∈Cl∗​​}在两种聚类结果中两个样本的所属的簇相同{(xi,xj)∣xi∈Ck1​,xj∈Ck2​;xi∈Cl1∗​,xj∈Cl2∗​}在两种聚类结果中两个样本的所属的簇不同{(xi,xj)∣xi,xj∈Ck​;xi∈Cl1∗​,xj∈Cl2∗​}{(xi,xj)∣xi∈Ck1​,xj∈Ck2​;xi,xj∈Cl∗​}​ 每个样本对 ( x i , x j ) ( i j ) (x_i,x_j)(ij) (xi​,xj​)(ij) 仅能出现在一个集合中因此有 a b c d m ( m − 1 ) / 2 abcdm(m-1)/2 abcdm(m−1)/2 成立 Jaccard 系数(Jaccard Coefficient, 简称 JC) JC a a b c \text{JC}\frac a{abc} JCabca​ FM 指数(Fowlkes and Mallows Index, 简称 FMI) F M I a a b ⋅ a a c \mathrm{FMI}\sqrt{\frac a{ab}\cdot\frac a{ac}} FMIaba​⋅aca​ ​ Rand 指数(Rand Index, 简称 RI$) $ R I 2 ( a d ) N ( N − 1 ) \mathrm{RI}\frac{2(ad)}{N(N-1)} RIN(N−1)2(ad)​ 上述性能度量的结果值均在 [0,1] 区间值越大越好 无参考模型 其要求簇内相似度越大越好簇间相似度越小越好 平均距离 a v g ( C k ) 1 ∣ C k ∣ ( ∣ C k ∣ − 1 ) ∑ x i , x j ∈ C k d i s t ( x i , x j ) avg(\mathcal{C}_k)\frac1{|\mathcal{C}_k|(|\mathcal{C}_k|-1)}\sum_{x^i,x^j\in\mathcal{C}_k}dist(x^i,x^j) avg(Ck​)∣Ck​∣(∣Ck​∣−1)1​xi,xj∈Ck​∑​dist(xi,xj) 最大距离 d i a m ( C k ) max ⁡ x i , x j ∈ C k d i s t ( x i , x j ) diam\left(\mathcal{C}_k\right)\max_{x^i,x^j\in\mathcal{C}_k}dist(\boldsymbol{x}^i,\boldsymbol{x}^j) diam(Ck​)xi,xj∈Ck​max​dist(xi,xj) 簇的半径 d i a m ( C k ) 1 ∣ C k ∣ ∑ x i ∈ C k ( d i s t ( x i , μ k ) ) 2 diam(\mathcal{C}_k)\sqrt{\frac1{|C_k|}\sum_{x^i\in\mathcal{C}_k}(dist(x^i,\mu^k))^2} diam(Ck​)∣Ck​∣1​xi∈Ck​∑​(dist(xi,μk))2 ​ 其中 μ k 1 ∣ C k ∣ ∑ x i ∈ C k x i \mu^{k}\frac{1}{|\mathcal{C}_{k}|}\sum_{x^{i}\in\mathcal{C}_{k}}\boldsymbol{x}^{i} μk∣Ck​∣1​∑xi∈Ck​​xi 最小距离 d m i n ( C k , C l ) min ⁡ x i ∈ C k , x j ∈ C l d i s t ( x i , x j ) d_{min}(\mathcal{C}_k,\mathcal{C}_l)\min_{x^i\in\mathcal{C}_k,x^j\in\mathcal{C}_l}dist(x^i,x^j) dmin​(Ck​,Cl​)xi∈Ck​,xj∈Cl​min​dist(xi,xj) 类中心的距离 d c e n ( C k , C l ) d i s t ( μ k , μ l ) , d_{cen}(\mathcal{C}_k,\mathcal{C}_l)dist(\mathbf{\mu}^k,\mathbf{\mu}^l), dcen​(Ck​,Cl​)dist(μk,μl), DB指数DBI【簇内距离/簇间距离】 D B I 1 K ∑ k 1 K max ⁡ k ≠ l arg ⁡ ( C k ) a v g ( C l ) d c e n ( C k , C l ) DBI\frac1K\sum_{k1}^K\max_{k\neq l}\frac{\arg(\mathcal{C}_k)avg(\mathcal{C}_l)}{d_{cen}(\mathcal{C}_k,\mathcal{C}_l)} DBIK1​k1∑K​klmax​dcen​(Ck​,Cl​)arg(Ck​)avg(Cl​)​ 其中DBI越小越好即簇越小越远 Dunn 指数DI【最小簇间距离/最大簇的半径】 D I min ⁡ 1 ≤ k l ≤ K d m i n ( C k , C l ) max ⁡ 1 ≤ k ≤ K d i a m ( C k ) DI\min_{1\leq kl\leq K}\frac{d_{min}(\mathcal{C}_k,\mathcal{C}_l)}{\max_{1\leq k\leq K}diam(\mathcal{C}_k)} DI1≤kl≤Kmin​max1≤k≤K​diam(Ck​)dmin​(Ck​,Cl​)​ 其中DI越大越好
http://www.ihoyoo.com/news/11973.html

相关文章:

  • 北京网站开发联系电话wordpress 5.0.2 发布失败
  • 创建网站如何注册2022年企业所得税税率表一览
  • 内蒙古网站建设流程临沂外贸网站
  • 点击图片是网站怎么做的手工制作大全废物利用
  • 公司网站建设计划wordpress小工具文件
  • 网站设计建设企业教务管理系统登录入口官网
  • 网站建设方案华为郑州市
  • 眉山网站设计中国职业培训在线官方网站
  • 营销型网站建设总结WordPress室内净化主题
  • 哪些网站可以做go注释盐山网站
  • 做暖暖免费网站wordpress文章内页的图片地址修改
  • php源码网站后台面密码忘了在哪能找回密码群晖 做网站服务器
  • 做去态网站要学什么语言商标设计logo图案软件免费
  • 枣庄网站建设费用自己做的网站怎么显示表格边框
  • 现在网站后台有哪几种模板形式中国建设银行网站公积金查询余额
  • 好网站建设公司有多少银川网站建设
  • 网站怎么做值班表网站跳转qq链接怎么做的
  • 高端网站定制策划wamp搭建wordpress
  • 设计网站公司优选亿企邦网站建设 淘宝客末班
  • 十渡网站建设企业解决方案模板
  • 网站模板 扁平化wordpress 网站模板
  • 内蒙古网站建设熊掌号响应式网站的原理
  • 支付公司网站建设会计分录办公室装修实景拍摄图
  • 赣县城乡规划建设局网站网站top排行榜
  • xampp安装网站模板深圳企业网站建设报价
  • 网站建设 项目书 框架win主机安装wordpress
  • 国内网站欣赏找个网站
  • 在vs中做网站如何连接数据库重庆行业网站建设
  • 网站建设托管产品图广东全网营销与推广公司
  • 网站模板小偷上海网站建设一般多少钱