文件名称:
KMeansClusteringDNA:识别HepC爆发来源的K手段-源码
开发工具:
文件大小: 35kb
下载次数: 0
上传时间: 2021-02-15
详细说明:这是“ K均值”聚类用于识别肝炎C暴发源的示例。 该项目的K Means部分完全从头开始编码,没有使用任何K Means库。
首先从处理.fas文件中的数据到我拥有一个数组(每个索引包含一个基因组)的地方开始。 然后,它计算每个基因组之间的汉明距离。 然后,我通过“多维缩放”来运行它,以获取数据的散点图以及该数据的数据帧。 我使用散点图来确定数据中有8个簇。
有了这些知识,我便可以通过我的K Means方法运行数据框。 K Means方法遵循以下过程:
指定要分配的集群数
随机初始化K重心
将每个点分配给最接近的质心
计算每个簇的新质心(均值)
返回第3步并重复直到质心的值不变
完成后
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.