文件名称:
大数据机器学习框架(弥勒佛)MLF.zip
开发工具:
文件大小: 5mb
下载次数: 0
上传时间: 2019-07-19
详细说明: 让天下没有难做的大数据模型!功能下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间监督式学习:最大熵分类模型(max entropy classifier),决策树模型(decision tree based models,2014 Q1)非监督式学习:聚类问题(k-means,2014 Q1)在线学习:在线梯度递降模型(online stochastic gradient descent)神经网络(2014 Q2/3)项目实现了下面的组件多种数据集(in-mem,skip)多种评价器(precision,recall,f-score,accuracy,confusion)和交叉评价(cross-validation)多种优化器:协程并 发L-BFGS,梯度递降(batch, mini-batch, stochastic),带退火的学习率(learning rate),L1/L2正则化(regularization)稀疏向量(sparse vector)以存储和表达上亿级别的特征特征辞典(feature dictionary)在特征名和特征ID之间自动翻译 现有的机器学习框架/软件包存在几个问题:无法处理大数据:多数Python,Matlab和R写的训练框架适合处理规模小的样本,没有为大数据优化。不容易整合到实际生产系统:standalone的程序无法作为library嵌入到大程序中。模型单一:一个软件包往往只解决一个类型的问题(比如监督式或者非监督式)。不容易扩展:设计时没有考虑可扩展性,难以添加新的模型和组件。代码质量不高:代码缺乏规范,难读懂、难维护。 弥勒佛项目的诞生就是为了解决上面的问题,在框架设计上满足了下面几个需求:处理大数据:可随业务增长scale up,无论你的数据样本是1K还是1B规模,都可使用弥勒佛项目。为实际生产:模型的训练和使用都可以作为library或者service整合到在生产系统中。丰富的模型:容易尝试不同的模型,在监督、非监督和在线学习等模型间方便地切换。高度可扩展:容易添加新模型,方便地对新模型进行实验并迅速整合到生产系统中。高度可读性:代码规范,注释和文档尽可能详尽,适合初学者进行大数据模型的学习。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
相关搜索: