您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Multi Armed Bandit Algorithm

  2. 一个可以帮助排序的算法。该算法利用赌徒模型模拟排序过程,是一个非常好用的算法~
  3. 所属分类:项目管理

    • 发布日期:2014-01-25
    • 文件大小:819200
    • 提供者:u013015970
  1. online clustering of bandits

  2. Abstract We introduce a novel algorithmic approach to content recommendation based on adaptive clustering of exploration-exploitation("bandit") strategies.We provide sharo regret analysis of this algorithm in a standard stochastic noise setting,demo
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-05
    • 文件大小:2097152
    • 提供者:u010811683
  1. the 10-bandit problem.rar

  2. 强化学习 the 10-armed bandit问题仿真,e-greedy算法,梯度上升算法 matlab代码
  3. 所属分类:机器学习

    • 发布日期:2019-09-07
    • 文件大小:22528
    • 提供者:qq_31880107
  1. Algorithms for hyper-parameter optimization

  2. Algorithms for hyper-parameter optimization.pdf,讲述贝叶斯算法的TPE过程的专业论文The contribution of this work is two novel strategies for approximating f by modeling H: a hier archical Gaussian Process and a tree-structured parzen estimator. These are described in
  3. 所属分类:其它

    • 发布日期:2019-09-03
    • 文件大小:274432
    • 提供者:yangtao_whut
  1. zr-obp:开放强盗管道-源码

  2. 开放式强盗管道:用于强盗算法和政策外评估的研究框架 | |||| 目录 概述 开放强盗数据集(OBD) Open Bandit Dataset是一个公开的,在现实世界中记录的匪徒反馈数据。该数据集由提供, .是日本最大的时尚电子商务公司,市值超过50亿美元(截至2020年5月)。该公司使用多臂匪盗算法在称为的大型时尚电子商务平台中向用户推荐时尚商品。下图显示了作为操作显示的时装项目的示例。 在ZOZOTOWN推荐界面中将推荐的时尚商品作为动作 我们于2019年11月下旬进行了为期7天的实验,
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:17825792
    • 提供者:weixin_42103587
  1. Recommend:推荐系统-源码

  2. 总结 推荐系统和常用算法 推荐系统简介 知识点1:系统架构,模块介绍(召回,排序,重排序算法和系统等) 知识点2:推荐算法评估指标 知识点3:A / B测试系统 知识点4:冷启动问题和工业界解决方案 程序:冷启动解决方案代码实战(多臂竞争机问题bandit算法相关) 召回算法(CF) 知识点1:常用的CF算法以及变种(User / Item CF等变种) 知识点2:混合CF算法 知识点3:基于模型的CF(LFM矩阵分解,NMF,SVD) 知识点4:基于改进版协同过滤算法实战 程序:基于tenso
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:80740352
    • 提供者:weixin_42136791
  1. 芒果:Python中的并行超参数优化-源码

  2. 芒果:平行的黑匣子优化库 Mango是一个python库,用于在复杂搜索空间上进行并行优化。 目前,Mango旨在为机器学习算法找到最佳的超参数。 查看Mango的快速12秒演示,该演示近似于SVM的复杂决策边界 Mango在内部使用基于高斯过程的多臂Bandit贝叶斯优化器的并行实现。 芒果的一些突出特点是: 能够轻松定义与scikit-learn随机搜索和gridsearch函数兼容​​的复杂搜索空间。 内部使用最先进的优化器,该优化器允许并行采样一批值以进行评估。 目标函数可以任
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:9437184
    • 提供者:weixin_42102713
  1. 多武装强盗:分析n武装强盗问题和MDP的算法-源码

  2. 多武装盗贼 分析n武装匪徒问题的算法 多武装匪徒问题(UCB稍后实施) 在第一部分中,我们尝试形象化了Q学习在提取最大奖励方面的完美程度,在预测中间奖励方面的成功程度以及最终对提供最大累积奖励的*的预测程度 在第二部分中,我们检查了Q值如何饱和以及选择的最佳操作百分比随迭代次数如何稳定 我们已经使用Bell曲线在python random.gauss()函数中生成了随机数。 因此,每台这样的Bandit或Slot机器都将具有一条特性曲线(特别是在设置了它们的均值和标准差时,其值由用户输入
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:6144
    • 提供者:weixin_42126399
  1. bandit-algorithms-js:js中的epsilon-greedy和softmax算法的实现-源码

  2. 多武装强盗问题 js中的epsilon-greedy和softmax算法的实现。 基于约翰·迈尔斯·怀特(John Myles White)的《 的 》一书。
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:3072
    • 提供者:weixin_42104181
  1. 感知质量优化的移动群智感知任务在线分发算法

  2. 感知质量优化和用户招募是移动群智感知的两个重要问题,随着数据量的大幅度增加,感知内容出现冗余,存在感知质量降低的风险。提出了一种感知质量优化的任务分发机制,在保证覆盖率的情况下,提高群体的感知质量。利用聚类算法评估任务真值,量化用户数据质量;基于汤普森抽样算法和贪婪算法设计并实现了一种用户招募策略,在保证任务空间覆盖率的基础上优化感知质量。针对TSUR(Thompson based user recruit)算法的性能进行仿真分析,并与已有的BBTA(bandit-based task assi
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:986112
    • 提供者:weixin_38499503
  1. public:民众-源码

  2. 民众 民众 线性回归: ://zhuanlan.zhihu.com/p/72513104 lr:逻辑回归逻辑回归 gbdt:梯度提升决策树决策树决策树 ee:exploit-explore利用和探索Exploit-Explore这一对矛盾一直存在的事实,Bandit算法是公认的一种比较好的解决EE问题的方案 概统学习(20210324-20210420) 特征工程: : 一天会一个小算法之: 3月30日:swing算法(召回)通过I U * U I的大矩阵乘法结果,获取两个项目
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:1024
    • 提供者:weixin_42153691