您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于微重启和部分客观马尔可夫决策模型的智能水下机器人软件自修复方法

  2. 针对智能水下机器人(AUV)软件故障修复过程中存在的修复代价过高和系统环境只有部分可观察的问题,提出了一种基于微重启技术和部分客观马尔可夫决策(POMDP)模型的AUV软件故障修复方法。该方法结合AUV软件系统分层结构特点,构建了基于微重启的三层重启结构,便于细粒度的自修复微重启策略的实施;并依据部分可观马尔可夫决策过程理论,给出AUV软件自修复POMDP模型,同时采用基于点的值迭代(PBVI)算法求解生成修复策略,以最小化累积修复代价为目标,使系统在部分可观环境下能够以较低的修复代价执行修复
  3. 所属分类:C

    • 发布日期:2015-08-29
    • 文件大小:829440
    • 提供者:jiximeng123
  1. POMDP,部分可观察马尔可夫决策过程

  2. POMDP是增强学习的基础,很少见的讲解POMDP的讲义,详细并且清晰,是学习POMDP非常好的参考资料,深入浅出,值得拥有。
  3. 所属分类:机器学习

    • 发布日期:2020-10-26
    • 文件大小:2097152
    • 提供者:ligary2002
  1. 基于POMDP的流媒体服务器RAM缓存算法

  2. 流媒体服务器需要经常从本地磁盘获取数据。由于磁盘的读写速度比随机存取存储器(RAM)低得多,因此良好的RAM缓存策略可以有效地减少磁盘I / O。传统技术是使用基于0-1背包问题模型的贪婪和次优算法。在本文中,我们针对缓存问题提出了部分可观察的马尔可夫决策过程(POMDP)模型。基于该模型,将基于事件的优化方法应用于最优随机策略的搜索。磁盘I / O作为Markov链的长期平均性能指标,通过应用策略梯度算法进行了优化。仿真结果表明,采用该方法可以较好地预测需求数据,降低磁盘I / O量。
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:181248
    • 提供者:weixin_38752830
  1. 具有可扩展视频的分布式VoD系统的准入控制

  2. 在新的网络环境下,可伸缩视频编码(SVC)被认为是有前途的视频编码方案。 但是,在分布式视频点播(VoD)系统中提供可伸缩视频会带来许多其他问题,例如根据变化的终端功能或网络条件来调整QoS,确保提供可接受的视频质量同时避免网络拥塞等。提出了一种具有可扩展视频的分布式VoD系统的新型准入控制模型。 服务系统的准入控制过程被建模为部分可观察的马尔可夫决策过程(POMDP)。 系统的准入控制策略是可以通过策略梯度法解决的随机策略。 通过数值实验,所提出的方法表现良好。
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:181248
    • 提供者:weixin_38750007
  1. 能量收集认知无线电传感器网络中的最佳频谱感知-访问策略

  2. 在本文中,我们将能量收集引入认知无线电传感器网络中,以可再生能源为网络供电,从而实现能量受限传感器的自我可持续性。 在我们的工作中,认知无线电技术使传感器能够访问未充分利用的频谱,以解决无执照频段中的频谱稀缺问题。 使用集中式协作频谱感测,从具有不同接收的主要用户的信号功率和能量到达率的候选传感器中选择一组认知传感器。 在检测到主要通道的状态之后,我们还需要确定哪个认知传感器可以访问主要通道以及传输时使用的功率水平。 上述感测访问设计问题被表述为无限水平,部分可观察的马尔可夫决策过程,其主要目标
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:480256
    • 提供者:weixin_38732519
  1. 具有能量收集能力的CCRN中的最佳模式选择策略

  2. 在以能量收集(EH)为动力的合作认知无线电网络(CCRN)中,次要用户大多分布在移动环境中。 考虑到不同的即时环境,每个用户必须自己做出决定。 因此,有必要设计一种最佳策略来最大化二级吞吐量。 在本文中,我们专注于通过在每个时隙的开始为二级用户提供两种模式选择来最大化长期二级吞吐量。 在部分可观察的马尔可夫决策过程(POMDP)框架下,我们为分布式二级用户提出了一种最佳模式选择策略。 最后,我们通过数值模拟探索了不同参数对拟议政策的影响。
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:576512
    • 提供者:weixin_38656609
  1. 具有能量收集能力的CCRN中的最佳模式选择策略

  2. 在以能量收集(EH)为动力的合作认知无线电网络(CCRN)中,次要用户大多分布在移动环境中。 考虑到不同的即时环境,每个用户必须自己做出决定。 因此,有必要设计一种最佳策略来最大化二级吞吐量。 在本文中,我们专注于通过在每个时隙的开始为二级用户提供两种模式选择来最大化长期二级吞吐量。 在部分可观察的马尔可夫决策过程(POMDP)框架下,我们为分布式二级用户提出了一种最佳模式选择策略。 最后,我们通过数值模拟探索了不同参数对拟议政策的影响
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:472064
    • 提供者:weixin_38697753
  1. POMDP:基于部分可观察的马尔可夫决策过程实现RL算法-源码

  2. POMDP:基于部分可观察的马尔可夫决策过程实现RL算法
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:168960
    • 提供者:weixin_42131785
  1. POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口-源码

  2. POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:377856
    • 提供者:weixin_42110038
  1. 多小区OFDMA系统中基于POMDP的干扰协调

  2. 对OFDMA系统中的干扰协调进行了研究,提出了一种基于部分可观察马尔可夫决策过程理论的动态干扰协调算法。该算法结合干扰的统计模型和信道的信干噪比对边缘用户进行信道分配。仿真结果表明,该算法能够有效地使边缘用户避开邻小区干扰,而且不需要小区间交互,节省了系统开销。另外,利用粒子滤波法建立了SINR和干扰的似然关系,不需要系统额外对干扰进行测量。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38610513
  1. 认知无线电中基于特征信念的协作频谱检测算法

  2. 针对认知无线网络(CRN)中频谱检测准确性与检测效率难以平衡的问题,本文提出一种特征信念的认知无线网络ED/FD协作频谱检测算法。通过单认知用户能量检测与特征信号检测协作模式代替多认知用户协作检测模式,降低通信开销,利用部分可观察马尔可夫决策过程(POMDP)对CRN 建模,将检测准确性与检测效率平衡优化问题转化为POMDP最优值函数求解过程,并采用特征信念控制信念状态规模和在线最大报酬值迭代法求解法逼近最优值,降低算法复杂度。实验结果表明,本文算法能有效取得频谱检测准确性与检测效率之间的平衡,
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38539705
  1. 一种基于信念状态压缩的实时POMDP算法

  2. 针对求解部分可观察马尔可夫决策过程(POMDP)信念状态空间是NP难问题,提出一种信念状态空间压缩(BSSC)算法.将信念状态空间的高维压缩到低维,利用动态贝叶斯网络对状态转移函数,观察函数和报酬函数进行压缩,降低求解规模,达到实时决策的目的.对比实验表明,所提出的算法可以快速求解最优策略和最优值函数.
  3. 所属分类:其它

    • 发布日期:2021-01-15
    • 文件大小:407552
    • 提供者:weixin_38632763
  1. 基于Monte Carlo 粒子滤波的POMDPs 在线算法

  2. 针对部分可观察马尔可夫决策过程(POMDPs) 的信念状态空间是一个双指数规模问题, 提出一种基于Monte Carlo 粒子滤波的POMDPs 在线算法. 首先, 分别采用粒子滤波和粒子映射更新和扩展信念状态, 建立可达信念状态 与或树; 然后, 采用分支界限裁剪方法对信念状态与或树进行裁剪, 降低求解规模. 实验结果表明, 所提出算法具有较 低的误差率和较快的收敛性, 能够满足系统实时性的要求.
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:211968
    • 提供者:weixin_38628990