强化学习吧
关注: 306 贴子: 552

  • 目录:
  • 学校话题
  • 6
    深度强化学习:DQN、PPO、DDPG、A3C、TD3、SAC、Rainbow、MADDPG、模仿学习,提供创新点,实验对比,代文章、润色 代码不收敛 菲涅尔模型 python深度学习算法模型定制 个人在做 中介勿扰
  • 0
    各位大佬,请问有没有如下电子版的强化学习入门资料,个人觉得这篇pdf讲的贼好,拜托各位佬了!
  • 5
    强化学习指导,强化学习代码。博士在读,研究方向:强化学习(包括深度强化学习和多智能体强化学习),可接项目指导,调试环境等等相关技术服务#强化学习#
  • 1
    强化学习在随机结束之后就一直只选择一个动作值了是为什么?是因为根本就没学起来还是因为环境太简单了?并且在更改神经网络初始化的随机种子之后也会对选择的动作产生影响是为什么
  • 8
    强化学习 深度学习辅导 本人上交本,top2硕,CV方向研二在读,主要研究兴趣为图像质量评估/视频理解/动作质量评估/动作识别等。 提供深度学习指导,计算机视觉指导。cv各种算法,算法性能提升,算法优化,模型修改,调参,环境配置,代码解读,代码分析等等。 有需要找我吧
    websock 7-25
  • 6
    本人研究方向为车间调度,目前正在做深度强化学习,算法是近端策略优化,网络是Lstm长短期记忆网络,代码逻辑全部都是手动实现的,目前问题就是随着训练的增加,损失函数没有减小反而增大了,权重会向着负无穷大更新,怀疑是梯度爆炸,可能反向传播也没有写对。有没有懂这块的老哥解答一下,一个人学真的很困难,导师一点都不懂这块。给大佬跪了0.0
    泠泷心 7-16
  • 5
    支持强化学习方向算法辅导、指导、实战,MDP模型构建,包括单智能算法DQN,DDPG,SAC,PPO等,多智能体算法maddpg,qmix等 强化学习算法辅导包含基础算法A3C,BC,SAC,PPO,DQN和DDPG等,及多智能体MADDPG,MAPPO等变体和改进。Deep Reinforcement Learning。Multi-Agent,Singel Agent。 专注留学生辅导,诚信第一有问题直接留言非诚勿扰!#强化学习##算法##模型构建#
  • 14
    深度强化学习,多智能体,算法代码指导,计算机视觉 路径规划 检测,分割,视频处理,估计,人脸,目标跟踪,图像&视频检索/视频理解,医学影像,GAN/生成式/对抗式,图像生成/图像合成,神经网络 结构设计,数据处理,模型训练/泛化,图像特征提取与匹配,视觉表征学习,模型评估,多模态学习,视觉预测 目标检测,行人重识别,车辆重识别,超分重建,图像分割,图像分类等等。 算法性能提升,算法优化,模型修改,机器学习,数学建
  • 1
    如图,使用的是DQN算法,具体解决的是一个组合优化问题。
    学习者 7-10
  • 1
    各位大佬好,我是毕业可能要用到强化学习算法的萌新 我用matlab的强化学习工具箱,生成了Dqn智能体,自己在里面写了环境,用来求解一个分配问题。 我将环境中的所有信息均作为状态输入 ,但发现在某些情况下,整个模型的泛化性仍然不好 如果采用多个不同环境进行训练,感觉后续训练结果会覆盖前面的训练结果,使得智能体无法较好的处理原有工况 这种情况下,原因是训练方法不对还是?
    誓翔 7-7
  • 0
    python深度学习,python代码定制, 代码改进跑通 深度学习,创新点 创新思路 代码改进跑通 深度学习 Python代跑时间序列预测 分析 代码编写 python编程 深度学习算法 自然语言处理 神经网络跑通指导 图神经网络gnn创新 做gcn 复现代码 交通流量预测,网络流量预测深度学习,机器学习指导,代码讲解、复现,图像分类,模型可解释,图sj网络等相关项目 gcn,gat,kgcn,kgat图网络代码,图卷积sj网络代码,创新,答疑,推荐算法,分类,关系预测,图谱补全
  • 0
    纯小白,想用强化学习训练一个仿真模型,现在用modelica建好了模型,有没有办法把他交给强化学习进行训练。应该怎么做?谢谢大佬
  • 1
    小程序,安卓,系统开发,机器学习,深度学习,知识图谱,大数据,强化学习,等等都可(计算机除硬件都可)985本硕,个人#计算机毕设#[图片]
  • 0
    留学生辅导答疑 人工智能 计算机视觉机器学习 深度学习 计算机 英文计算机R语言 Java C语言 C++ Python 编程大数据挖掘 计算机视觉 数据科学Mpi等二分类、多分类、检测、识别、数值预测、数据处理、数据分析、算法、数据结构 回归、分类、预测、NLP自然语言处理、文本分析、情感分析、图像处理、可视化数据结构,操作系统,计算机组成原理,深度强化学习,统计数据分析,目标检测,实例分割等#人工智能#
  • 0
    有没有大佬会citylearn的
    阿菊198 5-14
  • 1
    有没有了解ros,gazebo,td3的大佬,想请教一下如何改进td3,可有偿
  • 0
    请问各位大佬,通常强化学习模型的动作空间都是固定的,比如上下左右等动作。但是我现在要做一个复杂网络的路径决策场景,随机网络上的某一个点,要去另外几个指定的节点之一卸货。但是要考虑卸货点的收益,以及路径各方面因素。也就是说该模型的动作是路径的决策。但是这个动作空间会随着我随便点的位置变化而变化。这类动作空间可变的问题,各位大佬有没有什么论文可以提供参考的。
    ZY芾 3-7
  • 0
    想问下最新研究方向进展是什么,还有想问有没有强化学习的交流群呐,自己摸索太难了
  • 0
    兄弟们,强化学习一直训练不了有能调的吗?有吗,急急急急急急急急急急急,有偿有偿有偿
    手塚哈 2-26
  • 0
    AI最火Agent实战(打造你代理)
  • 3
    鼠鼠最近在搞第一偏论文了,但鼠鼠的老师看不上DQN了,故来咨询一下8u,目前有什么比较前沿的强化学习方法
  • 1
    求教怎么用TensorFlow架构实现 SAC+ ERE(Emphasizing Recent Experience) + PER(Prioritized Experience Replay) 强化学习,SAC,ERE,PER
  • 2
    求教mujoco怎么导入obj文件啊 或者说,用vhacd把一个大的mesh分解以后,在mujoco里面加载的时候,应该怎么保持为多个convex mesh啊
    wangdx1026 11-5
  • 0
    不是完全小白,之前学过深度学习,跑过论文代码
  • 1
    有做这方面的老哥吗?或者懂强化学习的也可以,交流交流
    Makodo 9-29
  • 5
    吧里有老哥会强化学习和博弈结合吗?希望可以请教一二
    hdhbebyd 9-7
  • 0
    有没有会做ddpg+非平稳风信号的
  • 9
    请问一下,我最近在搞深度强化学习,跑代码需要什么样的电脑配置呢?谢谢
  • 3
    以下是chatgpt给我的答案: 问:在强化学习中,我如何判断什么时候该选择什么样的激活函数呢? 答: 在强化学习中选择激活函数通常是一个试错的过程,它取决于你所面对的具体问题和网络架构。激活函数对于神经网络的性能和收敛速度都有影响,因此选择适当的激活函数很重要。 下面是一些常见的激活函数以及它们适用的情况: Sigmoid函数(逻辑函数):它将输入值映射到0到1的范围内。适用于输出层的二分类问题,因为它可以将输出解释为概率
  • 11
    孩子最近搞毕设,强化学习微店网调度,用的matlab,属于是连环境都没创建下来啊
    檸檬楠 6-4
  • 1
    我创建了一个gym环境,动作空间是多维离散的,例如(2,2,2,2,2,2,2)这样的一个7维空间,但是在选择最大q值对应的动作这一块,我想让他返回的动作也是这种7维数组的动作,但是因为输出层是128,因为是动作空间里包含动作的总数也就是128个,他输出的一直是0-127中的数,有会改的大佬吗,有偿
  • 0
    有没有211学校搞强化学习的老师
  • 4
    小白求助!在学习sutton的《Reinforcement Learning》,需要matlab仿真实现书中所有例子,得到和书上一致的图像与结论等等,但是完全没有用过matlab,无从下手。各位有什么学习建议?
  • 0
    深度强化学习极简入门与Pytorch实战
    md44732 3-21
  • 4
    想问问8U们逆向强化学习的过程可以可视化吗,我如果只是拿他训练奖励函数。
    mathyue 3-10
  • 4
    我给强化学习里的ppo算法和一个改进比较小的ppo算法应用到了一个海洋模型里做了路径规划跟踪,类似于应用创新?上面提到的两个算法也都是已有的想问问sci三区有没有合适的期刊去投的
    Pinkie 11-12
  • 1
    Q-learning能够做信誉值优化吗
    自由天空 10-30

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

会员: 会员

目录: 学校话题