about the company.
500强研究院
about the team.
成熟的AI团队
responsibilities:
- 领导深度强化学习算法的设计和实现机器人的操作、运动或全身运动
- 构建可扩展的管道,用于模拟到真实的传输,域适应
- 实地部署以安全为基础的政策,包括安全评估;系统集成和故障恢复
- 推动研究和开发向一般化、样本高效的方向发展以及动态环境中健壮的RL策略。
skills and experience required.
- 机器人,机器学习,计算机科学或相关专业博士学位或具有同等的基于强化学习的机器人研究/工程经验控制。
- 开发和部署RL的落地经验,操纵或腿部运动。
- 熟练的Python、c++编程和调试技能,并有相关工作经验大规模的强化学习训练。
- 领导端到端基于rl的机器人项目,从模型设计到现实世界的部署
- 丰富的实践经验,将RL政策从模拟转移到物理机器人
- 有动态腿式机器人运动经验(例如:两足/四足动物)和/或使用多自由度手臂或手的灵巧操作
- 通过领域适应、政策来弥合模拟与现实之间的差距转移,或者现实世界的微调。
- 深刻理解强化学习理论和连续性控制算法。