职位空缺 - RL leader / 北京 | Randstad

和我们聊聊

CN
EN

职位概览

北京, Beijing
CNY3,000,000 - CNY4,000,000 每年
正式工

主要职能
信息技术

职位概述

about the company.

500强研究院

about the team.

成熟的AI团队

responsibilities:

领导深度强化学习算法的设计和实现机器人的操作、运动或全身运动
构建可扩展的管道，用于模拟到真实的传输，域适应
实地部署以安全为基础的政策，包括安全评估；系统集成和故障恢复
推动研究和开发向一般化、样本高效的方向发展以及动态环境中健壮的RL策略。

skills and experience required.

机器人，机器学习，计算机科学或相关专业博士学位或具有同等的基于强化学习的机器人研究/工程经验控制。
开发和部署RL的落地经验，操纵或腿部运动。
熟练的Python、c++编程和调试技能，并有相关工作经验大规模的强化学习训练。
领导端到端基于rl的机器人项目，从模型设计到现实世界的部署
丰富的实践经验，将RL政策从模拟转移到物理机器人
有动态腿式机器人运动经验(例如：两足/四足动物)和/或使用多自由度手臂或手的灵巧操作
通过领域适应、政策来弥合模拟与现实之间的差距转移，或者现实世界的微调。
深刻理解强化学习理论和连续性控制算法。

...

about the company.

500强研究院

about the team.

成熟的AI团队

responsibilities:

领导深度强化学习算法的设计和实现机器人的操作、运动或全身运动
构建可扩展的管道，用于模拟到真实的传输，域适应
实地部署以安全为基础的政策，包括安全评估；系统集成和故障恢复
推动研究和开发向一般化、样本高效的方向发展以及动态环境中健壮的RL策略。

skills and experience required.

机器人，机器学习，计算机科学或相关专业博士学位或具有同等的基于强化学习的机器人研究/工程经验控制。
开发和部署RL的落地经验，操纵或腿部运动。
熟练的Python、c++编程和调试技能，并有相关工作经验大规模的强化学习训练。
领导端到端基于rl的机器人项目，从模型设计到现实世界的部署
丰富的实践经验，将RL政策从模拟转移到物理机器人
有动态腿式机器人运动经验(例如：两足/四足动物)和/或使用多自由度手臂或手的灵巧操作
通过领域适应、政策来弥合模拟与现实之间的差距转移，或者现实世界的微调。
深刻理解强化学习理论和连续性控制算法。

分享职位

梁S

梁靖 Stephanie Liang

stephanie.liang@cn.randstad.com

VLA/RL Head - Embodied AI
- 北京, Beijing
- 正式工
- CNY1,200,000 - CNY3,000,000 每年
岗位职责：负责具身智能领域VLA（视觉语言）或RL（强化学习）方向的研发工作。带领约5-10人团队，进行技术攻关与项目管理。推动具身智能技术在实际产品中的应用和部署。关注前沿技术，具备研究创新能力。任职要求：英语流利，可作为工作语言。优秀的学历背景。具备团队管理经验。在人工智能的行走/操纵领域有研究创新力，具备将技术应用于实际产品或部署到实际领域的经验，或具有相关潜力。
发布于 13 六月 2025
岗位职责：负责具身智能领域VLA（视觉语言）或RL（强化学习）方向的研发工作。带领约5-10人团队，进行技术攻关与项目管理。推动具身智能技术在实际产品中的应用和部署。关注前沿技术，具备研究创新能力。任职要求：英语流利，可作为工作语言。优秀的学历背景。具备团队管理经验。在人工智能的行走/操纵领域有研究创新力，具备将技术应用于实际产品或部署到实际领域的经验，或具有相关潜力。
显示职位详情
VLA leader
- 北京, Beijing
- 正式工
- CNY3,000,000 - CNY4,000,000 每年
about the company.500强研究院 about the team.成熟的AI团队 responsibilities:主导大规模VLA或RFM的端到端开发搭建架构可扩展的多模态管道，集成视觉、语言和动作变成机器人的行为。VLA模型在不同机器人配置中的实际部署及落地分析性能瓶颈并进行迭代改进 skills and experience required.对深度学习有深刻的理解，尤其是基于转换器的深度学习体系结构有LLM/VLM集成经验，动作解码经验，有远见任务计划熟练掌握机器人系统设计，包括感知管道；操作接口和硬件约束……熟练使用Python， ML库，如PyTorch丰富的ROS2，推理优化经验□要求（超大型）计算机、机器人、机器学习或相关领域博士学位并在该领域具有同等的研发经验具有开发和培训多模式或嵌入式AI的经验模型。英语流利，并有管理经验
发布于 9 六月 2025
about the company.500强研究院 about the team.成熟的AI团队 responsibilities:主导大规模VLA或RFM的端到端开发搭建架构可扩展的多模态管道，集成视觉、语言和动作变成机器人的行为。VLA模型在不同机器人配置中的实际部署及落地分析性能瓶颈并进行迭代改进 skills and experience required.对深度学习有深刻的理解，尤其是基于转换器的深度学习体系结构有LLM/VLM集成经验，动作解码经验，有远见任务计划熟练掌握机器人系统设计，包括感知管道；操作接口和硬件约束……熟练使用Python， ML库，如PyTorch丰富的ROS2，推理优化经验□要求（超大型）计算机、机器人、机器学习或相关领域博士学位并在该领域具有同等的研发经验具有开发和培训多模式或嵌入式AI的经验模型。英语流利，并有管理经验
显示职位详情
LLM leader
- 北京, Beijing
- 正式工
- CNY3,000,000 - CNY4,000,000 每年
about the company.500强研究院 about the team.成熟的AI团队 responsibilities:负责集团内部的端侧产品研究以及落地应用从事自然语言处理，大语言模型，多模态大模型相关领域算法研究与项目成员进行合作 skills and experience required.1. 具备硬件（NPU、内存等）及SIMD级/GEMM操作等背景知识，并能通过AutoML等进行模型搜索的人 - 对硬件加速器（NPU、GPU等）和内存管理技术有深入理解，熟练掌握SIMD（单指令多数据）运算和通用矩阵乘法（GEMM）操作的优化。 - 能够使用自动化机器学习（AutoML）工具和平台进行高效的模型搜索和优化。2. 全面了解模型训练的know-how，从头到尾都能进行训练，并熟悉各种后训练方法论 - 能够从头到尾(end-to-end)地训练深度学习模型，对数据预处理、模型架构设计、损失函数选择、优化器配置等整个过程具有专业知识。 - 对后训练(post-trainin
发布于 6 六月 2025
about the company.500强研究院 about the team.成熟的AI团队 responsibilities:负责集团内部的端侧产品研究以及落地应用从事自然语言处理，大语言模型，多模态大模型相关领域算法研究与项目成员进行合作 skills and experience required.1. 具备硬件（NPU、内存等）及SIMD级/GEMM操作等背景知识，并能通过AutoML等进行模型搜索的人 - 对硬件加速器（NPU、GPU等）和内存管理技术有深入理解，熟练掌握SIMD（单指令多数据）运算和通用矩阵乘法（GEMM）操作的优化。 - 能够使用自动化机器学习（AutoML）工具和平台进行高效的模型搜索和优化。2. 全面了解模型训练的know-how，从头到尾都能进行训练，并熟悉各种后训练方法论 - 能够从头到尾(end-to-end)地训练深度学习模型，对数据预处理、模型架构设计、损失函数选择、优化器配置等整个过程具有专业知识。 - 对后训练(post-trainin
显示职位详情

感谢您订阅岗位提醒

You need to enable JavaScript to run this app.