人工智能/模仿学习算法岗位

热招

社会招聘&校园招聘 | 研发类 | 2025/09/09

职位描述:

1.算法研发:设计面向高维自由度仿生机器人(双足/四足)的深度强化学习算法框架,突破复杂地形运动、动态平衡、多任务泛化等关键技术;

2.模型优化:开发基于Transformer、Diffusion Model等架构的DRL算法,解决长视域规划(Long-horizon Planning)、稀疏奖励问题;

3.仿真到真实迁移:基于NVIDIA Isaac Sim/Mujoco搭建高保真仿真环境,主导算法的Sim2Real性能调优与机器人硬件(如Unitree Go2/B1)实测验证;

4.技术闭环:推进算法在实时控制系统的嵌入式部署(FPGA/边缘计算平台),确保毫秒级推理延迟与工业级鲁棒性;

5.技术辐射:参与产学研合作项目(如Humanoid机器人联合研发),发表顶会论文或形成发明专利壁垒。


职位要求:

1.核心能力(硬门槛): 硕士及以上学历,机器人学/控制理论/计算机科学方向,有机器人DRL算法开发经验优先;

2.深入理解机器人动力学建模(Lagrangian力学、接触动力学),有欠驱动系统(Underactuated Systems)控制经验优先;

3.DRL算法实战能力:熟练应用PPO、SAC、Soft Q-Learning等算法框架,掌握基于Reward Shaping、Curriculum Learning的工程调参技巧;

4.全链路开发能力:代码层精通Python/C++,熟练使用PyTorch/TensorRT进行模型部署,ROS2/ROS-Industrial实战经验;

5.仿真工具链掌控:在Isaac Sim/Mujoco中实现过复杂机器人系统的训练Pipeline构建与评估。

差异化竞争力(加分项): 发表过CoRL/IROS/RSS等机器人学习顶会论文,或主导过DRL开源项目(如CleanRL、RL Baselines3 Zoo); 有实际仿生机器人运动控制算法落地经验(波士顿动力/宇树/Tesla Bot等同类产品逆向调试经验尤佳); 掌握符号控制(Symbolic Control)与DRL融合技术,提升算法可解释


申请职位 您正在申请人工智能/模仿学习算法岗位,请完善下方信息,以便于HR认识您

简历上传

大小不超过5 MB,支持pdf,doc,docx,xls,xlsx,prd

个人简历.Docx

若文件太大请发送至邮箱:hr1@droidup.com,并在上方备注