数据平台开发工程师

WeRide.ai
WeRide.ai

Guangzhou, Guangdong, China

Posted on May 1, 2026
该职位来源于猎聘 职位描述 你将加入核心数据平台组,直接支撑订单热区预测、智能运力调度、用户出行分析等关键业务场景。这里有大规模的时空数据挑战——每日处理数十亿级GPS轨迹点、实时预测城市级订单需求分布、毫秒级响应调度系统的数据请求。你的工程成果将直接影响车辆投放效率、用户等待时长和运营成本。 团队技术栈覆盖Flink实时计算、ClickHouse OLAP、Iceberg数据湖、自研时空索引引擎,正在推进流批一体架构升级和湖仓一体化改造。我们寻找对自动驾驶赛道有热情、对数据工程有匠心的工程师,一起用数据驱动出行方式的变革。 岗位职责 1. 自动驾驶数据平台架构

  • 设计并构建车端、路端、云端多源异构数据的统一采集与接入体系,支撑PB级传感器数据、轨迹数据、地图数据的实时处理
  • 搭建自动驾驶专属数据湖/数据仓库,实现原始数据、标注数据、仿真数据的分层治理与高效检索
  • 订单热区预测与运力调度
  • 基于海量历史订单与实时轨迹数据,构建时空预测模型,实现订单需求热区的分钟级/小时级预测
  • 开发运力供需匹配算法的数据底座,支撑智能调度系统的实时决策,提升车辆利用率与响应效率
  • 轨迹大数据挖掘
  • 处理大规模车辆轨迹数据(GPS/北斗/高精定位),构建路网匹配、OD分析、驾驶行为画像等核心数据能力
  • 挖掘用户出行模式与区域流动规律,为站点规划、车辆部署、动态定价提供数据支持
  • 实时计算与风控
  • 构建低延迟的实时数据管道,支撑车辆状态监控、异常检测、安全预警等在线场景
  • 设计数据质量校验与血缘追踪体系,保障自动驾驶关键数据的可靠性与可追溯性
  • 地理空间数据工程
  • 整合GIS技术与大数据栈,处理高精地图、行政区划、POI等空间数据,支撑地理围栏、路径规划等业务
  • 优化空间索引与查询性能,解决海量时空数据的存储与检索效率问题
  • 任职要求 必备技能: - 精通Spark/Flink/Storm等分布式计算框架,具备大规模时空数据处理与性能调优经验 - 熟练掌握Hadoop生态(HDFS/Yarn/Hive/HBase)及Kafka/Pulsar消息队列 - 扎实的Java/Scala/Python编程能力,精通SQL及复杂查询优化 - 熟悉时空数据库(PostGIS/GeoMesa/H3等)或OLAP引擎(ClickHouse/Doris),具备地理空间数据分析经验 - 了解机器学习工程化流程,能与算法团队协作将预测模型(如热区预测)落地为稳定的数据服务

加分项: - 有自动驾驶、网约车、物流、智慧城市等行业的大数据项目经验 - 熟悉订单预测、供需预测、智能调度等出行场景的业务逻辑与算法应用 - 掌握数据湖技术(Iceberg/Hudi)及流批一体架构,具备湖仓一体实践经验 - 了解高精地图数据格式(OpenDRIVE/Apollo等)或仿真数据 pipeline - 有云原生大数据平台(EMR/MaxCompute/Flink on K8s)使用经验