(+86) 189-xxxx-xxxx |
[email protected] |
深圳市
GitHub |
LinkedIn
2021.06 - 至今
核心贡献:
2018.09 - 2021.05
核心贡献:
Python/Scala/XGBoost/Spark/Flink/Graph Neural Networks
2022.03 - 2023.01
业务挑战:传统风控模型覆盖不全,坏账率持续攀升
解决方案:
PyTorch/TensorRT/Docker/Kubernetes/Medical Image Processing
2021.08 - 2022.09
业务挑战:医疗影像诊断效率低,三甲医院平均阅片时间>20分钟
解决方案:
Prophet/LSTM/Transformer/AWS SageMaker/Airflow
2020.03 - 2021.02
业务挑战:零售商品预测准确率仅65%,库存周转效率低下
解决方案:
南京大学 | 计算机科学与技术 | 硕士
2015.09 - 2018.06 | GPA 3.7/4.0
东南大学 | 数学与应用数学 | 学士
2011.09 - 2015.06 | GPA 3.6/4.0
算法建模
▶ 精通:XGBoost/LightGBM, CNN/Transformer, GNN, 集成学习
▶ 熟练:概率图模型, 时间序列分析, 异常检测, 强化学习
工程架构
▶ 大数据:Spark(调优专家), Flink, Kafka, Hive
▶ 云平台:AWS(SageMaker, EMR), 阿里云(MaxCompute, PAI)
▶ MLOps:MLflow, Kubeflow, Airflow, Docker/K8s
数据工程
▶ 特征工程:Feature Store设计, 自动化特征生成
▶ 模型部署:TensorFlow Serving, ONNX, 模型蒸馏优化
▶ 可视化:Tableau, Streamlit, Plotly
专利技术
▶ 多模态数据融合分析系统(专利号:ZL20201012345.6)
▶ 实时特征计算引擎架构(专利号:ZL20211098765.4)
竞赛荣誉
▶ Kaggle:贷款风险预测金牌(Top 0.8%)、住房估价大赛银牌(Top 1.2%)
▶ 天池:医疗AI诊断竞赛全国亚军、电商销量预测季军
技术认证
▶ AWS机器学习专家认证 | Google云数据工程师 | TensorFlow开发者认证
五年深耕商业智能领域的数据挖掘专家,专注解决高复杂度业务场景中的数据挑战。核心优势:
- 全链路能力:从数据探索→算法研发→系统部署的全流程落地经验
- 工程化思维:注重方案可扩展性,主导构建3个日均亿级处理量的数据系统
- 业务敏感度:善于将业务需求转化为技术方案,累计创造商业价值超¥6000万
- 技术创新:持有2项专利技术,8次获得公司级技术突破奖