天池-工业蒸汽量预测
最近买了阿里云天池大赛赛题解析这本书,跟着这本书开始深入学习机器学习,这是第一个题目:工业蒸汽量预测。
比赛地址:https://tianchi.aliyun.com/competition/entrance/231693/introduction
一、赛题理解
(一)数据概览
1.数据说明
2.评估指标
MSE
(二)塞题模型
这是一道典型的预测题,属于机器学习中的监督学习,常用的预测模型主要有回归预测模型和分类预测模型。
1.回归预测模型
回归预测模型的预测结果是一个连续值域上的任意值,回归可以具有实值或离散的输入变量,通常把多个输入变量的回归问题成为多元回归问题,输入变量按时间排序的回归问题称为时间序列预测问题。
2.分类预测模型
典型的:泰坦尼克号,预测的结果分为生或者死。
主要分为二分类及多分类。
本赛题中预测值为连续性数值变量,故为回归预测求解。
回归预测模型使用的算法:
1.线性回归
2.岭回归
3.LASSO回归
4.决策树回归
5.梯度提升树回归
二、数据探索
三、特征工程
四、模型训练
五、模型验证
六、特征优化
七、模型融合
八、业务应用及平台化开发
主要解决业务问题:我们通过历史数据对下单/未下单的用户的行为进行建模,利用逻辑回归模型预测用户下单意愿,并提高用户下单率,如下图:
文章地址:https://mp.weixin.qq.com/s/cdTNRFFJcKrpWgOtuFzYFw
平台化方案:
前端:vue
后端:阿里云函数计算
主要界面:上传文件格式
userid | v1变量 | … | vn变量 |
---|---|---|---|
输出文件格式:
userid | v1变量 | … | vn变量 | 是否下单 |
---|---|---|---|---|