发布于 

天池-工业蒸汽量预测

最近买了阿里云天池大赛赛题解析这本书,跟着这本书开始深入学习机器学习,这是第一个题目:工业蒸汽量预测。

比赛地址:https://tianchi.aliyun.com/competition/entrance/231693/introduction

一、赛题理解

(一)数据概览

1.数据说明

2.评估指标

MSE

(二)塞题模型

这是一道典型的预测题,属于机器学习中的监督学习,常用的预测模型主要有回归预测模型和分类预测模型。

1.回归预测模型

回归预测模型的预测结果是一个连续值域上的任意值,回归可以具有实值或离散的输入变量,通常把多个输入变量的回归问题成为多元回归问题,输入变量按时间排序的回归问题称为时间序列预测问题

2.分类预测模型

典型的:泰坦尼克号,预测的结果分为生或者死。

主要分为二分类及多分类。

本赛题中预测值为连续性数值变量,故为回归预测求解。

回归预测模型使用的算法:

1.线性回归

2.岭回归

3.LASSO回归

4.决策树回归

5.梯度提升树回归

二、数据探索

三、特征工程

四、模型训练

五、模型验证

六、特征优化

七、模型融合

八、业务应用及平台化开发

主要解决业务问题:我们通过历史数据对下单/未下单的用户的行为进行建模,利用逻辑回归模型预测用户下单意愿,并提高用户下单率,如下图:

文章地址:https://mp.weixin.qq.com/s/cdTNRFFJcKrpWgOtuFzYFw

预测购买率

平台化方案:

前端:vue

后端:阿里云函数计算

主要界面:上传文件格式

useridv1变量vn变量

输出文件格式:

useridv1变量vn变量是否下单