玩命加载中...
# SofaSofa数据竞赛标杆模型
4个小节,预计用时**60分钟**。
这个教程里包含两个竞赛的标杆模型。这些模型都是基于python的sklearn模块。
对于不熟悉sklearn的朋友们,这个教程将是一个非常基础的入门。
[**公共自行车使用量预测**](http://sofasofa.io/competition.php?id=1)
[**交通事故理赔审核**](http://sofasofa.io/competition.php?id=2)
[**机器读中文:根据名字判断性别**](http://sofasofa.io/competition.php?id=3)
[**问答网站问题、回答数量预测**](http://sofasofa.io/competition.php?id=4)
原创者:SofaSofa TeamM
|
编辑校对:SofaSofa TeamC
|
谢绝转载,违者侵权。
----
### 1. 公共自行车使用量预测
[背景介绍以及数据下载](http://sofasofa.io/competition.php?id=1)
[标杆模型](http://sofasofa.io/benchmarks.php?id=1)
- [简单线性回归模型](http://sofasofa.io/benchmarks.php?id=1#LR)
- [决策树回归模型](http://sofasofa.io/benchmarks.php?id=1#DT)
- [xgboost回归模型](http://sofasofa.io/benchmarks.php?id=1#XGB)
### 2. 交通事故理赔审核
[背景介绍以及数据下载](http://sofasofa.io/competition.php?id=2)
[标杆模型](http://sofasofa.io/benchmarks.php?id=2)
- [LASSO逻辑回归模型](http://sofasofa.io/benchmarks.php?id=2#LR)
- [随机森林模型](http://sofasofa.io/benchmarks.php?id=2#RF)
### 3. 机器读中文:根据名字判断性别
[背景介绍以及数据下载](http://sofasofa.io/competition.php?id=3)
[标杆模型](http://sofasofa.io/benchmarks.php?id=3)
- [高频单字划分法](http://sofasofa.io/benchmarks.php?id=3#TOP)
- [朴素贝叶斯](http://sofasofa.io/tutorials/naive_bayes_classifier/)
- [基于TF的GBDT模型](http://sofasofa.io/benchmarks.php?id=3#TF)
### 4. 问答网站问题、回答数量预测
[背景介绍以及数据下载](http://sofasofa.io/competition.php?id=4)
[标杆模型](http://sofasofa.io/benchmarks.php?id=4)
- [一元线性回归模型](http://sofasofa.io/benchmarks.php?id=4#LR)
- [星期交叉项回归模型](http://sofasofa.io/benchmarks.php?id=4#DT)
- [线性回归k近邻混合模型](http://sofasofa.io/benchmarks.php?id=4#TOP)