比赛链接 最终11名/110。 目的:根据用户安装手机app,以及使用手机的时间信息来预测用户的性别、年龄(分为0-10个区间)。
主要有设备数据、APP数据、机型数据、应用时间数据,处理有
(1)把用户使用App的时间戳信息转化为,开始/结束时间对应的hour;并对用户所有使用APP时间时长进行存储为稀疏矩阵(量大);
(2)统计每个用于使用时长前5的APP;
(3)由于用户使用APP数目较多,使用LDA进行降维.
lightgbm好处:
(1)能处理类别信息;
(2)能高效处理稀疏矩阵(bundle来捆绑互斥特征);
(3)leaf-wise growth 策略,只选用所有叶节点增益最大的进行分裂;
(4)数据并行、特征并行。
尝试:深度学习DNN网络
使用贝叶斯公式,先进行预测识别在预测年龄。