页面停留时长的处理

埋点日志中对于页面停留时长的处理。

发布于 统计学

用户行为分析平台

一般而言,数据分析依赖于专业的BI人员先进行报表产出,运营再依据产出的报表进行分析,对于长期稳定的业务,报表总会慢慢覆盖尽可能多的维度,但是依然会存在多种组合维度指标的追加。如果在业务经常变化的情况下,报表覆盖的维度就没法做到及时有效,报表产出周期动辄几天,且数据口径方面会存在运营和BI人员之间的理解误差,数据准确性依赖于报表产出人员的水平,这样会严重影响数据驱动的时效性和顺畅性。并且该种方案不利于培养运营人员的数据意识,试问,如果一个简单的数据分布查看都要提需求等排期,那么谁还愿意到处拿数据说话呢? 数据产品的价值就在于此,降低数据的使用门槛,让数据能更加方便、快捷、准确的为业务人员使用。

发布于 数据产品

数据分析模型

在数据分析的技能方面,优秀的数据产品已经将常用的数据分析思路抽象为了几种分析模式,结合日常工作种的内容,这里分别写下我对这几种分析模式的想法与实践。 数据分析的器术道,这里是术。 在数据分析的思路方面,业界领先的数据产品已经将常用的数据分析思路抽象为了几种分析模式,结合日常工作种的内容,这里分别写下我对这几种分析模式的看法与实践。 常用分析思路:事件、留存、漏斗、分布、归因、用户分群,在日常工作中的大部分分析内容无非是以上几种分析思路的组合。

发布于 数据驱动

numpy使用

python数据分析三大模块,pandas、numpy、matplotlib,这里是numpy。

发布于 python

utm参数追踪

以前在追踪用户来源的时候,只是简单的在链接上添加source=xx这个参数,全靠这一个参数来标识来源,虽然当时也了解到了utm参数,但是由于不懂其含义且当时场景有限,觉得source参数就足够了,直到最近,才真正了解了这套标识框架的含义,瞬间觉得这套标识框架太好用了,这里把知乎上GrowingIO的文章记录下。

发布于 数据驱动

Event-User模型

数据驱动四个步骤,数据采集、数据建模、数据分析、指标体系,这里对应的是数据建模。目前数据开发中最常用的数据建模其实就是维度建模,本文中所参考的神策分析的数据建模也不例外,其架构就是简化了的维度建模,其中event表存储的是用户的一个个行为,是一张事实表,user表和item表是维度表,存储的是事实表中user对象和item对象的扩展信息,在进行分析时通过join进行关联查询分析。

发布于 数据驱动

数据驱动读书笔记

神策数据创始人桑文锋的《数据驱动:从方法到实践》读书笔记,每读一个章节,都能有所收获,特别是作者还穿插了大量的案例,结合案例,相信你会对书中所讲内容有更加深入的思考。如果你工作中恰好有着类似疑问、遇到类似问题,那么,这本书能够带来的,就不仅仅是收获,还有实实在在的问题解决方案。强烈推荐!!!

发布于 数据驱动

再谈埋点

埋点是数据的来源,埋点数据是分析的原材料,无论从哪方面来看,确保埋点的准确性合理性都至关重要。

发布于 数据驱动

matplotlib可视化基础

matplotlib制作可视化图表是python数据分析中的一个非常重要的模块,这个模块我之前一直没怎么使用过,这里重新练习下matplotlib模块的使用,数据源来自天池比赛中的二手车交易价格预测数据。

发布于 python

数据分析报告怎么写?

最近太注重于工程实现,忽略了作为一个分析师最重要的职责:分析业务,so,在此重新整理下分析报告的写作逻辑,开始深入参与业务,分析业务。

发布于 数据驱动