01 JAN

怎么用数据说话?

01

关注我的朋友们应该都是互联网行业的,互联网行业讲究流量玩法。

别的不谈,流量这个东西以数据为支撑,也就是说,抛开数据讲流量抓取的都是耍流氓。

而怎么用数据来打造一套系统的流量抓取体系呢?

建模(建立一套数据分析模型)

刚来我们组的时候,大家忙着做测评做活动,我负责做销售报表。

每天统计报表是件很麻烦的事儿, 得花一上午的时间。销售数据这些倒还好,去平台后台把相关报表下载下来就好,但是有个叫做秒杀和coupon(折扣)的东西,每天都是个性化设置,需要手动整理。

我老老实实统计了两天后,终于忍不住了。

我问站点负责人,你们……做这个……是凭感觉……还是?

站点负责人一脸不可置信的嘲笑了我,怎么可能是凭感觉!

然后我问,那……你们建模吗?

站点负责人摆出一副难以描述的表情看我,什么建模?

当时我两的表情估计都如下图。

不建模,就单纯睁大眼睛看数据,到底是凭借什么算出来的折扣该给多少呢?

凭经验=凭感觉?

在我看来这个等号成立的完全没有毛病。

组长一脸神秘的冲我一笑,怎么样,我们路子野吧?

太野了好吗!长治数据。

02

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。

探索性数据分析是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国著名统计学家约翰·图基(John Tukey)命名。

定性数据分析又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。

沃尔玛经典营销案例:啤酒与尿布

“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店, 直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是“啤酒与尿布” 故事的由来。

当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者Agrawal提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提 出了商品关联关系的计算方法——Aprior算法。沃尔玛从上个世纪 90 年代尝试将 Aprior 算 法引入到 POS机数据分析中,并获得了成功,于是产生了“啤酒与尿布”的故事。

Suncorp-Metway使用数据分析实现智慧营销

Suncorp-Metway是澳大利亚一家提供普通保险、银行业、寿险和理财服务的多元化金融服务集团, 旗下拥有5个业务部门,管理着14类商品,由公司及共享服务部门提供支持,其在澳大利亚和新西兰的运营业务与900多万名客户有合作关系。

该公司过去十年间的合并与收购,使客户群增长了200%,这极大增加了客户群数据管理的复杂性,如果解决不好,必将对公司利润产生负面影响.为此,IBM公司为其提供了一套解决方案,组件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service谀IBM Unica。

采用该方案后,Suncorp-Metway公司至少在以下三项业务方面取得显著成效:

1、显著增加了市场份额,但没有增加营销开支;

2、每年大约能够节省1000万美元的集成与相关成本;

3、避免向同一户家庭重复邮寄相同信函并且消除冗余系统,从而同时降低直接邮寄与运营成本。

由此可见,Suncorp-Metway公司通过该方案将此前多个孤立来源的数据集成起来,实现智慧营销,对控制成本,增加利润起到非常积极的作用。

数据分析帮助辛辛那提动物园提高客户满意度

辛辛那提动植物园成立于1873年,是世界上著名的动植物园之一,以其物种保护和保存以及高成活率繁殖饲养计划享有极高声誉。它占地面积71英亩,园内有500种动物和3000多种植物,是国内游客人数最多的动植物园之一,曾荣获Zagat十佳动物园,并被《父母》(Parent)杂志评为最受儿童喜欢的动物园,每年接待游客130多万人。

辛辛那提动植物园是一个非营利性组织,是俄亥州同时也是美国国内享受公共补贴最低的动植物园,除去政府补贴,2600万美元年度预算中,自筹资金部分达到三分之二以上。为此,需要不断地寻求增加收入。而要做到这一点,最好办法是为工作人员和游客提供更好的服务,提高游览率。从而实现动植物园与客户和纳税人的双赢。

借助于该方案强大的收集和处理能力、互联能力、分析能力以及随之带来的洞察力,在部署后,企业实现了以下各方面的受益:

·帮助动植物园了解每个客户浏览、使用和消费模式,根据时间和地理分布情况采取相应的措施改善游客体验,同时实现营业收入最大化。

·根据消费和游览行为对动植物园游客进行细分,针对每一类细分游客开展营销和促销活动,显著提高忠诚度和客户保有量。.

·识别消费支出低的游客,针对他们发送具有战略性的直寄广告,同时通过具有创意性的营销和激励计划奖励忠诚客户。

· 360度全方位了解客户行为,优化营销决策,实施解决方案后头一年节省40,000多美元营销成本,同时强化了可测量的结果。

·采用地理分析显示大量未实现预期结果的促销和折扣计划,重新部署资源支持产出率更高的业务活动,动植物园每年节省100,000多美元。

·通过强化营销提高整体游览率,2011年至少新增50,000人次“游览”。

·提供洞察结果强化运营管理。例如,即将关门前冰激淋销售出现高潮,动植物园决定延长冰激淋摊位营业时间,直到关门为止。这一措施夏季每天可增加2,000美元收入。

·与上年相比,餐饮销售增加30.7%,零售销售增加5.9%。

·动植物园高层管理团队可以制定更好的决策,不需要 IT 介入或提供支持。

·将分析引入会议室,利用直观工具帮助业务人员掌握数据。

03

当年我还在做wish的时候,公司的策略是做铺货,每个店几千几万个产品。wish有一个好处就是,玩法简单粗暴,花钱买流量(跟SEM差不多,关键词竞价),直接能看到销量的起伏变化。

我不清楚别人是怎么做的,我一开始用的是简单粗暴的漏斗筛选法

我把上的listing都做活动(当时做活动可以加速产品通过审核),别人最多15分钟就停了,我烧30分钟。第二天检查产品出单情况,把出单的产品再单独提出来做活动。这次的活动优化关键词选词,然后再烧钱,再做,以此循环往复,寻找最优解。

我去之前,整个wish部门每周花的最多的也就300美金。我去之后,直接把上限冲到了2000美金,甚至有几天导致账户负债而无活动可做(wish账户半月回款1次)。

重点是:花费成交比一开始还极其的高,最高的时候好像在70%——这意味着有几天都是亏本买卖,给平台做嫁衣。

怎么样,刺不刺激,太刺激了好吗!

反正我有保底提成,怕啥,花啊,新账号早期不花钱,后期怎么做?

只要胆子大,天天有钱花,花钱的感觉太舒服了好吗!

由于我大幅度拉高了部门的花费成交比,后来有一天,经理默默的走到我身边碰碰我的肩膀,lissa,那啥啊,你你你省着点花。

我们经理当时的表情如下图。

后来我优化了选品模型,当年的记录还在,如下图所示:

我只要每天把数据拉出来,按照模型走一遍,之后不断花钱试错,不断总结优化就行。

我每天实际工作时间大概在3小时左右,其他时间躲起来看书、练口语,或者在群里和同事吹牛逼。

然后2个月达到销售要求,提前转正。

现在我不知道wish还能不能这么干,不过我觉得你要借平台赚钱,就顺应平台的发展规律,别做铺货做跟卖把自己变成了韭菜,还不自知。

04

回到今天的话题:长治数据建模型。

流量场如火如荼,你既然把人家当做一个点来对待,就用对待数据的专业操守对待人家。

从选品、竞争对手监测到CPC(点击付费)广告、cupon,建立一套模型,根据市场实际变动需求来定价格、定广告费用。

就拿文章开头说的例子:你的活动开多大,取决于哪些因素,把它们全部找出来,然后通过控制变量,设定标准,不断测试,找到最优解。

以“市场波动下给产品加多少折扣能带来最大利润”为例,你的产品价格卖49.99,你检测到平台上有5个和你产品处于同一水平的竞品,他们的价格分别是39.99、49.99、46.99、59.99、42.99。

首先控制变量为折扣额度,把对方折扣的价格、折扣后折算下来的价格分别统计出来,定一个区间,针对不同的区间设定不同的解决方案。比如如果区间落在30-35,则为产品增加15美金折扣;如果区间落在35-40,为产品增加10美金折扣。

之后就是进行测试,监测折扣是否会影响销量、影响的幅度是多少,怎样的折扣范围最合适抢占市场份额。计算出来的数据可以作为之后制定折扣范围的依据,以达到最优解(利润最高)的目的。

我这里只是简单举个例子,实际情况会比这复杂的多,那么你相对应建立的模型颗粒度也应该小得多(更细致,更精确)。

当然,这些模型不一定能成功,具体的结果还是需要依据市场反馈来。

遇到做的不好的模型,舍弃或者优化。不成功的模型也是一种进步,毕竟排除了一种可能性,离结果更近了一步。

当你经验不足以支撑你做出正确的判断的时候,那就拿数据说话,数据是不会骗人的。

什么叫经验充足?你在一个行业做了8-10年,有了足够的经验底蕴,看一个东西就大概知道他会不会火,是不是爆品的时候,你就经验充足了。

当然,根据我的估计,这样的人暂时不会看我的文章。

05

总结一下,如果你从事互联网,涉及流量方面的内容,一定要记住,用数据说话。

用数据说话最好的方式就是:

找出相关因素,控制变量,建立模型,投放检测,优化,重复。

甭管他对不对,你把脑子里的东西,用数学的方式展现出来的时候,你就能够开始有掌控感了。

做个操盘手,不要被掌控。