任务背景
随着电商市场竞争加剧,越来越多的商家开始思考如何引入精准流量:我的顾客是谁?有什么的消费偏好?商品定价应该偏向于哪个区间?什么样的促销更能吸引他们?用户画像为网店提供了足够的信息基础,被广泛的接纳和使用。
所谓用户画像,即用户信息标签化,通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据,抽象出一个用户的商业全貌。用户画像能够帮助商家快速定位用户群体及用户需求,进行精准的广告投放,提高转化率及客单价。
2019年的年中大促即将到来,某电子商务企业部门经理为避免决策主观化,安排小周对店铺访客的各项数据进行处理,绘制网店访客的用户画像,为即将到来的促销活动选品、推广、促销及仓储安排提供参考。
任务分析
绘制用户画像基于用户在网店的访问数据。面对杂乱无序的数据,小周决定先从店铺访客的静态信息数据入手。所谓静态信息数据,是指用户相对稳定的信息,包括性别、年龄、地域、职业、婚姻状况等人口属性方面的数据,这类数据主要来自老用户,通过发放会员卡收集信息,进行数据清洗后,统计出年龄、性别、地域等分布情况。
任务操作
加工静态信息数据,统计出年龄、性别、地域等分布情况,用来指导店铺选品、重点推广人群、仓库的存货分配等,其操作步骤及关键节点成果展示如下:
步骤1:数据获取。
学员点击上表,获取小周所在企业的会员信息数据,下载报表后,学员以个人为单位,使用Excel工具打开,打开后的效果如图1所示。

图1 会员信息表部分截图
步骤2:数据清洗。
为提升数据的质量,确保数据的准确性、完整性和一致性,学员需要使用数据清洗方法对数据表进行去重、补缺和纠错等操作。重复数据清洗后的效果如图2所示,空值单元格填充内容“未知”,效果如图3所示。

图2 重复数据清洗

图3 空值清洗
步骤3:用户年龄分布统计及占比计算。
利用countif函数或者筛选工具统计出不同年龄段的用户数,然后利用公式分别计算出各自的占比,结果如图4所示。

图4 用户年龄分布及占比
步骤4:用户性别分类统计及占比计算。
利用countif函数或者合并计算方法对用户按性别进行人数统计,然后利用公式进行占比计算,结果如图5所示。

图5 用户性别占比
步骤5:用户地域分布统计及占比计算。
利用countif函数或者合并计算方法统计出各地区的用户数,然后利用公式分别计算出各自的占比,结果如图6所示。

图6 用户地域分布及占比
步骤6:数据整理。
学员需要在Excel中新建3个新工作表,分别命名为“年龄分布及占比”、“性别占比”和“地域分布及占比”,然后将步骤3、步骤4、步骤5中的结果粘贴过去,并进行表格美化,包括行高列宽、字体、边框、字体颜色、填充颜色等。
步骤7:结果检查及提交
对处理完成的数据结果进行检查,确认无误后提交。
