來源:北大青鳥長沙大計教育|發(fā)布時間:2021-04-22 15:10:50
在互聯網下半場、精細化運營時代,很多互聯網公司利用各種方法收集消費者的信息,再運用大數據分析相關技術,分析消費偏好、消費習慣、消費能力、消費頻次,將不同的商品以不同的價格在不同的時間推送給不同的人。具體細分有三類:
1、根據用戶使用的設備不同而差別定價;
2、根據用戶消費時所處的場所不同而差別定價;
3、根據用戶消費頻率的不同而差別定價。
那么我們今天就來看看,我們是如何一步步被大數據殺熟的吧。大數據殺熟關鍵的一步便是用戶畫像。
所謂用戶畫像體系指的是通過用戶相關數據采集,進行數據處理分析,將用戶分成不同的類。在你注冊成為用戶時,系統(tǒng)便知道你是哪一類用戶,可以進行精準的數據營銷。殺熟只是系統(tǒng)根據不同用戶特點展示不同數據的一個體現。
那么用戶畫像體系如何建設呢?首先在產品層給用戶畫上不同的標簽,通過產品設計中的用戶注冊信息校驗,數據收集中的客戶端、服務端日志采集,數據倉庫做數據分析、呈現不同的數據,最后給到業(yè)務層進行應用(比如營銷、數據報表、反欺詐等等),整個用戶畫像體系架構圖可見下圖所示。
在給用戶定義標簽時,我們又可以分為基礎標簽、行為標簽、偏好標簽、預測標簽幾大類。基礎標簽指的是用戶的基礎信息,比如年齡、設備信息、職業(yè)、性別、教育情況;行為標簽指的是用戶的個人行為,比如點贊、瀏覽、轉發(fā)、分享、購買、關注;偏好標簽指的是用戶的個人
定義好標簽規(guī)則后,我們便可以進行數據的采集、處理、分析了。整個架構可以分為三層,即數據采集層、數據處理層、數據服務層。在數據采集層,通過日志和數據庫等方法實時采集數據,通過Kafka消息中間件進行數據傳輸,給到數據分析引擎。數據分析引擎包含實時計算和離線計算,實時計算可采用Flink計算引擎進行,離線計算可采用Hive、Hadoop進行。在計算架構上建議采用Lambda架構,將實時計算和離線計算拆分出來,因為有的數據不一定能通過實時計算挖掘出來。在數據存儲上,可以使用HBase做離線標簽存儲,Redis做實時標簽存儲。
在數據建設體系這塊,我們尤其要關注數據的質量、數據時效性。對于數據質量,我們需要關注是否覆蓋全面、覆蓋準確,通過監(jiān)控體系做對應的驗證-分析-調整可逐步的提高質量;對于數據時效性,除了來自業(yè)務需求的實時數據和非實時數據外,我們也要關注其它因素是否會導致數據采集、數據處理延時;最后,就是避免重復對接,我們應當建立統(tǒng)一的數據體系,讓所有的業(yè)務數據都按照這個格式進行對接,而不是每套系統(tǒng)去兼容一次,這也是數據倉庫、數據中臺的一個設計思想。
在采集分析用戶數據后,我們便可進行用戶畫像。從用戶的整體生命周期來看,可以分為潛在用戶、新用戶、活躍用戶、沉默用戶、流失用戶;針對不同的用戶群體,再細分用戶的購物習慣、購物
我們生在互聯網時代、活在互聯網時代的人,享受了技術紅利所帶來的便利,也引起了競爭,這才有大數據殺熟的事件出現。不過大家在剁手時也不要太過于擔心,在外有國家通過《電子商務法》規(guī)定:電子商務經營者根據消費者的興趣愛好、消費習慣等特征向其提供商品或者服務的搜索結果的,應當同時向該消費者提供不針對其個人特征的選項,尊重和平等保護消費者合法權益;在內可以通過不同設備做價格對比、不同用戶做價格對比、線上線下做價格評估進行避免。同時互聯網巨頭擁有海量的數據、強勁的算法,也更應該聚焦于科技創(chuàng)新,給社會帶來更多進步~
招生熱線: 4008-0731-86 / 0731-82186801
學校地址: 長沙市天心區(qū)團結路6號
Copyright © 2006 | 湖南大計信息科技有限公司 版權所有
湘ICP備14017520號-3