說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
▍數(shù)據(jù)的獲取
01.數(shù)據(jù)來源平臺(tái)
多數(shù)企業(yè)都是直接用統(tǒng)計(jì)軟件來獲取的,如GA、百度統(tǒng)計(jì)、CNZZ、51la等,雖然大體是相同的但是仔細(xì)分析下來還是會(huì)有細(xì)微的差距。估計(jì)很多朋友也在GA或者百度、cnzz到底用哪個(gè) 來統(tǒng)計(jì)數(shù)據(jù)糾結(jié)過。如果你的網(wǎng)站上了百度競價(jià),那么百度統(tǒng)計(jì)是更好的選擇。現(xiàn)在統(tǒng)計(jì)代碼基本都是異步加載,不用太過擔(dān)心速度問題,如果你還糾結(jié),那也可以全部都使用一下。
02.本地保存“即時(shí)數(shù)據(jù)”
統(tǒng)計(jì)軟件后臺(tái)一般會(huì)有一些分類數(shù)據(jù),如來路頁面、受訪頁面等,基本不受時(shí)間限制,隨時(shí)可以的。但是要注意那些需要即時(shí)保存的數(shù)據(jù)欄目,舉個(gè)例子,CNZZ后臺(tái)的“訪問明細(xì)”,該欄目只保存近7天的數(shù)據(jù),這意味著如果你一不注意,數(shù)據(jù)有可能找不回來了。所以,這類數(shù)據(jù)建議保存在本地。
?
03.數(shù)據(jù)格式“.xls”
在統(tǒng)計(jì)后臺(tái)數(shù)據(jù)的過程中,基本都會(huì)出現(xiàn)格式選項(xiàng),CNZZ是.csv和.xls,百度統(tǒng)計(jì)是.csv和.pdf。pdf數(shù)據(jù)自帶圖表;csv為純文本數(shù)據(jù)格式;xls為Excel專用,便于數(shù)據(jù)分析。其中.csv文件和.xls下來后,數(shù)據(jù)的長相極其相似。因?yàn)閏sv文件是純文本數(shù)據(jù),并不是數(shù)值,所以不能進(jìn)行數(shù)據(jù)上的求和,求平均值,只能計(jì)數(shù)!如果你不小心用了.csv文件,一定要先處理成數(shù)值,否則后期數(shù)據(jù)分析時(shí)會(huì)有無法正確統(tǒng)計(jì)的情況!
04.多頁數(shù)據(jù)采集及合并
當(dāng)你需要保存在線數(shù)據(jù)時(shí),需要注意一個(gè)小細(xì)節(jié),比如CNZZ的“訪問明細(xì)”欄,右上角顯示的按鈕是“本頁報(bào)表”,而其他欄目的按鈕是“報(bào)表”,兩個(gè)仔細(xì)一對(duì)比你發(fā)現(xiàn)了,一看原來只是一頁的數(shù)據(jù),再想的時(shí)候,服務(wù)器數(shù)據(jù)已經(jīng)過了7天,數(shù)據(jù)不在了…所以小伙伴們一定要注意,千萬不要被坑!
每頁報(bào)表,會(huì)有一個(gè)問題是當(dāng)你的網(wǎng)站訪問量很大時(shí),訪問明細(xì)數(shù)據(jù)每一頁都需要點(diǎn)擊。這個(gè)很頭疼。
我目前的解決辦法是使用“火車頭采集器”,模擬人工點(diǎn)擊,每頁數(shù)據(jù);
第二個(gè)問題是:自動(dòng)的數(shù)據(jù)每一張都有表頭/尾,人工合并也會(huì)累死。可以使用Excel VBA功能,但我的辦法是使用“慧辦公”插件的合并多表功能,這種有使用限制,需要購買,
大家如果更好的辦法也希望分享出來
▍數(shù)據(jù)清理
01.盡量不對(duì)源數(shù)據(jù)做修改
我做數(shù)據(jù)分析有個(gè)原則,是“堅(jiān)決反對(duì)對(duì)源數(shù)據(jù)進(jìn)行直接修改”。首先,專業(yè)的統(tǒng)計(jì)軟件在設(shè)計(jì)統(tǒng)計(jì)后臺(tái)的數(shù)據(jù)時(shí),已做精選,選出的數(shù)據(jù)能夠限度滿足用戶的需求。當(dāng)源數(shù)據(jù)不符合你的要求時(shí),千萬別在源數(shù)據(jù)中插入行和列,比如要插入日期列,請(qǐng)插入在數(shù)據(jù)表頭或者尾。因?yàn)槊看伪4鏀?shù)據(jù)時(shí),都是直接從好的表格中粘貼數(shù)據(jù),在源數(shù)據(jù)表中多出任何一行或列都會(huì)增加你的操作成本。
也是說,對(duì)源數(shù)據(jù)盡量減少人為干預(yù),減少出錯(cuò),省心省力。
02.坑貨csv要轉(zhuǎn)化為數(shù)值
在數(shù)據(jù)獲取部分我提到了關(guān)于源數(shù)據(jù)是.csv格式的問題,如果你知道這里有坑不進(jìn)去是的,但是已經(jīng)進(jìn)去了,怎么辦?我開始源數(shù)據(jù)一直用csv,因?yàn)閏sv的文件小,速度快,數(shù)據(jù)分析時(shí)蒙B了。那么已經(jīng)保存為csv格式的數(shù)據(jù)怎樣變成數(shù)值呢?答案是Excel的分列功能。
1)Excel打開源數(shù)據(jù)表,復(fù)制部分?jǐn)?shù)據(jù)到.txt文本中,觀察源數(shù)據(jù)用的什么符號(hào);
2)選中某列數(shù)據(jù),點(diǎn)擊導(dǎo)航欄“數(shù)據(jù)”—“分列”;
3)下一步,如圖中的數(shù)據(jù)分隔符是“Tab”+“””,那么選擇Tab和其他兩項(xiàng),繼續(xù)下一步;
4)選擇目標(biāo)區(qū)域(要復(fù)制在哪里),搞定。
▍如何制表
01.報(bào)表是你思考結(jié)果的展示
很多企業(yè)可能制表人與分析人都不是同一個(gè)。要記住報(bào)表是要把分析人的思路更簡潔的展示給其他人。所以推薦制表人是分析人本人。不要以浪費(fèi)時(shí)間和辦公軟件不熟悉為由拒絕,熟練掌握辦公軟件,我覺得是運(yùn)營人的基本素質(zhì)。
思路的展現(xiàn)邏輯一般是“總分總”,以網(wǎng)站分析說,我的框架是:流量趨勢→來源渠道→渠道1明細(xì)→渠道2明細(xì)…→來路分析→受訪分析→搜索詞→外鏈。
02.制定表格規(guī)范
制表中切記展示圖表不能亂用,用折線圖表達(dá)百分比關(guān)系?數(shù)據(jù)對(duì)比用折線圖??為數(shù)據(jù)選擇合適的展現(xiàn)圖表類型,比較數(shù)據(jù)間區(qū)別時(shí),用條形圖;表示不同項(xiàng)在總體的占比時(shí),用餅狀圖;反映事物變化時(shí),用折線圖;觀察不同項(xiàng)目長短板時(shí),用雷達(dá)圖…還有其他諸如符號(hào)使用規(guī)范、配色規(guī)范等,這里不再啰嗦了??傊?,你換位思考一下,別人看你的圖表的時(shí)候能不能理解的透徹呢?
03.數(shù)據(jù)分析后一定要有可執(zhí)行建議
把數(shù)據(jù)做成表格不是為了裝逼,讓別人看起來很牛。作為一個(gè)專業(yè)人員始終記得“報(bào)表只是你思考結(jié)果的展示”,重要的是你通過數(shù)據(jù)分析出來了對(duì)今后工作有指導(dǎo)性的建議。把報(bào)表做的漂亮是一種能力,但是美觀始終流于表面。只有真正有指導(dǎo)性的建議才能長久的打動(dòng)人。
這個(gè)問題很難了,但如果能分析的好,你不僅僅是個(gè)專員。
04.透視表,降維打擊
使用Excel做分析的時(shí)候,基本上是直接用基本的篩選、公式(sumif、countif、sumproduct)、條件格式之類,雖然操作逐漸變得熟練,速度越來越快??墒窍胂笠幌拢?dāng)你需要對(duì)比源數(shù)據(jù)中兩天某一項(xiàng)數(shù)據(jù)的區(qū)別時(shí),可能需要先加入三列輔助列,然后使用countif函數(shù)對(duì)兩列進(jìn)行計(jì)數(shù),第三列使用減法再加上顏色的條件格式。如何對(duì)比兩個(gè)月的數(shù)據(jù)呢?用sumproduct,多塞幾個(gè)條件??
透視表工具早學(xué)早好,使用的Excel的“數(shù)據(jù)透視表”功能后,能力會(huì)加強(qiáng)太多了,“對(duì)比功能”“創(chuàng)建組”功能,分析起來簡直不要更爽!另外,對(duì)于Excel的學(xué)習(xí),基本功也別落下,對(duì)數(shù)據(jù)的基本函數(shù)和條件格式,用好了也能帶你飛。
▍分析要素
01.日記:當(dāng)天有特殊情況記錄在趨勢表中
一個(gè)網(wǎng)站的運(yùn)營者,每天上班的必做是粗略過一遍昨天的統(tǒng)計(jì)數(shù)據(jù)。把每天收集到可能影響到網(wǎng)站數(shù)據(jù)的情況“批注”在趨勢表中,等到周報(bào)時(shí)進(jìn)行數(shù)據(jù)對(duì)比,會(huì)方便很多。包括一些活、EDM等等標(biāo)注好有利于之后的總結(jié)工作。
02.峰值:高峰、低峰都不能放松
在面對(duì)圖表分析時(shí),峰值為明顯。但是很多人只分析不好的低峰而忽略高峰,對(duì)高峰擅自代入。
面對(duì)峰值時(shí),首先要縮小粒度。如觀察8月8日出現(xiàn)低峰,那么再看是在8月8日當(dāng)天哪幾個(gè)小時(shí)數(shù)值降低,再分別篩選出這幾個(gè)小時(shí)的來訪及受訪數(shù)據(jù),逐一分析,找到根源。低峰找出原因,今后避免;高峰,也找出原因,今后重現(xiàn),驗(yàn)證你找到的原因。
03.對(duì)比:約束變量,同軸對(duì)比
在上文中提到了“制定表格規(guī)范”,其中對(duì)比規(guī)范的核心是要同軸。比如數(shù)據(jù)對(duì)比坐標(biāo)軸不能瞎變,這周記錄的是星期一到星期天,對(duì)比的是本周和上周;下周記錄的變成了星期三到星期五,對(duì)比的是上半月和下半月。坐標(biāo)軸一定要按照表格類型來,周報(bào)告以周報(bào)告為軸,對(duì)比的也是本周7天和上周7天的數(shù)據(jù)。有特殊情況需要在周報(bào)告中顯示更長的時(shí)間段時(shí),應(yīng)該固定該時(shí)間。頻繁更換坐標(biāo)軸是非常不明智的。
04.經(jīng)驗(yàn):記住周期性現(xiàn)象,這是你的寶藏
什么叫周期性現(xiàn)象,比如“每逢節(jié)假日流量下降”、“每逢流量下降”、“每周三9點(diǎn)PV暴增”等等,多次重復(fù)并反映在數(shù)據(jù)波動(dòng)上的情況。
針對(duì)平臺(tái)運(yùn)營,記住所有周期現(xiàn)象,這是你今后工作比別人更專業(yè)的經(jīng)驗(yàn)來源,不需要企業(yè)花費(fèi)大量試錯(cuò),節(jié)省大量人力物力。
05.反常:事出反常必有妖
什么叫反?,F(xiàn)象,比如大多網(wǎng)站在中午12-14點(diǎn)間,流量都會(huì)因?yàn)榫W(wǎng)民需要休息顯著降低,且PC流量降低,移動(dòng)流量驟升。但是如果某,或者某一周的12-14點(diǎn)流量全體暴增呢?
反?,F(xiàn)象是在周期性現(xiàn)象的異變,當(dāng)多次出現(xiàn)反?,F(xiàn)象時(shí),你找到原因后要開始重新審視周期性現(xiàn)象是否產(chǎn)生了變化,是否是政策變化;是否是環(huán)境風(fēng)向變化;是否是平臺(tái)玩兒變化等。
▍理論誤區(qū)
01.猜測不代表結(jié)論
進(jìn)行數(shù)據(jù)分析時(shí),先看日記中記錄了哪些行為,再對(duì)比數(shù)據(jù)結(jié)果看記錄該行為的同時(shí)是否產(chǎn)品數(shù)據(jù)波動(dòng),如果數(shù)據(jù)波動(dòng)符合日記中的行為常識(shí),那么可以大膽猜測該項(xiàng)數(shù)據(jù)變化是由該次行為導(dǎo)致。
接著你要做的是通過數(shù)據(jù)驗(yàn)證它,而不是武斷的認(rèn)為數(shù)據(jù)波動(dòng)是這個(gè)行為產(chǎn)生的。
比如,公司派同事去路演,路演PPT尾頁留有微信公號(hào)的二維碼。結(jié)果在數(shù)據(jù)分析時(shí),發(fā)現(xiàn)當(dāng)天微信新關(guān)注數(shù)量暴增。然后運(yùn)營人員不經(jīng)過驗(yàn)證直接武斷的把新增用戶的效果歸于路演,甚至得出了要多參加路演的指示。可是在數(shù)據(jù)分析時(shí),發(fā)現(xiàn)當(dāng)天新關(guān)注數(shù)的增長來源是“名片分享”而不是“掃描二維碼”,后來一問才知道,是社群組的同事進(jìn)行了一次小范圍的社群名片互動(dòng)。
始終要記住“猜測不代表結(jié)論”,提出猜測后,要證實(shí)它。當(dāng)出現(xiàn)實(shí)在找不到根源的問題時(shí),先暫時(shí)放棄,記錄下你的猜測,找機(jī)會(huì)再驗(yàn)證它。
02.深入分析,結(jié)論可能是假的
剛才提到了“猜測不代表結(jié)論”,這里面存在連環(huán)套。因?yàn)閿?shù)據(jù)分析工作面對(duì)著大量數(shù)據(jù),時(shí)間一長,人難免會(huì)焦躁,特別是老是找不到原因時(shí),很容易得到假結(jié)論。
舉個(gè)例子,某次分析網(wǎng)站數(shù)據(jù)時(shí),對(duì)比發(fā)現(xiàn)有網(wǎng)站的PV暴增許多,縮小粒度后發(fā)現(xiàn)數(shù)據(jù)增幅集中在當(dāng)天14-17點(diǎn),然后開始分析“受訪頁面”的訪問次數(shù),一排序,發(fā)現(xiàn)某個(gè)欄目PV暴增,一問部門同事才發(fā)現(xiàn)是因?yàn)閮?nèi)容運(yùn)營開了爬蟲,抓取了大量的信息流,提高了PV量。
這時(shí)候,如果不細(xì)想很容易得出“PV暴增是因?yàn)閮?nèi)容組抓取大量內(nèi)容導(dǎo)致”的表面結(jié)論。因?yàn)榛氐絾栴}中,原現(xiàn)象是“14-17點(diǎn),PV暴增”,現(xiàn)有的表面結(jié)論并沒有按照小時(shí)粒度去分析,終分析14-17點(diǎn)小時(shí)數(shù)據(jù)時(shí),發(fā)現(xiàn)原來是因?yàn)檫@三個(gè)小時(shí)來了一位新訪客,瀏覽了多篇資訊文章,然后把所有欄目都看了一遍。
所以終PV暴增的原因應(yīng)該是“新訪客瀏覽整站”和“內(nèi)容組開爬蟲”共同作用引起的,而非單一項(xiàng)。在實(shí)際工作中,人們很容易只是看到了層表象得出結(jié)論,時(shí)刻記住多深入分析,想想現(xiàn)有的結(jié)論是不是到小粒度了,有沒有可能是個(gè)陷阱?
▍結(jié)語&題外話
01.當(dāng)你的某項(xiàng)工作長期不見起色,懷疑源頭試試
以數(shù)據(jù)分析來說,分析人員有時(shí)候會(huì)出現(xiàn)分析來分析去是得不出結(jié)論的現(xiàn)象,導(dǎo)致這種現(xiàn)象的原因除了上文提到過的“csv格式”等操作問題時(shí),還有可能是數(shù)據(jù)源本身出現(xiàn)了錯(cuò)誤。別想著機(jī)器一定正確,如CNZZ后臺(tái)統(tǒng)計(jì)“來源分類”時(shí),四個(gè)來源渠道數(shù)量想加出現(xiàn)了不等于總和的情況。這里面有部分來源是后臺(tái)統(tǒng)計(jì)不到的,所以沒有計(jì)入。也會(huì)有數(shù)據(jù)表格時(shí),后臺(tái)出錯(cuò)一了張空表,合并時(shí)出現(xiàn)大坑。
所以適當(dāng)?shù)膽岩稍搭^,說不定會(huì)有意想不到的發(fā)現(xiàn)。
02.三方平臺(tái)不可靠?那自建
剛才提到了統(tǒng)計(jì)后臺(tái)出錯(cuò)的一些情況,當(dāng)后臺(tái)出錯(cuò)的次數(shù)很高,降低了運(yùn)營者對(duì)統(tǒng)計(jì)軟件的信任度。一旦對(duì)源數(shù)據(jù)的正誤產(chǎn)生了懷疑,工作起來絕不會(huì)順心。
既然三方平臺(tái)不可靠,有實(shí)力讓公司的技術(shù)人員自行搭建后臺(tái)吧。在技術(shù)人員實(shí)力過硬的情況下,不僅可靠,而且可擴(kuò)展性強(qiáng),分析粒度也更細(xì)(如CNZZ不能統(tǒng)計(jì)用戶行為路徑),可以完全按照運(yùn)營人的數(shù)據(jù)要求進(jìn)行定制,后期為用戶建模時(shí),提供的數(shù)據(jù)支撐。
03.數(shù)據(jù)不會(huì)說話,但你要負(fù)責(zé)
在數(shù)據(jù)分析中,會(huì)慢慢得到一些樂趣,次學(xué)會(huì)用Excel某個(gè)函數(shù)的得意、次知道透視表時(shí)的興奮、次制作PPT被夸獎(jiǎng)時(shí)的欣喜…你發(fā)現(xiàn)了很多坑,也學(xué)了很多小技巧。會(huì)從小白變成大神,能輕易的使用某個(gè)小聰明的手段,掩蓋掉真實(shí)數(shù)據(jù)的缺點(diǎn)。這些,數(shù)據(jù)永遠(yuǎn)不能開口說話,但是你要對(duì)自己負(fù)責(zé)。
本文來源于網(wǎng)絡(luò),歡迎大家一起交流分享
推薦閱讀
競價(jià)推廣分析 競價(jià)推廣該如何分析數(shù)據(jù) | 文軍營銷競價(jià)推廣分析——競價(jià)推廣該如何分析數(shù)據(jù) 第一、要知彼。 在競價(jià)推廣之前一定要清楚的了解同行的動(dòng)向,了解同行的優(yōu)勢賣點(diǎn),了解同行競價(jià)推廣的關(guān)鍵詞、推廣區(qū)域、創(chuàng)意編寫、展現(xiàn)形式、語句長短的等等方面,做到知彼,這樣才能知道如何讓自己的創(chuàng)意與眾不同; 第二、要知己。 要清楚的了解自己的優(yōu)勢,特別是于同行之間的差距...百度競價(jià)數(shù)據(jù)分析 | 文軍營銷百度競價(jià)數(shù)據(jù)分析 做數(shù)據(jù)分析要抓住核心的東西“轉(zhuǎn)化率”,采用:對(duì)比、細(xì)分、溯源的分析方法,憑借福爾摩斯的聰明才智,一定可以做出完美的數(shù)據(jù)分析。 為近100家大中型企業(yè)提供優(yōu)質(zhì)搜索引擎營銷服務(wù) 為近1000家行業(yè)客戶提供專業(yè)搜索軟件產(chǎn)品 平均節(jié)約約50%的營銷成本 平均提供200%的流量...
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732