
從事數(shù)據(jù)倉庫和數(shù)據(jù)分析相關(guān)的工作也有段時間了,其實很多問題一直縈繞在腦中,有些甚至已經(jīng)困擾相當(dāng)長的一段時間,自己也在不斷學(xué)習(xí)和工作的過程中尋找各種解決方案或者不斷優(yōu)化和替換之前的方案。這些問題從宏觀層面到細(xì)節(jié)層面,很多問題其實沒有絕對完美的解決方案,我們只能一步一步地摸索,不斷尋找更優(yōu)的方案以其讓問題能夠更好高效地得到解決,但每個人掌握的知識有限,所以無論怎么樣每個人對問題的看法都會存在局限性;同時因為每個人的知識背景和經(jīng)歷的差異性,對各種問題又會觸發(fā)各種不同的見解,所以通過集思廣益往往能夠得到讓人眼前一亮的結(jié)論。
先說說博客,無論怎么樣我的博客只是想做些記錄和總結(jié),只是表述一些個人的觀點,我想每個人在學(xué)習(xí)工作中總會有所積累,有自己在專業(yè)領(lǐng)域的一些收獲,每個人公平地享有相同的時間,每個人學(xué)到的掌握的都是有限的,沒有孰強孰弱之分,差別只在于愿不愿意將其分享出來;博客中整理的內(nèi)容,可能有些人認(rèn)為不適合公開,畢竟有些東西還有些實用價值,但必須看到的是目前互聯(lián)網(wǎng)發(fā)展速度太快了,我之前發(fā)的文章等半年之后回去看就會發(fā)現(xiàn)當(dāng)時自己的想法并不成熟,如果在現(xiàn)階段可能不會完全按照上面的思路去實現(xiàn)了,知識的更新和積累讓我們不斷選擇更優(yōu)的方法,不斷改進和升級自身的知識體系,更何況很多東西在一個業(yè)務(wù)體系下適用,到另外的體系下就不適用了,聰明的人不會完全照搬照抄原方法,而是尋找最合適的方法,或者使用更靈活變通的方式去使用方法,所以也不必?fù)?dān)心技能被“偷學(xué)”,因為只會模仿的人不知道怎么用好這些方法,而足夠聰明的人到哪里都能學(xué)到適合自己的方法,在這個信息膨脹的環(huán)境下無法阻止他們的“偷學(xué)”。
其實博客最大的收獲還是通過博客認(rèn)識了很多朋友,尤其是網(wǎng)站分析領(lǐng)域的,相當(dāng)一部分也有自己的博客,大家互相交流學(xué)到了很多東西,有些東西是互補并相互促進的,這些朋友都是樂意分享自己想法的人,每個人都有各自領(lǐng)域的專業(yè)和強項,這樣反而使我聽到和學(xué)到了很多耳目一新的東西,受益匪淺。所以如果你有時間寫寫博客,那么得到的收獲絕對要比你覺得可能會失去的多得多。
既然我在博客里面已經(jīng)寫了很多,所以這里想換一個角色,我想通過幾篇文章把之前遇到的諸多問題羅列出來,希望大家能夠不吝提出自己的看法和解決方案。其實我更希望在博客的評論中看到更多不同的看法或者通過文章的思路擴展衍生出在其他方向上有價值的應(yīng)用。另外,知乎真的是一個非常棒的知識分享和學(xué)習(xí)的平臺,潛藏了很多的大牛,我會把整理的每個問題都貼到知乎上面,這樣可以收集到更多牛人的看法,希望大家在知乎上有認(rèn)識相關(guān)領(lǐng)域的大牛的可以積極地進行邀請。
這篇是第一篇,想重點羅列一些跟網(wǎng)站數(shù)據(jù)分析行業(yè)和數(shù)據(jù)分析師相關(guān)的問題。
Q1、 你因何會選擇網(wǎng)站分析或互聯(lián)網(wǎng)數(shù)據(jù)分析這個行業(yè),你認(rèn)為這個行業(yè)的價值何在,發(fā)展前景如何?(知乎)
我的答案:互聯(lián)網(wǎng)是一個陽光行業(yè),而數(shù)據(jù)分析本身又是一個非常有意思的工作,很多時候,它就像是一個偵探從細(xì)枝末節(jié)的線索中尋找那個唯一的真相,如果你喜歡這種探秘的感覺,那么你同樣會喜歡上網(wǎng)站數(shù)據(jù)分析這個行業(yè)。
其實我之前在《網(wǎng)站分析的應(yīng)用和價值》這篇文章中介紹過網(wǎng)站數(shù)據(jù)分析的價值(這里不引用鏈接了,大家可以搜一下),簡單地說就是“系統(tǒng)地幫助網(wǎng)站實現(xiàn)更加高效的運營”。
互聯(lián)網(wǎng)數(shù)據(jù)量的快速膨脹,急需對數(shù)據(jù)進行系統(tǒng)化的處理和分析,以便快速地發(fā)現(xiàn)信息,轉(zhuǎn)化價值,所以就目前來看,無論是國外的發(fā)展趨勢,還是國內(nèi)對這個行業(yè)的需求都是快速增長的,發(fā)展前景是比較樂觀的。
Q2、 作為網(wǎng)站的數(shù)據(jù)分析師,你完成的最有成就感的事情是什么,感到最糾結(jié)的事情又是什么?(知乎)
我的答案:最有成就感的事情就是用數(shù)據(jù)實現(xiàn)價值,無論是通過數(shù)據(jù)排查問題進而解決問題,還是通過數(shù)據(jù)分析應(yīng)用優(yōu)化網(wǎng)站產(chǎn)品,其實都是創(chuàng)造價值的過程。
最糾結(jié)的事情其實不是整日需要維護和驗證數(shù)據(jù)的一致性、準(zhǔn)確性,數(shù)據(jù)時常會存在諸多細(xì)節(jié)上的問題,因為這些基本是必然存在的,無論在哪個公司,網(wǎng)站從事何種業(yè)務(wù),技術(shù)或者數(shù)據(jù)的環(huán)境如何,數(shù)據(jù)的問題還是無所不在,而保證數(shù)據(jù)質(zhì)量本身就是數(shù)據(jù)分析師最基礎(chǔ)的工作,也是開展分析的前提和基礎(chǔ)。
我最糾結(jié)的還是在于數(shù)據(jù)的需求和應(yīng)用,如果與數(shù)據(jù)的需求方在數(shù)據(jù)的理解上達(dá)不成一致,那么很多數(shù)據(jù)需求就會存在反復(fù)的調(diào)整變動,期間就會做很多重復(fù)的工作或者無用功,甚至有些時候數(shù)據(jù)分析師大費周章地提取的一份數(shù)據(jù)在需求方那里只是用幾秒鐘掃視一遍,沒有產(chǎn)生任何的價值,這也是令數(shù)據(jù)分析師最傷感的事情。所以數(shù)據(jù)分析始終要從獲取最終insight的角度出發(fā),如果數(shù)據(jù)需求中無法說明獲取數(shù)據(jù)是為了試圖得出何種insight,那么這個需求基本就沒有實現(xiàn)的必要了。
Q3、 作為網(wǎng)站的數(shù)據(jù)分析師,你日常工作中最常做的是什么,需要與哪些同事交流,一般會用到哪些工具?(知乎)
我的答案:數(shù)據(jù)分析師的日常工作很簡單,就是數(shù)據(jù)處理和觀察報表,而且這兩塊工作會占用每天的大部分時間。如果每天能夠準(zhǔn)時提供準(zhǔn)確的報表,及時地反饋數(shù)據(jù)異常,那么你已經(jīng)是一個合格的數(shù)據(jù)分析師了。
數(shù)據(jù)分析師要接觸的部門會比較多,可以是任何有數(shù)據(jù)需求的部門,運營、產(chǎn)品、市場、銷售、客服……甚至是各層級的BOSS。
同樣,數(shù)據(jù)分析師日常使用的工具其實也非常簡單,估計在90%的時間都在使用數(shù)據(jù)庫的SQL、Excel或者PPT,當(dāng)然視每個公司的情況會有差異。所以如果你聽到某位數(shù)據(jù)分析師說他天天在研究什么什么樣的高級分析方法或者高深的數(shù)據(jù)算法,天天在使用R、SPSS、SAS,那么不排除有裝X的嫌疑。
Q4、 在你剛剛步入網(wǎng)站數(shù)據(jù)分析的工作,或者你曾經(jīng)新到一個公司或者網(wǎng)站從事數(shù)據(jù)分析師的工作,你是如何著手開始你的新工作的,你覺得你需要了解哪些東西,會從哪些方面優(yōu)先開始學(xué)習(xí)?(知乎)
我的答案:“業(yè)務(wù) => 網(wǎng)站或產(chǎn)品 => 數(shù)據(jù)處理流程 => 指標(biāo)和報表”,我的基本流程就是這樣的,當(dāng)然這個也不絕對是前后的順序,可以是同時結(jié)合著看的。
推薦閱讀
<b>從用戶角度出發(fā) 讓產(chǎn)品與用戶“心有靈犀”</b>
從一個小故事說起。 之前網(wǎng)上曾經(jīng)對于要不要做調(diào)研這件事情有過討論,這其中提到福特曾經(jīng)這樣解讀自己的發(fā)明:如果我問我的客戶,他們要什么,他們的回答一定是:一匹更快的馬。曾經(jīng)有朋友以此為例來質(zhì)疑調(diào)研的必要性>>>詳細(xì)閱讀
本文標(biāo)題:網(wǎng)站數(shù)據(jù)分析的一些問題(一):重點不在數(shù)據(jù)在于分析
地址:http://www.brh9h.cn/a/22/20120428/56047.html