常見(jiàn)的預(yù)測(cè)方法有單點(diǎn)預(yù)測(cè),即確定性預(yù)測(cè);區(qū)間預(yù)測(cè);和概率預(yù)測(cè)三種方法。
單點(diǎn)預(yù)測(cè),顧名思義,只能給出一個(gè)預(yù)測(cè)值,不能表達(dá)該預(yù)測(cè)值的可信度;
區(qū)間預(yù)測(cè)在單點(diǎn)預(yù)測(cè)的基礎(chǔ)上,給出某次預(yù)測(cè)值在某一區(qū)間上的可信度,即能夠給出一個(gè)預(yù)測(cè)范圍,以及以多大的可能性落在這個(gè)范圍;
概率預(yù)測(cè)是咋區(qū)間預(yù)測(cè)的基礎(chǔ)上,給出一個(gè)概率分布,預(yù)測(cè)出所有可能出現(xiàn)的結(jié)果,以及對(duì)應(yīng)的概率。這種方法比較全面,能夠給出全局信息,適于風(fēng)險(xiǎn)相關(guān)的分析。目前在氣象、地震、水文和農(nóng)業(yè)相關(guān)方面用的比較多。
定量預(yù)測(cè)方法有:
加權(quán)算術(shù)平均法
用各種權(quán)數(shù)算得的平均數(shù)稱為加權(quán)算術(shù)平均數(shù),它可以自然數(shù)作權(quán)數(shù),也可以項(xiàng)目出現(xiàn)的次數(shù)作權(quán)數(shù),所求平均數(shù)值即為測(cè)定值。
趨勢(shì)平均預(yù)測(cè)法
趨勢(shì)平均預(yù)測(cè)法是以過(guò)去發(fā)生的實(shí)際數(shù)為依據(jù),在算術(shù)平均數(shù)的基礎(chǔ)上,假定未來(lái)時(shí)期的數(shù)值是它近期數(shù)值直接繼續(xù),而同較遠(yuǎn)時(shí)期的數(shù)值關(guān)系較小的一種預(yù)測(cè)方法。
指數(shù)平滑法
指數(shù)平滑法是以一個(gè)指標(biāo)本身過(guò)去變化的趨勢(shì)作為預(yù)測(cè)未來(lái)的依據(jù)的一種方法。對(duì)未來(lái)預(yù)測(cè)時(shí),考慮則近期資料的影響應(yīng)比遠(yuǎn)期為大,因而對(duì)不同時(shí)期的資料不同的權(quán)數(shù),越是近期資料權(quán)數(shù)越大,反之權(quán)數(shù)越小。
(4)平均發(fā)展速度法
(5)一元線性回歸預(yù)測(cè)法
根據(jù)x、y現(xiàn)有數(shù)據(jù),尋求合理的a、b回歸系數(shù),得出一條變動(dòng)直線,并使線上各點(diǎn)至實(shí)際資料上的對(duì)應(yīng)點(diǎn)之間的距離最小。
設(shè)變動(dòng)直線方程為:y=a+bx
(6)高低點(diǎn)法
高低點(diǎn)法是利用代數(shù)式y(tǒng)=a+bx,選用一定歷史資料中的最高業(yè)務(wù)量與最低業(yè)務(wù)量的總成本(或總費(fèi)用)之差△y,與兩者業(yè)務(wù)量之差△x進(jìn)行對(duì)比,求出b,然后再求出a的方法。
一、描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)是一類統(tǒng)計(jì)方法的匯總,揭示了數(shù)據(jù)分布特性。它主要包括數(shù)據(jù)的頻數(shù)分析、數(shù)據(jù)的集中趨勢(shì)分析、數(shù)據(jù)離散程度分析、數(shù)據(jù)的分布以及一些基本的統(tǒng)計(jì)圖形。
1、缺失值填充:常用方法有剔除法、均值法、決策樹(shù)法。
2、正態(tài)性檢驗(yàn):很多統(tǒng)計(jì)方法都要求數(shù)值服從或近似服從正態(tài)分布,所以在做數(shù)據(jù)分析之前需要進(jìn)行正態(tài)性檢驗(yàn)。常用方法:非參數(shù)檢驗(yàn)的K-量檢驗(yàn)、P-P圖、Q-Q圖、W檢驗(yàn)、動(dòng)差法。
二、回歸分析
回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一。它基于觀測(cè)數(shù)據(jù)建立變量間適當(dāng)?shù)囊蕾囮P(guān)系,以分析數(shù)據(jù)內(nèi)在規(guī)律。
1. 一元線性分析
只有一個(gè)自變量X與因變量Y有關(guān),X與Y都必須是連續(xù)型變量,因變量Y或其殘差必須服從正態(tài)分布。
2. 多元線性回歸分析
使用條件:分析多個(gè)自變量X與因變量Y的關(guān)系,X與Y都必須是連續(xù)型變量,因變量Y或其殘差必須服從正態(tài)分布。
3.Logistic回歸分析
線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,且自變量和因變量呈線性關(guān)系,而Logistic回歸模型對(duì)因變量的分布沒(méi)有要求,一般用于因變量是離散時(shí)的情況。
4. 其他回歸方法:非線性回歸、有序回歸、Probit回歸、加權(quán)回歸等。
三、方差分析
使用條件:各樣本須是相互獨(dú)立的隨機(jī)樣本;各樣本來(lái)自正態(tài)分布總體;各總體方差相等。
1. 單因素方差分析:一項(xiàng)試驗(yàn)只有一個(gè)影響因素,或者存在多個(gè)影響因素時(shí),只分析一個(gè)因素與響應(yīng)變量的關(guān)系。
2. 多因素有交互方差分析:一頊實(shí)驗(yàn)有多個(gè)影響因素,分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,同時(shí)考慮多個(gè)影響因素之間的關(guān)系
3. 多因素?zé)o交互方差分析:分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,但是影響因素之間沒(méi)有影響關(guān)系或忽略影響關(guān)系
4. 協(xié)方差分祈:傳統(tǒng)的方差分析存在明顯的弊端,無(wú)法控制分析中存在的某些隨機(jī)因素,降低了分析結(jié)果的準(zhǔn)確度。協(xié)方差分析主要是在排除了協(xié)變量的影響后再對(duì)修正后的主效應(yīng)進(jìn)行方差分析,是將線性回歸與方差分析結(jié)合起來(lái)的一種分析方法。
四、假設(shè)檢驗(yàn)
1. 參數(shù)檢驗(yàn)
參數(shù)檢驗(yàn)是在已知總體分布的條件下(一股要求總體服從正態(tài)分布)對(duì)一些主要的參數(shù)(如均值、百分?jǐn)?shù)、方差、相關(guān)系數(shù)等)進(jìn)行的檢驗(yàn) 。
2. 非參數(shù)檢驗(yàn)
非參數(shù)檢驗(yàn)則不考慮總體分布是否已知,常常也不是針對(duì)總體參數(shù),而是針對(duì)總體的某些一般性假設(shè)(如總體分布的位罝是否相同,總體分布是否正態(tài))進(jìn)行檢驗(yàn)。
適用情況:順序類型的數(shù)據(jù)資料,這類數(shù)據(jù)的分布形態(tài)一般是未知的。
1)雖然是連續(xù)數(shù)據(jù),但總體分布形態(tài)未知或者非正態(tài);
2)總體分布雖然正態(tài),數(shù)據(jù)也是連續(xù)類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗(yàn)、秩和檢驗(yàn)、二項(xiàng)檢驗(yàn)、游程檢驗(yàn)、K-量檢驗(yàn)等。
定量預(yù)測(cè)是使用一歷史數(shù)據(jù)或因素變量來(lái)預(yù)測(cè)需求的數(shù)學(xué)模型。是根據(jù)已掌握的比較完備的歷史統(tǒng)計(jì)數(shù)據(jù),運(yùn)用一定的數(shù)學(xué)方法進(jìn)行科學(xué)的加工整理,借以揭示有關(guān)變量之間的規(guī)律性聯(lián)系,用于預(yù)測(cè)和推測(cè)未來(lái)發(fā)展變化情況的一類預(yù)測(cè)方法。 烽火獵頭專家認(rèn)為定量預(yù)測(cè)方法也稱統(tǒng)計(jì)預(yù)測(cè)法,其主要特點(diǎn)是利用統(tǒng)計(jì)資料和數(shù)學(xué)模型來(lái)進(jìn)行預(yù)測(cè)。然而,這并不意味著定量方法完全排除主觀因素,相反主觀判斷在定量方法中仍起著重要的作用,只不過(guò)與定性方法相比,各種主觀因素所起的作用小一些罷了。
目前工商企業(yè)中常用的預(yù)測(cè)方法有以下幾種:
(1)加權(quán)算術(shù)平均法
用各種權(quán)數(shù)算得的平均數(shù)稱為加權(quán)算術(shù)平均數(shù),它可以自然數(shù)作權(quán)數(shù),也可以項(xiàng)目出現(xiàn)的次數(shù)作權(quán)數(shù),所求平均數(shù)值即為測(cè)定值。
(2)趨勢(shì)平均預(yù)測(cè)法
趨勢(shì)平均預(yù)測(cè)法是以過(guò)去發(fā)生的實(shí)際數(shù)為依據(jù),在算術(shù)平均數(shù)的基礎(chǔ)上,假定未來(lái)時(shí)期的數(shù)值是它近期數(shù)值直接繼續(xù),而同較遠(yuǎn)時(shí)期的數(shù)值關(guān)系較小的一種預(yù)測(cè)方法。
(3)指數(shù)平滑法
指數(shù)平滑法是以一個(gè)指標(biāo)本身過(guò)去變化的趨勢(shì)作為預(yù)測(cè)未來(lái)的依據(jù)的一種方法。對(duì)未來(lái)預(yù)測(cè)時(shí),考慮則近期資料的影響應(yīng)比遠(yuǎn)期為大,因而對(duì)不同時(shí)期的資料不同的權(quán)數(shù),越是近期資料權(quán)數(shù)越大,反之權(quán)數(shù)越小。
(4)平均發(fā)展速度法
(5)一元線性回歸預(yù)測(cè)法
根據(jù)x、y現(xiàn)有數(shù)據(jù),尋求合理的a、b回歸系數(shù),得出一條變動(dòng)直線,并使線上各點(diǎn)至實(shí)際資料上的對(duì)應(yīng)點(diǎn)之間的距離最小。
設(shè)變動(dòng)直線方程為:y=a+bx
(6)高低點(diǎn)法
高低點(diǎn)法是利用代數(shù)式y(tǒng)=a+bx,選用一定歷史資料中的最高業(yè)務(wù)量與最低業(yè)務(wù)量的總成本(或總費(fèi)用)之差△y,與兩者業(yè)務(wù)量之差△x進(jìn)行對(duì)比,求出b,然后再求出a的方法。
(7)時(shí)間序列預(yù)測(cè)法
它時(shí)間序利預(yù)測(cè)法是把一系列的時(shí)間作為自變量來(lái)確定直線方程y=a+bx,進(jìn)而求出a、b的值,這是回歸預(yù)測(cè)的特殊式。
一、掌握基礎(chǔ)、更新知識(shí)。
基本技術(shù)怎么強(qiáng)調(diào)都不過(guò)分。這里的術(shù)更多是(計(jì)算機(jī)、統(tǒng)計(jì)知識(shí)), 多年做數(shù)據(jù)分析、數(shù)據(jù)挖掘的經(jīng)歷來(lái)看、以及業(yè)界朋友的交流來(lái)看,這點(diǎn)大家深有感觸的。
數(shù)據(jù)庫(kù)查詢—SQL 數(shù)據(jù)分析師在計(jì)算機(jī)的層面的技能要求較低,主要是會(huì)SQL,因?yàn)檫@里解決一個(gè)數(shù)據(jù)提取的問(wèn)題。有機(jī)會(huì)可以去逛逛一些專業(yè)的數(shù)據(jù)論壇,學(xué)習(xí)一些SQL技巧、新的函數(shù),對(duì)你工作效率的提高是很有幫助的。
統(tǒng)計(jì)知識(shí)與數(shù)據(jù)挖掘 你要掌握基礎(chǔ)的、成熟的數(shù)據(jù)建模方法、數(shù)據(jù)挖掘方法。例如:多元統(tǒng)計(jì):回歸分析、因子分析、離散等,數(shù)據(jù)挖掘中的:決策樹(shù)、聚類、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)等。
但是還是應(yīng)該關(guān)注一些博客、論壇中大家對(duì)于最新方法的介紹,或者是對(duì)老方法的新運(yùn)用,不斷更新自己知識(shí),才能跟上時(shí)代,也許你工作中根本不會(huì)用到,但是未來(lái)呢?行業(yè)知識(shí) 如果數(shù)據(jù)不結(jié)合具體的行業(yè)、業(yè)務(wù)知識(shí),數(shù)據(jù)就是一堆數(shù)字,不代表任何東西。是冷冰冰,是不會(huì)產(chǎn)生任何價(jià)值的,數(shù)據(jù)驅(qū)動(dòng)營(yíng)銷、提高科學(xué)決策一切都是空的。
一名數(shù)據(jù)分析師,一定要對(duì)所在行業(yè)知識(shí)、業(yè)務(wù)知識(shí)有深入的了解。例如:看到某個(gè)數(shù)據(jù),你首先必須要知道,這個(gè)數(shù)據(jù)的統(tǒng)計(jì)口徑是什么?是如何取出來(lái)的?這個(gè)數(shù)據(jù)在這個(gè)行業(yè), 在相應(yīng)的業(yè)務(wù)是在哪個(gè)環(huán)節(jié)是產(chǎn)生的?數(shù)值的代表業(yè)務(wù)發(fā)生了什么(背景是什么)?對(duì)于A部門來(lái)說(shuō),本月新會(huì)員有10萬(wàn),10萬(wàn)好還是不好呢?先問(wèn)問(wèn)上面的這個(gè)問(wèn)題:對(duì)于A部門,1、新會(huì)員的統(tǒng)計(jì)口徑是什么。
第一次在使用A部門的產(chǎn)品的會(huì)員?還是在站在公司角度上說(shuō),第一次在公司發(fā)展業(yè)務(wù)接觸的會(huì)員?2、是如何統(tǒng)計(jì)出來(lái)的。A:時(shí)間;是通過(guò)創(chuàng)建時(shí)間,還是業(yè)務(wù)完成時(shí)間。
B:業(yè)務(wù)場(chǎng)景。是只要與業(yè)務(wù)發(fā)接觸,例如下了單,還是要業(yè)務(wù)完成后,到成功支付。
3、這個(gè)數(shù)據(jù)是在哪個(gè)環(huán)節(jié)統(tǒng)計(jì)出來(lái)。在注冊(cè)環(huán)節(jié),在下單環(huán)節(jié),在成功支付環(huán)節(jié)。
4、這個(gè)數(shù)據(jù)代表著什么。10萬(wàn)高嗎?與歷史相同比較?是否做了營(yíng)銷活動(dòng)?這個(gè)行業(yè)處理行業(yè)生命同期哪個(gè)階段?在前面二點(diǎn),更多要求你能按業(yè)務(wù)邏輯,來(lái)進(jìn)行數(shù)據(jù)的提?。ǜ嗍菍?xiě)SQL代碼從數(shù)據(jù)庫(kù)取出數(shù)據(jù))。
后面二點(diǎn),更重要是對(duì)業(yè)務(wù)了解,更行業(yè)知識(shí)了解,你才能進(jìn)行相應(yīng)的數(shù)據(jù)解讀,才能讓數(shù)據(jù)產(chǎn)生真正的價(jià)值,不是嗎?對(duì)于新進(jìn)入數(shù)據(jù)行業(yè)或者剛進(jìn)入數(shù)據(jù)行業(yè)的朋友來(lái)說(shuō):行業(yè)知識(shí)都重要,也許你看到很多的數(shù)據(jù)行業(yè)的同仁,在微博或者寫(xiě)文章說(shuō),數(shù)據(jù)分析思想、行業(yè)知識(shí)、業(yè)務(wù)知識(shí)很重要。我非常同意。
因?yàn)樽鳛閿?shù)據(jù)分析師,在發(fā)表任何觀點(diǎn)的時(shí)候,都不要忘記你居于的背景是什么?但大家一定不要忘記了一些基本的技術(shù),不要把基礎(chǔ)去忘記了,如果一名數(shù)據(jù)分析師不會(huì)寫(xiě)SQL,那麻煩就大了。哈哈。
你只有把數(shù)據(jù)先取對(duì)了,才能正確的分析,否則一切都是錯(cuò)誤了,甚至?xí)?dǎo)致致命的結(jié)論。
新同學(xué),還是好好花時(shí)間把基礎(chǔ)技能學(xué)好。因?yàn)榛A(chǔ)技能你可以在短期內(nèi)快速提高,但是在行業(yè)、業(yè)務(wù)知識(shí)的是一點(diǎn)一滴的積累起來(lái)的,有時(shí)候是急不來(lái)的,這更需要花時(shí)間慢慢去沉淀下來(lái)。
不要過(guò)于追求很高級(jí)、高深的統(tǒng)計(jì)方法,我提倡有空還是要多去學(xué)習(xí)基本的統(tǒng)計(jì)學(xué)知識(shí),從而提高工作效率,達(dá)到事半功倍。以我經(jīng)驗(yàn)來(lái)說(shuō),我負(fù)責(zé)任告訴新進(jìn)的同學(xué),永遠(yuǎn)不要忘記基本知識(shí)、基本技能的學(xué)習(xí)。
二、要有三心。1、細(xì)心。
2、耐心。3、靜心。
數(shù)據(jù)分析師其實(shí)是一個(gè)細(xì)活,特別是在前文提到的例子中的前面二點(diǎn)。而且在數(shù)據(jù)分析過(guò)程中,是一個(gè)不斷循環(huán)迭代的過(guò)程,所以一定在耐心,不怕麻煩,能靜下心來(lái)不斷去修改自己的分析思路。
三、形成自己結(jié)構(gòu)化的思維。數(shù)據(jù)分析師一定要嚴(yán)謹(jǐn)。
而嚴(yán)謹(jǐn)一定要很強(qiáng)的結(jié)構(gòu)化思維,如何提高結(jié)構(gòu)化思維,也許只需要工作隊(duì)中不斷的實(shí)踐。但是我推薦你用mindmanagement,首先把你的整個(gè)思路整理出來(lái),然后根據(jù)分析不斷深入、得到的信息不斷增加的情況下去完善你的結(jié)構(gòu),慢慢你會(huì)形成一套自己的思想。
當(dāng)然有空的時(shí)候去看看《麥肯錫思維》、結(jié)構(gòu)化邏輯思維訓(xùn)練的書(shū)也不錯(cuò)。在我以為多看看你身邊更資深同事的報(bào)告,多問(wèn)問(wèn)他們是怎么去考慮這個(gè)問(wèn)題的,別人的思想是怎么樣的?他是怎么構(gòu)建整個(gè)分析體系的。
四、業(yè)務(wù)、行業(yè)、商業(yè)知識(shí)。當(dāng)你掌握好前面的基本知識(shí)和一些技巧性東西的時(shí)候,你應(yīng)該在業(yè)務(wù)、行業(yè)、商業(yè)知識(shí)的學(xué)習(xí)與積累上了。
這個(gè)放在最后,不是不重要,而且非常重要,如果前面三點(diǎn)是決定你能否進(jìn)入這個(gè)行業(yè),那么這則是你進(jìn)入這個(gè)行業(yè)后,能否成功的最根本的因素。 數(shù)據(jù)與具體行業(yè)知識(shí)的關(guān)系,比作池塘中魚(yú)與水的關(guān)系一點(diǎn)都不過(guò)分,數(shù)據(jù)(魚(yú))離開(kāi)了行業(yè)、業(yè)務(wù)背景(水)是死的,是不可能是“活”。
而沒(méi)有“魚(yú)”的水,更像是“死”水,你去根本不知道看什么(方向在哪)。如何提高業(yè)務(wù)知識(shí),特別是沒(méi)有相關(guān)背景的同學(xué)。
很簡(jiǎn)單,我總結(jié)了幾點(diǎn):1、多向業(yè)務(wù)部門的同事請(qǐng)教,多溝通。多向他們請(qǐng)教,數(shù)據(jù)分析師與業(yè)務(wù)部門沒(méi)有利益沖突,而更向是共生體,所以如果你態(tài)度好,相信業(yè)務(wù)部門的同事也很愿意把他們知道的告訴你。
2、永遠(yuǎn)不要忘記了google大神,定制一些行業(yè)的關(guān)鍵字,每天都先看看定制的郵件。3、每天有空去瀏。
分析大數(shù)據(jù),R語(yǔ)言和Linux系統(tǒng)比較有幫助,運(yùn)用到的方法原理可以翻翻大學(xué)的統(tǒng)計(jì)學(xué),不需要完全理解,重在應(yīng)用。
分析簡(jiǎn)單數(shù)據(jù),Excel就可以了。Excel本意就是智能,功能很強(qiáng),容易上手。我沒(méi)有見(jiàn)過(guò)有人說(shuō)自己精通Excel的,最多是熟悉Excel。Excel的函數(shù)可以幫助你處理大部分?jǐn)?shù)據(jù)。
數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。這一過(guò)程也是質(zhì)量管理體系的支持過(guò)程。在實(shí)用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當(dāng)行動(dòng)。
數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)在20世紀(jì)早期就已確立,但直到計(jì)算機(jī)的出現(xiàn)才使得實(shí)際操作成為可能,并使得數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析是數(shù)學(xué)與計(jì)算機(jī)科學(xué)相結(jié)合的產(chǎn)物。
“啤酒與尿布”的故事產(chǎn)生于20世紀(jì)90年代的美國(guó)沃爾瑪超市中,沃爾瑪?shù)某泄芾砣藛T分析銷售數(shù)據(jù)時(shí)發(fā)現(xiàn)了一個(gè)令人難于理解的現(xiàn)象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無(wú)關(guān)系的商品會(huì)經(jīng)常出現(xiàn)在同一個(gè)購(gòu)物籃中,這種獨(dú)特的銷售現(xiàn)象引起了管理人員的注意,經(jīng)過(guò)后續(xù)調(diào)查發(fā)現(xiàn),這種現(xiàn)象出現(xiàn)在年輕的父親身上。
在美國(guó)有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購(gòu)買尿布。父親在購(gòu)買尿布的同時(shí),往往會(huì)順便為自己購(gòu)買啤酒,這樣就會(huì)出現(xiàn)啤酒與尿布這兩件看上去不相干的商品經(jīng)常會(huì)出現(xiàn)在同一個(gè)購(gòu)物籃的現(xiàn)象。如果這個(gè)年輕的父親在賣場(chǎng)只能買到兩件商品之一,則他很有可能會(huì)放棄購(gòu)物而到另一家商店, 直到可以一次同時(shí)買到啤酒與尿布為止。沃爾瑪發(fā)現(xiàn)了這一獨(dú)特的現(xiàn)象,開(kāi)始在賣場(chǎng)嘗試將啤酒與尿布擺放在相同的區(qū)域,讓年輕的父親可以同時(shí)找到這兩件商品,并很快地完成購(gòu)物;而沃爾瑪超市也可以讓這些客戶一次購(gòu)買兩件商品、而不是一件,從而獲得了很好的商品銷售收入,這就是“啤酒與尿布” 故事的由來(lái)。
當(dāng)然“啤酒與尿布”的故事必須具有技術(shù)方面的支持。1993年美國(guó)學(xué)者Agrawal提出通過(guò)分析購(gòu)物籃中的商品集合,從而找出商品之間關(guān)聯(lián)關(guān)系的關(guān)聯(lián)算法,并根據(jù)商品之間的關(guān)系,找出客戶的購(gòu)買行為。艾格拉沃從數(shù)學(xué)及計(jì)算機(jī)算法角度提 出了商品關(guān)聯(lián)關(guān)系的計(jì)算方法——Aprior算法。沃爾瑪從上個(gè)世紀(jì) 90 年代嘗試將 Aprior 算 法引入到 POS機(jī)數(shù)據(jù)分析中,并獲得了成功,于是產(chǎn)生了“啤酒與尿布”的故事。
去百度文庫(kù),查看完整內(nèi)容>
內(nèi)容來(lái)自用戶:魏瓊妹
市場(chǎng)預(yù)測(cè)方法的選擇
據(jù)統(tǒng)計(jì),學(xué)者們提出的市場(chǎng)預(yù)測(cè)方法,已達(dá)150多種,這些方法均有其獨(dú)特的作用、特色與適用范圍,也郡有其不足與局限。實(shí)踐證明,預(yù)測(cè)的準(zhǔn)確性、科學(xué)性與可信性,在很大程度上取決于預(yù)測(cè)方法的選擇是否恰當(dāng)。人們?cè)谑袌?chǎng)預(yù)測(cè)的實(shí)際操作過(guò)程中發(fā)現(xiàn),在相同的條件下,不同的預(yù)測(cè)方法將會(huì)產(chǎn)生不同的預(yù)測(cè)結(jié)果。因此,預(yù)測(cè)方法的選擇是市場(chǎng)預(yù)測(cè)過(guò)程中極其重要的--個(gè)環(huán)節(jié)。企業(yè)在選擇預(yù)測(cè)方法時(shí),下述幾個(gè)因素必須要考慮。
(1)根據(jù)預(yù)測(cè)對(duì)象與目的的不同選擇預(yù)測(cè)方法
從行業(yè)角度看,大多數(shù)輕紡工業(yè)產(chǎn)品生命周期短,市場(chǎng)需求量大,通常宜進(jìn)行短期預(yù)測(cè)。機(jī)械工業(yè)或其他重工業(yè),產(chǎn)品生命周期長(zhǎng),價(jià)值昂貴而市場(chǎng)需求量不很大,加上市場(chǎng)的地域范圍比較遼闊,一般應(yīng)采用中、長(zhǎng)期預(yù)測(cè)。服裝、農(nóng)機(jī)等行業(yè)的銷售通常具有較強(qiáng)的季節(jié)性,就應(yīng)較為重視季節(jié)變動(dòng)量的預(yù)測(cè)。而各種專用設(shè)備、專用機(jī)械的制造廠,因其產(chǎn)品使用面比較窄,用戶比較明確,??刹捎孟嚓P(guān)的推算法進(jìn)行預(yù)測(cè)。
從產(chǎn)品的角度看,同一種產(chǎn)品處于生命周期的不同階段,市場(chǎng)特性和決策重點(diǎn)不同,市場(chǎng)預(yù)測(cè)也應(yīng)選用不同的方法。在產(chǎn)品研制階段,一般采用直觀預(yù)測(cè)法;在產(chǎn)品試銷階段,一般采用實(shí)驗(yàn)市場(chǎng)法和典型調(diào)查預(yù)測(cè)法;在產(chǎn)品暢銷期,需求量迅速上升時(shí),可采用線性或非線性回歸法,如果產(chǎn)品受季節(jié)變動(dòng)影響,還要考慮采用季節(jié)變動(dòng)預(yù)測(cè);在產(chǎn)品成熟階段,需求量一般處于穩(wěn)定狀態(tài),可采用簡(jiǎn)單平均法、加(3)根據(jù)數(shù)字資料的規(guī)
② 數(shù)據(jù)分析為了挖掘更多的問(wèn)題,并找到原因; ③ 不能為了做數(shù)據(jù)分析而坐數(shù)據(jù)分析。
2、步驟:① 調(diào)查研究:收集、分析、挖掘數(shù)據(jù) ② 圖表分析:分析、挖掘的結(jié)果做成圖表 3、常用方法: 利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁(yè)挖掘等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。 ①分類。
分類是找出數(shù)據(jù)庫(kù)中一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過(guò)分類模型,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購(gòu)買趨勢(shì)預(yù)測(cè)等,如一個(gè)汽車零售商將客戶按照對(duì)汽車的喜好劃分成不同的類,這樣營(yíng)銷人員就可以將新型汽車的廣告手冊(cè)直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機(jī)會(huì)。
②回歸分析。回歸分析方法反映的是事務(wù)數(shù)據(jù)庫(kù)中屬性值在時(shí)間上的特征,產(chǎn)生一個(gè)將數(shù)據(jù)項(xiàng)映射到一個(gè)實(shí)值預(yù)測(cè)變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問(wèn)題包括數(shù)據(jù)序列的趨勢(shì)特征、數(shù)據(jù)序列的預(yù)測(cè)以及數(shù)據(jù)間的相關(guān)關(guān)系等。
它可以應(yīng)用到市場(chǎng)營(yíng)銷的各個(gè)方面,如客戶尋求、保持和預(yù)防客戶流失活動(dòng)、產(chǎn)品生命周期分析、銷售趨勢(shì)預(yù)測(cè)及有針對(duì)性的促銷活動(dòng)等。 ③聚類。
聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購(gòu)買趨勢(shì)預(yù)測(cè)、市場(chǎng)的細(xì)分等。
④關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間所存在的關(guān)系的規(guī)則,即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)可導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。
在客戶關(guān)系管理中,通過(guò)對(duì)企業(yè)的客戶數(shù)據(jù)庫(kù)里的大量數(shù)據(jù)進(jìn)行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場(chǎng)營(yíng)銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價(jià)與定制客戶群,客戶尋求、細(xì)分與保持,市場(chǎng)營(yíng)銷與推銷,營(yíng)銷風(fēng)險(xiǎn)評(píng)估和詐騙預(yù)測(cè)等決策支持提供參考依據(jù)。 ⑤特征。
特征分析是從數(shù)據(jù)庫(kù)中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征。如營(yíng)銷人員通過(guò)對(duì)客戶流失因素的特征提取,可以得到導(dǎo)致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預(yù)防客戶的流失。
⑥變化和偏差分析。偏差包括很大一類潛在有趣的知識(shí),如分類中的反常實(shí)例,模式的例外,觀察結(jié)果對(duì)期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。
在企業(yè)危機(jī)管理及其預(yù)警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應(yīng)用到各種異常信息的發(fā)現(xiàn)、分析、識(shí)別、評(píng)價(jià)和預(yù)警等方面。
⑦Web頁(yè)挖掘。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:3.166秒