安全防護(hù)層層加碼养铸,新一代耐用戰(zhàn)神 OPPO A5 Pro 正式開售
機(jī)器學(xué)習(xí)與預(yù)測(cè)分析:未來企業(yè)提升競爭優(yōu)勢(shì)的利器
正確的機(jī)器學(xué)習(xí)策略博秫,將有助于企業(yè)在競爭中取得領(lǐng)先潦牛、降低成本、進(jìn)而成功達(dá)到目標(biāo)挡育。
編者按:本文由 Rocket Café 火箭科技評(píng)論授權(quán)深圳灣發(fā)布巴碗,本文作者 Ronald van Loon,獲 Onalytica即寒、Data Science Central, Klout, Dataconomy 等網(wǎng)站列為全球在資料科學(xué)橡淆、大數(shù)據(jù)、預(yù)測(cè)分析母赵、以及商業(yè)智慧等領(lǐng)域最具影響力的專家之一逸爵,作品散見于經(jīng)濟(jì)學(xué)人、Datafloq 凹嘲、Data Science Central 等專業(yè)媒體师倔。Rocket Café 已獲得作者親自授權(quán)編譯作品。
對(duì)于想在現(xiàn)今市場上占一席之地的企業(yè)而言周蹭,預(yù)測(cè)資料分析(Predictive data analytics)與機(jī)器學(xué)習(xí)(machine learning)都將是不可或缺的能力趋艘;正確的機(jī)器學(xué)習(xí)策略,將有助于企業(yè)在競爭中取得領(lǐng)先凶朗、降低成本瓷胧、進(jìn)而成功達(dá)到目標(biāo)。
在這兩方面取得優(yōu)勢(shì)的前提包括:
大數(shù)據(jù)
首先是有效的大數(shù)據(jù)分析俱尼;所謂大數(shù)據(jù)抖单,指的是分析極為大量的相關(guān)資料萎攒,并從其中找出行為模式或趨勢(shì)遇八,以便讓企業(yè)改善與顧客之間的關(guān)系、并且提升產(chǎn)和效率耍休。
快速的資料分析
以即時(shí)方式進(jìn)行大數(shù)據(jù)分析刃永,有助于預(yù)先鎖定并解決顧客關(guān)系、信息安全羊精、以及其他多種問題斯够。
此外囚玫,如果結(jié)合大數(shù)據(jù)方法、快速資料分析读规、以及人工智能技術(shù)抓督,將能更進(jìn)一步應(yīng)對(duì)各種挑戰(zhàn)、甚至預(yù)測(cè)并阻絕可能發(fā)生的錯(cuò)誤束亏。
機(jī)器學(xué)習(xí)
那么铃在,所謂「機(jī)器學(xué)習(xí)」又是什么、對(duì)企業(yè)又有什么好處呢碍遍?
機(jī)器學(xué)習(xí)是人工智能之中的一門學(xué)問定铜,它讓電腦即使沒有大量預(yù)先寫好的程式,也能具備學(xué)習(xí)能力怕敬;也就是說揣炕,電腦可以透過累積「經(jīng)驗(yàn)」、以及自動(dòng)搜尋資料东跪,來發(fā)掘出事物的進(jìn)行模式與趨勢(shì)畸陡。過去,電腦只能將這些分析后的信息提供給人類虽填,由人類來解讀和運(yùn)用罩锐;但現(xiàn)在電腦自己也可以使用這些分析結(jié)果,來改變本身的行為卤唉。
那么涩惑,這一點(diǎn)對(duì)企業(yè)有什么用處?
機(jī)器學(xué)習(xí)可以運(yùn)用在諸如醫(yī)療桑驱、汽車竭恬、金融服務(wù)、云端運(yùn)算熬的、以及其他許多產(chǎn)業(yè)之中痊硕,讓相關(guān)的企業(yè)和專業(yè)人士得以提升下列這些工作的效率和品質(zhì):
- 影像分類與內(nèi)容偵測(cè)
- 詐騙偵測(cè)
- 臉部偵測(cè)與辨識(shí)
- 影像辨識(shí)與標(biāo)示
- 大數(shù)據(jù)模式偵測(cè)
- 網(wǎng)絡(luò)入侵偵測(cè)
- 特定目標(biāo)廣告
- 游戲
- 支票處理
- 電腦伺服器監(jiān)控
在以上這些領(lǐng)域的原始資料中,無論規(guī)模大小押框,其實(shí)都隱藏了許多不同的模式與深度信息岔绸;而企業(yè)組織如果能善用機(jī)器學(xué)習(xí)功能,就可以更快的找到未來的趨勢(shì)和行為模式橡伞,并且運(yùn)用在許多研究上盒揉,例如:
- 基因定序
- 汽車行車安全
- 石油礦藏探勘
舉例來說,英特爾(Intel)近年來開發(fā)了不少函式庫和參考架構(gòu)兑徘,希望能擴(kuò)大機(jī)器學(xué)習(xí)的應(yīng)用刚盈、并且讓企業(yè)組織從中獲得效益方面的提升。根據(jù)最近由 Bain 顧問公司進(jìn)行的研究結(jié)果顯示挂脑,采用機(jī)器學(xué)習(xí)和分析技術(shù)的企業(yè):
- 以資料分析結(jié)果作為基礎(chǔ)的決策藕漱,可增加為 2 倍
- 決策速度比競爭對(duì)手更快的機(jī)率欲侮,可提升為 5 倍
- 上述決策的執(zhí)行速度,可加快為原來的 3 倍
- 獲得理想財(cái)務(wù)回報(bào)的機(jī)會(huì)肋联,增加為原來的 2 倍
· 機(jī)器學(xué)習(xí)能帶給企業(yè)更多競爭優(yōu)勢(shì)
預(yù)測(cè)資料分析與機(jī)器學(xué)習(xí)的背景
我們可以說威蕉,機(jī)器學(xué)習(xí)是資料分析方法的形式之一;但它的起源在哪里橄仍?又是如何發(fā)展成現(xiàn)在的樣子忘伞?
過去幾十年來,信息科技有著爆炸性的成長沙兰;1995 年氓奈,資料儲(chǔ)存的成本是每 GB 高達(dá) 1,000 美元,但 2014 年已經(jīng)掉到 0.03 美元鼎天。也因?yàn)槿绱艘蹋Y料科學(xué)家可以用更低的成本,來處理更多的信息斋射;同時(shí)育勺,神經(jīng)網(wǎng)路科技的發(fā)展,也讓資料分析和模型處理的精準(zhǔn)度得以更高罗岖。
如同前面提到的涧至,資料與分析方法的結(jié)合,可以為企業(yè)帶來更多機(jī)會(huì)桑包;目前機(jī)器學(xué)習(xí)技術(shù)已經(jīng)逐漸進(jìn)入主流南蓬,而下一步的發(fā)展,則是比過去的分析方法更上一層哑了、也更強(qiáng)大的預(yù)測(cè)分析能力赘方。
預(yù)測(cè)分析的發(fā)展路徑
預(yù)測(cè)分析能力讓企業(yè)不僅可以知道「剛剛發(fā)生什么事」,還可以知道「之后會(huì)發(fā)生什么事」弱左。
機(jī)器學(xué)習(xí)是預(yù)測(cè)分析的一部分窄陡,其中又包含「深度學(xué)習(xí)」、統(tǒng)計(jì)拆火、以及其他的機(jī)器學(xué)習(xí)技術(shù)跳夭;在深度學(xué)習(xí)方面,其中有許多不同層次的演算法们镜,讓機(jī)器能夠循序?qū)W習(xí)不同復(fù)雜程度的資料處理問題币叹。在統(tǒng)計(jì)和其他機(jī)器學(xué)習(xí)技術(shù)方面,則有其他的相關(guān)演算法憎账,來協(xié)助機(jī)器經(jīng)由范例資料來獲得學(xué)習(xí)和預(yù)估的能力套硼。
基本上卡辰,機(jī)器學(xué)習(xí)技術(shù)是以一組(或多組)資料來建立數(shù)學(xué)模型胞皱,進(jìn)而用模型來訓(xùn)練電腦的分析能力邪意;然后這些電腦再藉由分析更多資料來進(jìn)行預(yù)測(cè)、并且評(píng)估預(yù)測(cè)的結(jié)果反砌。
那么雾鬼,有哪些場合是適用機(jī)器學(xué)習(xí)技術(shù)的地方呢?
在許多領(lǐng)域中宴树,機(jī)器學(xué)習(xí)都??可以為使用者帶來競爭優(yōu)勢(shì)策菜;明顯的例子如:
- 還沒有人類專家的領(lǐng)域:例如最近對(duì)于冥王星的研究,有很大部分就依賴機(jī)器學(xué)習(xí)的成果酒贬;因?yàn)槟壳霸谶@方面還沒有真正的人類專家又憨。
- 人類無法自己解釋的能力或?qū)iL:我們是如何辨識(shí)另外一個(gè)人的聲音的?聲音辨識(shí)是一門很深的學(xué)問锭吨,但因?yàn)楸孀R(shí)聲音牽涉太多因素蠢莺,連我們自己都說不清楚是怎么辨認(rèn)出別人的聲音。
- 解決方法一直在改變的問題:在高速公路上零如,前一秒交通順暢躏将,但下一秒就出了車禍,把整條路都塞卓祭佟祸憋;所謂的「最佳路線」隨時(shí)都跟著周遭的狀況一直在改變。
- 每個(gè)案例都不同的解決方法:對(duì)于醫(yī)師來說肖卧,每個(gè)病例都是獨(dú)一無二的蚯窥;每位病人會(huì)過敏的藥物、癥狀塞帐、家庭病史都不同沟沙,治療的方法也都必須依照個(gè)別狀況來下判斷。
這些只是機(jī)器學(xué)習(xí)諸多運(yùn)用方式中的一些案例壁榕。
事實(shí)上矛紫,不僅對(duì)機(jī)器學(xué)習(xí)的需求正在增加,甚至已經(jīng)有了一個(gè)以未來機(jī)器學(xué)習(xí)軟體為核心的生態(tài)系正在持續(xù)發(fā)展牌里,讓企業(yè)組織可以享受到來自即時(shí)預(yù)測(cè)分析的效益颊咬。
· 正在逐漸演進(jìn)之中的機(jī)器學(xué)習(xí)軟體生態(tài)系。
在這個(gè)生態(tài)系中牡辽,英特爾已經(jīng)建構(gòu)了一個(gè)最廣為使用的機(jī)器學(xué)習(xí)平臺(tái)喳篇;其中使用的「Xeon」與「Xeon Phi」則是目前在大多數(shù)機(jī)器學(xué)習(xí)架構(gòu)之中,最具成本效益的處理器态辛。
導(dǎo)入機(jī)器學(xué)習(xí)的最大挑戰(zhàn)
企業(yè)在導(dǎo)入機(jī)器學(xué)習(xí)工具麸澜、以期能享受預(yù)測(cè)分析優(yōu)點(diǎn)的過程中,必須克服以下的幾個(gè)障礙:
- 了解究竟需要多少資料奏黑;
- 導(dǎo)入并使用目前的資料集炊邦;
- 聘用資料科學(xué)家编矾,以訂定最理想的機(jī)器學(xué)習(xí)策略;
- 了解新架構(gòu)的潛在需求馁害、或是直接使用目前的架構(gòu)窄俏。
如果能訂定適當(dāng)?shù)臋C(jī)器學(xué)習(xí)策略,其實(shí)導(dǎo)入的障礙并不算太高碘菜;而且凹蜈,如果考慮到它能降低的成本、以及提高的效率忍啸,就會(huì)發(fā)現(xiàn)其實(shí)不需要太長的時(shí)間就可以回本仰坦。
此外,領(lǐng)導(dǎo)廠商也正在協(xié)助建立一個(gè)容納開發(fā)者和資料科學(xué)家的社群计雌,以供不同領(lǐng)域的人士交換關(guān)于資料分析的觀念缎岗。透過這些信息的交換,企業(yè)將能更加了解預(yù)測(cè)分析和機(jī)器學(xué)習(xí)的無窮潛力白粉、并且從運(yùn)用這些技術(shù)之中獲益传泊。