1,什么是大數(shù)據(jù)
簡(jiǎn)單說(shuō),大數(shù)據(jù)一般指數(shù)據(jù)多(一般多到人類(lèi)要很費(fèi)勁很費(fèi)勁才能用計(jì)算機(jī)過(guò)一遍),而且常常不僅多,其中還大部分都沒(méi)什么價(jià)值……大數(shù)據(jù)技術(shù)就是從這些大部分都沒(méi)用的數(shù)據(jù)里找出有用的東西的技術(shù)?,F(xiàn)在的發(fā)展,可能技術(shù)層面上談不上有什么巨大的,算法似乎還是那些算法,只是應(yīng)用層面上比較熱乎,所以大家經(jīng)常都愿意來(lái)談一談。一個(gè)詞變熱乎,經(jīng)常并不是因?yàn)榧夹g(shù)突破,而是因?yàn)橛^念突破,是其中蘊(yùn)含的商業(yè)價(jià)值受到了產(chǎn)業(yè)界廣泛的接受、認(rèn)可和重視。大數(shù)據(jù)面臨的主要問(wèn)題(和挑戰(zhàn))是規(guī)模大到一定程度之后,“小數(shù)據(jù)”時(shí)可以輕松處理的問(wèn)題常常會(huì)一下子變得寸步難行,于是各種工程上的決策往往都必須精打細(xì)算。以前“小數(shù)據(jù)”常常只關(guān)心算法的數(shù)量級(jí)就行,而大數(shù)據(jù)開(kāi)始必須關(guān)心算法的時(shí)間常數(shù)(因?yàn)榘肽旰鸵荒瓿3S斜举|(zhì)區(qū)別)、通訊復(fù)雜度(因?yàn)榫W(wǎng)絡(luò)和硬盤(pán)經(jīng)常太慢了)、以及是否能有效并行(因?yàn)樘砑訖C(jī)器數(shù)量常常是最容易的事情)。于是凡是常數(shù)太大的,通訊復(fù)雜度太大的,或者不能有效并行的算法,想要用在大數(shù)據(jù)上,常常必須重新設(shè)計(jì)。目前國(guó)內(nèi)有不錯(cuò)的大數(shù)據(jù)工具,比如,大數(shù)據(jù)魔鏡,一款很實(shí)用的大數(shù)據(jù)可視化分析工具。
2,大數(shù)據(jù)是指什么如何解釋
大數(shù)據(jù)(big data),或稱(chēng)巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。(在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》中,大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)的方法)大數(shù)據(jù)的4V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、veracity(真實(shí)性)。大數(shù)據(jù)需要特殊的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展的存儲(chǔ)系統(tǒng)。 大數(shù)據(jù)的4個(gè)“V”,或者說(shuō)特點(diǎn)有四個(gè)層面:第一,數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別;第二,數(shù)據(jù)類(lèi)型繁多。前文提到的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,數(shù)據(jù)的來(lái)源,直接導(dǎo)致分析結(jié)果的準(zhǔn)確性和真實(shí)性。若數(shù)據(jù)來(lái)源是完整的并且真實(shí),最終的分析結(jié)果以及決定將更加準(zhǔn)確。第四,處理速度快,1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。業(yè)界將其歸納為4個(gè)“V” 從某種程度上說(shuō),大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡(jiǎn)言之,從各種各樣類(lèi)型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù)。明白這一點(diǎn)至關(guān)重要,也正是這一點(diǎn)促使該技術(shù)具備走向眾多企業(yè)的潛力。搜索下各種百科,上面都有。說(shuō)白了,就是數(shù)據(jù)量非常龐大。這確實(shí)是近幾年的熱點(diǎn)問(wèn)題。
大數(shù)據(jù)就是指很多的相對(duì)全面的數(shù)據(jù)。相對(duì)原來(lái)的統(tǒng)計(jì)辦法(抽樣統(tǒng)計(jì)),目前由于計(jì)算機(jī)網(wǎng)絡(luò)通信技術(shù)的發(fā)展,和個(gè)人數(shù)據(jù)終端(如手機(jī))的普及,使得統(tǒng)計(jì)可以基于更大范圍更完整的數(shù)據(jù)基礎(chǔ)上進(jìn)行。能從大量數(shù)據(jù)中找出特定需求,公眾偏好等規(guī)律,服務(wù)于政治、經(jīng)濟(jì)、生活。
3,大數(shù)據(jù)是什么意思有什么用途
大數(shù)據(jù)是統(tǒng)計(jì)學(xué)中的,用于指導(dǎo)人們的商業(yè)行為、戰(zhàn)略覺(jué)策、未來(lái)預(yù)期的一種分析處理方法。主要有以下三點(diǎn)作用:第一,對(duì)大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)點(diǎn)。移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、數(shù)字家庭、電子商務(wù)等是新一代信息技術(shù)的應(yīng)用形態(tài),這些應(yīng)用不斷產(chǎn)生大數(shù)據(jù)。云計(jì)算為這些海量、多樣化的大數(shù)據(jù)提供存儲(chǔ)和運(yùn)算平臺(tái)。通過(guò)對(duì)不同來(lái)源數(shù)據(jù)的管理、處理、分析與優(yōu)化,將結(jié)果反饋到上述應(yīng)用中,將創(chuàng)造出巨大的經(jīng)濟(jì)和社會(huì)價(jià)值。第二,大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長(zhǎng)的新引擎。面向大數(shù)據(jù)市場(chǎng)的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會(huì)不斷涌現(xiàn)。在硬件與集成設(shè)備領(lǐng)域,大數(shù)據(jù)將對(duì)芯片、存儲(chǔ)產(chǎn)業(yè)產(chǎn)生重要影響,還將催生一體化數(shù)據(jù)存儲(chǔ)處理服務(wù)器、內(nèi)存計(jì)算等市場(chǎng)。在軟件與服務(wù)領(lǐng)域,大數(shù)據(jù)將引發(fā)數(shù)據(jù)快速處理分析、數(shù)據(jù)挖掘技術(shù)和軟件產(chǎn)品的發(fā)展。第三,大數(shù)據(jù)利用將成為提高核心競(jìng)爭(zhēng)力的關(guān)鍵因素。各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動(dòng)” 轉(zhuǎn)變“數(shù)據(jù)驅(qū)動(dòng)”。
“大數(shù)據(jù)”是指以多元形式,自許多來(lái)源搜集而來(lái)的龐大數(shù)據(jù)組,往往具有實(shí)時(shí)性。在企業(yè)對(duì)企業(yè)銷(xiāo)售的情況下,這些數(shù)據(jù)可能得自社交網(wǎng)絡(luò)、電子商務(wù)網(wǎng)站、顧客來(lái)訪紀(jì)錄,還有許多其他來(lái)源。這些數(shù)據(jù),并非公司顧客關(guān)系管理數(shù)據(jù)庫(kù)的常態(tài)數(shù)據(jù)組。大數(shù)據(jù)的應(yīng)用其實(shí)早已滲透到人們生活中的方方面面:亞馬遜運(yùn)用大數(shù)據(jù)為客戶(hù)推薦商品信息,阿里用大數(shù)據(jù)成立了小微金融服務(wù)集團(tuán),而谷歌更是計(jì)劃用大數(shù)據(jù)接管世界??當(dāng)下,很多行業(yè)都開(kāi)始增加對(duì)大數(shù)據(jù)的需求。大數(shù)據(jù)時(shí)代不僅處理著海量的數(shù)據(jù),同時(shí)也加工、傳播、分享它們。不知不覺(jué)中,數(shù)據(jù)可視化已經(jīng)遍布我們生活的每一個(gè)角落,畢竟普通用戶(hù)往往更關(guān)心結(jié)果的展示。伴隨去年底百度地圖采用LBS定位春運(yùn)的可視化大數(shù)據(jù),就引起了學(xué)界對(duì)新聞創(chuàng)新和大數(shù)據(jù)可視化的熱議。就拿我們手中的智能手機(jī)來(lái)說(shuō)吧,它既是一款數(shù)據(jù)采集工具,同時(shí)也是一個(gè)多媒體的數(shù)據(jù)可視化展示平臺(tái);現(xiàn)在的新聞播報(bào)也越來(lái)越多的用到數(shù)據(jù)圖表,動(dòng)態(tài)演示且立體化的呈現(xiàn)報(bào)道內(nèi)容;影視劇和電子游戲頻繁出現(xiàn)的數(shù)據(jù)可視化元素,無(wú)疑讓作品的科技與未來(lái)感更加豐滿(mǎn);教育與科普方面則是數(shù)據(jù)可視化更大的應(yīng)用領(lǐng)域,人們開(kāi)始對(duì)單調(diào)保守的講述方式失去興趣,期待更加直觀、高效的信息呈現(xiàn)形式,數(shù)據(jù)可視化正好彌補(bǔ)了這項(xiàng)需求。在智能手機(jī)、平板電腦和車(chē)載電腦等平臺(tái)日漸普及的當(dāng)下,新的交互手段將會(huì)成為數(shù)據(jù)可視化的趨勢(shì)。我們公司正在使用夢(mèng)蝶數(shù)據(jù),不懂網(wǎng)絡(luò)爬蟲(chóng)技術(shù),也能輕松操作,方便快捷運(yùn)行爬蟲(chóng),進(jìn)行數(shù)據(jù)采集
大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長(zhǎng)的新引擎。面向大數(shù)據(jù)市場(chǎng)的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會(huì)不斷涌現(xiàn)。在硬件與集成設(shè)備領(lǐng)域,大數(shù)據(jù)將對(duì)芯片、存儲(chǔ)產(chǎn)業(yè)產(chǎn)生重要影響,還將催生一體化數(shù)據(jù)存儲(chǔ)處理服務(wù)器、內(nèi)存計(jì)算等市場(chǎng)。
隨著大數(shù)據(jù)這樣一個(gè)名詞進(jìn)入我們的視線,很多人都對(duì)大數(shù)據(jù)技術(shù)又愛(ài)又恨,那現(xiàn)在大數(shù)據(jù)都有什么用呢?我先來(lái)說(shuō)一下,大家普遍都熟悉的一件事——?dú)⑹?。這個(gè)事大家應(yīng)該都聽(tīng)說(shuō)過(guò)吧,其實(shí)這個(gè)事件就是不正當(dāng)利用大數(shù)據(jù)的典型,通過(guò)爬取消費(fèi)者的記錄,來(lái)進(jìn)行價(jià)格的相對(duì)調(diào)整。再有就是經(jīng)過(guò)數(shù)據(jù)爬取、分析然后推送比較符合個(gè)人口味的消息,這個(gè)也是大數(shù)據(jù)的作用之一。當(dāng)然了,大數(shù)據(jù)有多少弊,站在對(duì)立方的面就有多廣,畢竟生活還需要正能量的東西,大數(shù)據(jù)技術(shù)主要還包括以下作用:第一,對(duì)大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)點(diǎn)。移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、數(shù)字家庭、電子商務(wù)等是新一代信息技術(shù)的應(yīng)用形態(tài),這些應(yīng)用不斷產(chǎn)生大數(shù)據(jù)。云計(jì)算為這些海量、多樣化的大數(shù)據(jù)提供存儲(chǔ)和運(yùn)算平臺(tái)。通過(guò)對(duì)不同來(lái)源數(shù)據(jù)的管理、處理、分析與優(yōu)化,將結(jié)果反饋到上述應(yīng)用中,將創(chuàng)造出巨大的經(jīng)濟(jì)和社會(huì)價(jià)值。第二,大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長(zhǎng)的新引擎。面向大數(shù)據(jù)市場(chǎng)的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會(huì)不斷涌現(xiàn)。在硬件與集成設(shè)備領(lǐng)域,大數(shù)據(jù)將對(duì)芯片、存儲(chǔ)產(chǎn)業(yè)產(chǎn)生重要影響,還將催生一體化數(shù)據(jù)存儲(chǔ)處理服務(wù)器、內(nèi)存計(jì)算等市場(chǎng)。在軟件與服務(wù)領(lǐng)域,大數(shù)據(jù)將引發(fā)數(shù)據(jù)快速處理分析、數(shù)據(jù)挖掘技術(shù)和軟件產(chǎn)品的發(fā)展。第三,大數(shù)據(jù)利用將成為提高核心競(jìng)爭(zhēng)力的關(guān)鍵因素。各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動(dòng)” 轉(zhuǎn)變“數(shù)據(jù)驅(qū)動(dòng)”。大數(shù)據(jù)是大量、高速、多變的信息,它需要新型的處理方式去促成更強(qiáng)的決策能力、洞察力與最佳化處理。大數(shù)據(jù)為企業(yè)獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。
什么是大數(shù)據(jù)大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。 大數(shù)據(jù)對(duì)企業(yè)的幫助1.幫企業(yè)進(jìn)行消費(fèi)者的需求分析現(xiàn)在的消費(fèi)者不再是營(yíng)銷(xiāo)產(chǎn)品的被動(dòng)接收器。通過(guò)大數(shù)據(jù)幫助企業(yè)找準(zhǔn)消費(fèi)者的需求點(diǎn)設(shè)計(jì)產(chǎn)品,刺激消費(fèi)。2.幫企業(yè)挖掘鎖定客戶(hù)資源通過(guò)大數(shù)據(jù)技術(shù),可以實(shí)現(xiàn)企業(yè)的客戶(hù)資源進(jìn)行精準(zhǔn)的鎖定,形成可視化圖片展示,有利于企業(yè)產(chǎn)品的營(yíng)銷(xiāo)推廣的區(qū)域性。3.幫企業(yè)危機(jī)預(yù)警當(dāng)代社會(huì),輿情危機(jī)的爆發(fā)和擴(kuò)散。企業(yè)潛在的質(zhì)量問(wèn)題、安全問(wèn)題、經(jīng)濟(jì)問(wèn)題、市場(chǎng)問(wèn)題等在一定條件下一旦爆發(fā);危機(jī)效應(yīng)將瞬間傳遞開(kāi)來(lái),對(duì)企業(yè)的商譽(yù)和品牌造成極大的傷害,而大數(shù)據(jù)可以幫助企業(yè)進(jìn)行輿情監(jiān)控防止給企業(yè)造成巨大的損失。大數(shù)據(jù)對(duì)政府城市管理的幫助1.大數(shù)據(jù)應(yīng)用于城市規(guī)劃城市的不斷發(fā)展催生了不同的功能區(qū)域,如文教、商業(yè)和住宅區(qū)等。準(zhǔn)確掌握這些區(qū)域的分布對(duì)制定合理的城市規(guī)劃有著極其重要的意義。由于一個(gè)區(qū)域的功能并不是單一的,如在科學(xué)文教區(qū)里仍然有飯店和商業(yè)設(shè)施的存在,一個(gè)區(qū)域需要由一個(gè)功能的分布來(lái)表達(dá)(如70%的功能為商業(yè),20%的功能為住宅,剩余的為教育)。另一方面,一個(gè)區(qū)域的主要功能是文教,但也不代表該區(qū)域的任何一個(gè)地點(diǎn)都服務(wù)于文教。因此,給定一種功能,我們希望知道它的核心區(qū)域所在。以北京市通州和順義的職住比(職業(yè)人數(shù)與居住人數(shù)比)來(lái)舉例:作為北京著名的“睡城”,通州給人的印象往往是“遍地樓盤(pán)”“上班族天天候鳥(niǎo)式往返”;而順義區(qū)依托首都機(jī)場(chǎng)周邊的工業(yè)區(qū),帶來(lái)大量就業(yè)機(jī)會(huì),看起來(lái)似乎通州的職住比要遠(yuǎn)低于順義。然而,數(shù)據(jù)卻顯示,兩個(gè)地方的職住比幾乎持平。因此,有了大數(shù)據(jù),規(guī)劃者和決策者可以避免很多“印象流”的誤區(qū)。2.大數(shù)據(jù)應(yīng)用于城市應(yīng)急管理大數(shù)據(jù)在應(yīng)急管理中的應(yīng)用方式分為兩部分:大數(shù)據(jù)技術(shù)和大數(shù)據(jù)思維。大數(shù)據(jù)技術(shù)既包括諸如數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市和數(shù)據(jù)可視化等舊技術(shù),也包括云存儲(chǔ)和云計(jì)算等新技術(shù);而大數(shù)據(jù)思維則是從海量數(shù)據(jù)中發(fā)現(xiàn)問(wèn)題,用全樣本的思維來(lái)思考問(wèn)題,形成了模糊化、相關(guān)性和整體化的考慮方式。大數(shù)據(jù)技術(shù)與思維相互融合和作用,共同形成了大數(shù)據(jù)的應(yīng)用,并對(duì)包括應(yīng)急管理在內(nèi)的很多公共管理領(lǐng)域產(chǎn)生了巨大影響。以疾病預(yù)防為例:大數(shù)據(jù)的使用可以將用戶(hù)的每日數(shù)據(jù)輸入到醫(yī)療數(shù)據(jù)系統(tǒng),通過(guò)對(duì)匹配病原情況的數(shù)據(jù)篩查,可以準(zhǔn)確的找到感染群體、規(guī)模、特征,同時(shí)可以快速調(diào)去處置方法,達(dá)到應(yīng)急管理的重要目標(biāo)。