第六屆中國云計算大會于2014年5月20-23日在北京國家會議中心拉開帷幕。浪潮集團云計算技術總監(jiān)張東在大會上發(fā)表了演講“激活行業(yè)大數據:挑戰(zhàn)與解決之道”。他首先簡單介紹了當下大數據技術的應用情況,隨后張東立足應用挑戰(zhàn)和價值體現分享了行業(yè)大數據的幾個特點。他認為從云計算到大數據實際上是一條從我們把資源聚集到數據聚集到數據利用的一個完整路徑。

浪潮集團云計算技術總監(jiān) 張東
以下為演講實錄:
張東:
很高興連續(xù)幾年能夠有機會在這里跟各位專家、各位來賓一起來分享浪潮在云計算方面的一些理念和發(fā)展情況。在前面,我們也講過了很多浪潮對于云計算的理念,我們講行業(yè)云,我們在行業(yè)里面來推動中國的云計算發(fā)展,行業(yè)云如何落地,怎么一步一步走向大數據。
今年的主題是講云計算和大數據推動智慧中國。我今天要講的就是我們看到的從行業(yè)云到行業(yè)里的大數據,整個大數據的推廣和應用過程中存在的挑戰(zhàn),以及浪潮在這方面面向更多的行業(yè)推出了我們的大數據解決之道。
這是我們連續(xù)幾年都在講的一個發(fā)展路徑,我們從最早開始講浪潮的云計算戰(zhàn)略,云海戰(zhàn)略的時候,就在講云計算第一步只是把我們的資源能夠聚集起來,聚集起來的目的一方面是說我們云計算有云計算的好處,可以降低資源消耗,提高我們的資源利用率。但是,更多的我們是如何能夠將這些資源所承載的業(yè)務、所承載的數據,能夠把它聚集起來、把它融合起來,通過我們對數據的進一步挖掘和利用,從而推動我們的經濟和社會服務走向更高的高度。
所以,從這個意義上來講,我們認為從云計算到大數據實際上是一條從我們把資源聚集到數據聚集到數據利用的一個完整路徑。特別是在現在,我們云計算已經談了幾年了,很多的系統(tǒng)可能也建起來了,如何能夠真正實現在一個云里面實現數據間的融合,打破數據間的壁壘,可能就是現在這個階段要做的最重要的工作。
因此,對于數據來講,如果這些數據還像以前我們經常講的中國最大的問題就是信息孤島,所有的數據可能分散在不同的地方,有不同的格式、有不同的掌握,那么我們現在所談到的大數據的挖掘和應用就是沒有基礎的。
我們認為從數據的角度來看,可能跟云計算差不多,比如說云計算我們需要先做物理的集中、業(yè)務的集中和數據的融合,對數據挖掘來講,也是一開始我們有數據的那一小部分人,我可能有自己的數據,我去挖掘自己的數據,逐步到我如何實現不同用戶之間的數據相互交互,再到最后,真正意義上所有的大數據。
大數據之大不僅僅在于它的規(guī)模大,而是更多的說我這些數據來自不同的來源,可能有我自身產生的,也可能有外面很多比如說互聯(lián)網扒來的,或者是自媒體產生的。
行業(yè)發(fā)展三個階段,從組織內部進行數據的挖掘和應用,到組織內部不同業(yè)務模塊的數據共享和應用,一直到跨行業(yè)的數據應用。
應該說大數據現在也談了幾年,但是我們的感覺在互聯(lián)網領域,它的確很熱,可能在科學領域,很多專業(yè)數據的人也很熱心,但是相反在我們看到的這樣一些行業(yè)里,比如公安、工商、稅務等等,很多中國很重要的經濟部門和行業(yè)部門里面,實際上數據應用還面臨很多問題。
大數據行業(yè)特點
行業(yè)大數據的特點是什么呢?我們簡單總結了一個,可能跟我們一般意義上講的大數據略有不同的一些特點:
首先第一個是價值密度。 我們講大數據的幾個V的時候,大家都會講到價值密度,因為它數據來源復雜、數量量很大,價值密度可能比較低,需要更好的處理技術來處理。而我們認為在行業(yè)里面,它的價值密度可能會更高一點,因為它的數據采集往往都是有目的的,比如說我們在工商也好、稅務也好,它的數據可能就是針對它的業(yè)務采集的數據。針對這樣一些數據來進行挖掘,其實能夠產生更大更好的價值。
我們知道做任何事情大家可能都愿意去找最好處理、而且能夠快速看到收益的地方,比如說像水總是找下降最快的地方流。同樣在尋找這樣的機會時,我們也覺得在行業(yè)里面通過對它的大數據挖掘,能夠更好的發(fā)現這里面的一些機會,找到這里面的一些規(guī)律,能更好的為我們的經濟服務。