郴州檬山网络技术有限公司

技安電子大數(shù)據(jù)平臺解決方案

項目概述

根據(jù)集團信息化規(guī)劃,遵循“互聯(lián)網(wǎng)+”的理念,建設(shè)集團大數(shù)據(jù)平臺,實現(xiàn)集團數(shù)據(jù)資源的集中及整合,構(gòu)建集團統(tǒng)一的數(shù)據(jù)模型,提高企業(yè)數(shù)據(jù)的處理效率與共享程度。實現(xiàn)對集團企業(yè)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的分析挖掘,對內(nèi)對外提供數(shù)據(jù)服務(wù)。為全網(wǎng)提供決策支持、產(chǎn)品創(chuàng)新、交叉營銷、服務(wù)支撐、風(fēng)險管控以及流程優(yōu)化等支撐服務(wù)。

集團大數(shù)據(jù)平臺將在Hadoop和云計算等技術(shù)的基礎(chǔ)上,對金融大數(shù)據(jù)平臺、量收系統(tǒng)、生產(chǎn)系統(tǒng)、CRM系統(tǒng)、電商平臺、數(shù)據(jù)分析綜合服務(wù)平臺的歷史數(shù)據(jù)、數(shù)據(jù)模型、報表應(yīng)用等進(jìn)行移植,全面整合集團業(yè)務(wù)數(shù)據(jù)。數(shù)據(jù)來源涵蓋集團所有的生產(chǎn)和管理系統(tǒng),并可接入同業(yè)及相關(guān)市場甚至互聯(lián)網(wǎng)信息,建立從業(yè)務(wù)層到管理層到?jīng)Q策層的智能分析體系,模擬量化風(fēng)險和收益,實現(xiàn)對集團各種業(yè)務(wù)數(shù)據(jù)進(jìn)行分類、管理、統(tǒng)計和分析等功能,給各級管理人員提供各類準(zhǔn)確的統(tǒng)計分析預(yù)測數(shù)據(jù),使其能夠及時掌握全面的經(jīng)營狀況,為宏觀決策提供支持;為基層業(yè)務(wù)人員提供詳盡的數(shù)據(jù),供其對各自的工作目標(biāo)、當(dāng)前和歷史狀況進(jìn)行準(zhǔn)確的把握,對業(yè)務(wù)活動進(jìn)行有效支撐;滿足集團經(jīng)營管理及決策支持,建設(shè)國內(nèi)一流,世界領(lǐng)先的大數(shù)據(jù)平臺。

系統(tǒng)功能

統(tǒng)一運維監(jiān)

本方案提供統(tǒng)一的運維監(jiān)控服務(wù)。本方案涉及到的所有軟件的部署都通過Docker打包成鏡像文件,以便非??旖莸牟渴饘嵤?nèi)部系統(tǒng)通過鏡像數(shù)據(jù)接口交互層進(jìn)行交互。通過外部接口層納入集團運維平臺進(jìn)行統(tǒng)一監(jiān)控

Hadoop集群自動化部署

一站式大數(shù)據(jù)平臺提供集群自動化部署服務(wù)。用戶只需要安裝管理平臺軟件,就可以在友好的圖形化界面上安裝、部署、配置所需要的服務(wù)。整個安裝過程不需要用戶使用任何終端命令或者代碼。

平臺提供了強大的在線擴容功能,不需要宕機停庫,不需要停止業(yè)務(wù),就可以添加新的節(jié)點,實現(xiàn)擴容。節(jié)點添加完成之后可以立即對新添加的節(jié)點進(jìn)行角色的分配,一旦配置成功,則新加的節(jié)點就會馬上投入運算。擴容之后的數(shù)據(jù)節(jié)點也不需要停機進(jìn)行數(shù)據(jù)重分布,系統(tǒng)自動選擇空閑的時間進(jìn)行數(shù)據(jù)的重新分布。同時,擴容的操作可以方便的在界面進(jìn)行操作。

Hadoop集群性能監(jiān)控

平臺通過專門的監(jiān)控服務(wù)對集群的狀態(tài)進(jìn)行監(jiān)控,包括服務(wù)器CPU、內(nèi)存、網(wǎng)絡(luò)和磁盤的利用率和健康狀態(tài),以及分布式應(yīng)用系統(tǒng)的狀態(tài),并在故障發(fā)生或者某項指標(biāo)超過預(yù)設(shè)閥值時時提供告警功能。管理員可通過瀏覽器訪問集群的監(jiān)控和管理界面進(jìn)行日常的監(jiān)控和維護,系統(tǒng)提供圖標(biāo)信息展示。管理員可以便捷了解到集群的計算資源是否處于空閑狀態(tài)、哪些服務(wù)器的負(fù)載過高,甚至判斷集群的組網(wǎng)及機架安排是否合理等。管理員也可通過對各個節(jié)點的各個角色的日志信息進(jìn)行檢索,獲得更加精確的信息。

Hadoop集群資源管理

平臺提供計算任務(wù)管理和作業(yè)管理,包括作業(yè)的上傳、配置、啟動、停止、刪除和狀態(tài)查看等功能。

在平臺中,資源可以從多個方面進(jìn)行管理。從資源管理模塊的層面,用戶通過配置不同的Scheduler來定義不一樣的資源使用策略,目前支持FIFO Scheduler、Fair Scheduler以及Capacity Scheduler,實現(xiàn)作業(yè)動態(tài)調(diào)整,支持對任務(wù)系統(tǒng)資源占用進(jìn)行實時調(diào)配,改變作業(yè)調(diào)度優(yōu)先級等操作。

與集團運維監(jiān)控平臺對接

通過集群監(jiān)控系統(tǒng)向集團運維監(jiān)控平臺發(fā)送監(jiān)控消息,提供對接接口,實現(xiàn)大數(shù)據(jù)平臺與集團運維監(jiān)控平臺的互通,實現(xiàn)統(tǒng)一監(jiān)控。

平臺通過專門的監(jiān)控服務(wù)對集群的狀態(tài)進(jìn)行監(jiān)控,包括服務(wù)器CPU、內(nèi)存、網(wǎng)絡(luò)和磁盤的利用率和健康狀態(tài),以及分布式應(yīng)用系統(tǒng)的狀態(tài),并在故障發(fā)生或者某項指標(biāo)超過預(yù)設(shè)閥值時提供告警功能。管理員可通過瀏覽器訪問集群的監(jiān)控和管理界面進(jìn)行日常的監(jiān)控和維護,系統(tǒng)提供圖表信息展示。管理員可以便捷的了解到集群的計算資源是否處于空閑狀態(tài)、哪些服務(wù)器的負(fù)載過高,甚至判斷集群的組網(wǎng)及機架安排是否合理等。管理員也可通過對各個節(jié)點的各個角色的日志信息進(jìn)行檢索,獲得更加精確的信息。

作業(yè)調(diào)度管理

平臺提供功能完整,性能優(yōu)異的ETL框架支持平臺建設(shè),針對數(shù)據(jù)的預(yù)處理,中間的轉(zhuǎn)換清洗,包括寫入目標(biāo)時針對異常數(shù)據(jù)的捕獲。整個過程由平臺提供的調(diào)度平臺,元數(shù)據(jù)管理平臺提供支撐,讓各部分之間緊密合作,又各司其職。

針對此項目復(fù)雜的業(yè)務(wù)系統(tǒng)和管理,平臺提供完善的調(diào)度功能,以更好的對各個模塊進(jìn)行良好調(diào)度管理。 

調(diào)度平臺是平臺的數(shù)據(jù)流核心,調(diào)度平臺讓相關(guān)的業(yè)務(wù)系統(tǒng)、處理系統(tǒng)按照一定的業(yè)務(wù)邏輯,在客戶的安排下,像流水線一樣,或串行,或并行,按照一定的依賴關(guān)系,在每日,每周定時觸發(fā),依次執(zhí)行。平臺提供完善的接口和管理模塊,讓眾多的作業(yè)管理簡易高效。

數(shù)據(jù)分析與發(fā)掘

本方案提供的大數(shù)據(jù)平臺支持多種環(huán)境,以便于后續(xù)進(jìn)行多種數(shù)據(jù)分析與挖掘,并提供多個接口對數(shù)據(jù)進(jìn)行導(dǎo)出,以便于客戶在體外進(jìn)行數(shù)據(jù)分析;也提供數(shù)據(jù)沙盤給特定的數(shù)據(jù)分析師進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)沙盤也提供多個數(shù)據(jù)以及產(chǎn)品接口,以便于進(jìn)行數(shù)據(jù)探索。

本方案的平臺采用Hadoop平臺,它本身是一個并發(fā)存儲、并發(fā)計算的高效平臺,選用了 Discover的挖掘模塊,它是在對開源的R全面支持的基礎(chǔ)上,結(jié)合SparkR進(jìn)行了代碼的重大改造。并對常用的R算法進(jìn)行了并行化改造,這些改造正是基于大數(shù)據(jù)中關(guān)鍵的體量巨大這個維度進(jìn)行的優(yōu)化。之前的數(shù)據(jù)挖掘由于在單機上進(jìn)行,而由于數(shù)據(jù)挖掘需要對數(shù)據(jù)進(jìn)行大量的衍生和關(guān)聯(lián)運算,會讓待分析的數(shù)據(jù)集積聚擴大,因而很多數(shù)據(jù)挖掘針對海量數(shù)據(jù)只能采用抽樣的策略進(jìn)行模型訓(xùn)練,讓挖掘效果受到很大影響。在并發(fā)R算法的支撐下,只要節(jié)點數(shù)足夠,原則上可以處理任意體量的數(shù)據(jù)。

數(shù)據(jù)展現(xiàn)

平臺支持R、ANSI SQL、Python、Java、C/C++等語言,采用B/S架構(gòu),提供圖形化界面操作支持,操作界面支持簡體中文。支持多數(shù)據(jù)來源輸入輸出提供表格、圖形、地圖等可視化元素展示功能,將提供以下相關(guān)功能和特性:

標(biāo)準(zhǔn)企業(yè)報表,固定報表等。

參數(shù)驅(qū)動報表,各種基于參數(shù)的報表。

周期性報表,例如周報,月報,季報等,系統(tǒng)支持管理員定義周期性運行,亦支持業(yè)務(wù)用戶自定義重復(fù)運行方式,用戶或管理員可以定義輸出格式,包括PDF,Excel,Word,PPT等各種格式;系統(tǒng)同時提供基于事件的觸發(fā)方式。

支持鉆取功能,提供基于事件的腳本控制能力,以滿足各種復(fù)雜報表需求。

復(fù)雜中國式報表,包括中國式表頭、復(fù)雜布局、特殊功能等各種能力。

提供豐富的圖形展現(xiàn)功能,支持包括餅圖、條形、線形、儀表盤、趨勢圖及各種圖形;支持Flash圖形。

支持報表導(dǎo)出到Excel、Word、PPT、HTML和PDF等格式,導(dǎo)出時可以選擇導(dǎo)出整個報表還是部分內(nèi)容;系統(tǒng)支持導(dǎo)出數(shù)據(jù)快照,以便日后審計等。

支持將報表導(dǎo)出成原生Excel,報表中的圖形(非Flash)能導(dǎo)出為原生Excel圖形,能夠在導(dǎo)出后的Excel中進(jìn)一步編輯,支持導(dǎo)出Excel公式,透視表等。

提供數(shù)據(jù)導(dǎo)出功能,用戶能將所查看的報表中數(shù)據(jù)進(jìn)行有選擇的導(dǎo)出。

提供報表版本管理能力,為不同的執(zhí)行結(jié)果保留不同的版本。

提供基于角色和用戶的權(quán)限控制,管理員可以為不同的角色和用戶設(shè)置相應(yīng)的功能選項及權(quán)限。

多語言多時區(qū)支持,系統(tǒng)為不用語言環(huán)境用戶提供多語言支持,用戶在登錄時可以選擇時區(qū)及語言,系統(tǒng)將自動切換至相應(yīng)的UI(僅限UI)。


中山市| 崇左市| 灵武市| 舞钢市| 修武县| 星子县| 阳泉市| 儋州市| 靖宇县| 敦煌市| 岚皋县| 东源县| 台安县| 礼泉县| 通榆县| 永川市| 宽城| 霍州市| 当涂县| 罗甸县| 保德县| 景东| 凤山市| 晋城| 昌黎县| 湛江市| 上栗县| 塔河县| 淳安县| 汾西县| 图木舒克市| 喀什市| 电白县| 大连市| 甘孜| 遂宁市| 尚义县| 新化县| 凌云县| 富锦市| 北海市|