資訊數(shù)據(jù)中心
整合券商使用的各類資訊數(shù)據(jù),對異構(gòu)源資訊數(shù)據(jù)進行自動化采集、抽取、挖掘,為業(yè)務部門提供高質(zhì)量、標準化的統(tǒng)一資訊數(shù)據(jù)模型,降低甄別數(shù)據(jù)成本,提高資訊應用效率,支持整合各類市場、行情、研報、新聞的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
建設目標
標準資訊數(shù)據(jù)庫
設計統(tǒng)一的資訊數(shù)據(jù)模型,通過全面、穩(wěn)定、合理的結(jié)構(gòu)存儲各類資訊數(shù)據(jù)。
資訊數(shù)據(jù)整合
整合外部、內(nèi)部各種類型的資訊數(shù)據(jù),對數(shù)據(jù)進行實時性、完整性、準確性等方面的多源交叉校驗。
標簽管理
支持豐富的標簽管理,包括行業(yè)、概念、事件、正負面等,支持通過管理界面維護標簽。
爬蟲系統(tǒng)
支持挖掘主流財經(jīng)網(wǎng)站各類資訊,覆蓋200+主流新聞源以及全部上市公司的公告。
方案價值

多年數(shù)據(jù)技術積累
有近二十年的基本面數(shù)據(jù)、爬蟲數(shù)據(jù)、另類數(shù)據(jù)的生產(chǎn)加工經(jīng)驗。

有效提升采集效率
支持自研ETC與開源TEC混合搭配,能夠極大的提升復雜咨詢數(shù)據(jù)的采集效率。

靈活校驗處理方式
可根據(jù)業(yè)務需求情況,靈活配置自動和手動校驗邏輯,節(jié)約成本、運維成本。

數(shù)據(jù)運營增值服務
提供高附加值的AI+人工數(shù)據(jù)代運營服務,支持定制數(shù)據(jù),使用更加省心便捷。
方案特點
智能化數(shù)據(jù)解析技術
NLP智能分詞及自訓技術,文章自動解析
統(tǒng)一化數(shù)據(jù)清洗、轉(zhuǎn)換、加工服務
基于元數(shù)據(jù)/中心庫管理體系和自研ETC提高處理效率
實時流失數(shù)據(jù)處理和分布部署
NLP智能分詞及自訓技術,文章自動解析
統(tǒng)一數(shù)據(jù)接口服務
提供標準TCP、WEB API接口,服務規(guī)范化管理

