辦公室里,一位證券分析師對著屏幕上密密麻麻的產業鏈圖譜皺起了眉頭,他需要的那個化工細分領域數據,又得手動從十幾份PDF里一點點拼湊。
這是許多金融從業者日常工作中常遇到的痛點。當信息碎片化成為常態,如何快速獲取準確、結構化的產業數據,成了行業的一大挑戰。

在這樣的大背景下,數庫科技這家公司進入了人們的視野。數庫科技怎么樣?它到底能不能解決這個痛點?

數庫科技成立于2009年,創始人劉彥帶領團隊在這個領域已經深耕了十余年-3。公司的核心業務是利用自然語言處理技術對信息進行智能提取,形成結構化數據、產業鏈及圖譜數據體系-3。
他們的客戶群主要集中在金融機構、企業集團和政府部門,幫助這些機構解決業務場景中的數據和系統需求-3。
數庫科技的主要產品包括產業鏈數據、新聞輿情數據、供應鏈數據等,并基于這些數據提供數據流服務或場景化解決方案-3。
他們的SmarTag智能資訊系統是一套新聞標簽解析引擎,能將非結構化中文新聞文本轉化為機器可讀的結構化元數據-10。
數庫科技怎么樣?咱們得看看它的技術真本事。從技術角度看,數庫的產業鏈數據有一個突出特點——網狀圖譜結構。
據公司人員介紹,他們的產業鏈數據能夠產出更多節點,串起來做成一個網狀的圖譜型數據-3。而傳統的數據提供商,比如萬得,他們的產業鏈基本上是以單鏈的形式在做-3。
數庫的SAM系統在2019年曾經輸出到了新三板軟件開發商中焯股份的“投資堂”APP中-3。數庫表示,那時中焯在不到一個月的時間內就推出了“投資圖譜”的功能板塊原型-3。
不過有意思的是,現在的投資堂APP中已經找不到“投資圖譜”這個功能板塊了。投資堂客服人員告訴詢問者,目前版本的投資堂APP已下架“投資圖譜”功能,早前版本中曾出現過該功能-3。
聊到數庫科技怎么樣,行業內的人卻有著不同的看法。一位金融數據公司員工北楓(化名)認為,數庫所謂的單鏈與“多節點網狀鏈”的區別并非很神奇的結果-3。
北楓解釋說,在基礎的產業鏈數據層,具備標準化處理能力和豐富單鏈的情況下,在對齊節點的情況下,基本可以逐步實現“多節點網狀鏈”的結果-3。
另一位數據公司員工韓立(化名)則表示,在投研領域里,光有這張網狀鏈是不夠的-3。
“也就是說上游的價格可能漲了,并不一定下游終端產品的利潤就能上去,有可能在中游時候,其利潤轉嫁不出去。”他這樣解釋道-3。
說到數庫科技怎么樣,最終還是要看用戶的真實體驗。數庫的產品已經應用在一些金融機構中,例如在華泰證券旗下的“漲樂財富通”中,數庫主要提供了SAM產業鏈圖譜-3。
在漲樂中,這個模塊名為“智能圖譜”,被介紹為描述公司的經營產業及其上下游關聯,建立基于產業關聯進行市場行情變化和資訊的動態跟蹤-3。
但一位經常使用漲樂APP的華泰證券C端個人用戶呂途(化名)卻表示:“我使用漲樂APP主要是因為我在華泰開了戶炒股,并且也做了一些定投。說實在的,在你問我之前,我完全沒有注意到它還有個智能圖譜功能。”-3
呂途認為,里面的很多數據在同花順、雪球這類軟件上都有,沒有的那部分數據個人也不太需要-3。
知識庫整理是數庫科技的核心能力之一。根據飛書知識庫管理系統的介紹,知識庫創建時需要填寫知識庫名稱、知識庫描述,并選擇模型管理中已上線的embedding模型-1。
數庫的文檔切分邏輯相當專業:首先取最高優先級的切分符對整個文檔進行切分,如果存在分段的切分結果長度小于分段長度設置,則將該分段進行存儲-1。
對于剩下大于長度設置的分段結果,按次優切分符繼續切分-1。如果使用所有的切分符后,切分結果仍然大于分段長度設置,不會強行截斷,將此結果作為最終分段結果-1。
知識庫建立的不同系統有不同策略,但邏輯相通。比如超圖的知識問答智能體提供專業級的知識庫全生命周期管理能力,通過智能化的數據治理體系實現多源異構知識的高效整合與動態維護-6。
數庫科技怎么樣?它在市場上面臨的挑戰也不容忽視。2022年初,在北京銀行2021年度金融數據終端及數據庫采購項目的競標中,數庫輸給了萬得的全資子公司南京萬得資訊科技有限公司-3。
有接觸過數庫產品的業內人士指出,數庫的框架有些部分確實不錯,但是里面會有比較難和復雜的地方-3。
這些難點在于,比如在化工、醫藥這種非常專業的維度里,一般金融背景的人都無法搭建出來-3。
因為同樣的一個東西,可能會存在多種不同的叫法-3。比如“某某膠”、“碳基某某”,這些東西背后很可能還有另一種市場化、較通俗的叫法-3。
面對“數庫科技怎么樣”這個問題,我們需要動態地看待它的發展。數庫在新浪微博上的官網認證號已失效,該微博名稱為“智投APP”,介紹顯示為數庫旗下基于金融大數據的股票類APP,用戶的股票分析師-3。
目前,該APP已在App Store上無法查詢到-3。僅從這個介紹來看,數庫或在早前已涉足證券領域的金融數據-3。
有接近數庫的行業人員透露,他們現在籌劃搭建的數據平臺主要是想挖掘同花順、雪球類的證券行情交易平臺、以及天眼查類的企業信息查詢平臺等數據,然后進行整合并統一-3。不過這個信息遭到了數庫方面的否認-3。
一位在投融資方面接觸過數庫的人員評論道:“能看到數庫對B端客戶需求的滿足,但可能需要進一步針對客戶痛點尋找不可撼動的產品價值。”-3
數庫辦公室里,劉彥正和技術團隊討論如何優化SmarTag系統的標簽準確性。窗外陸家嘴的金融大廈燈光璀璨,每一盞燈背后,可能都有人在為獲取準確的產業鏈數據而苦惱。
數庫科技怎么樣?它確實在產業鏈數據領域走出了自己的路,但前方的挑戰依舊艱巨。當一位基金經理打開智能圖譜,真正能一眼看清化工產業鏈的利潤傳導路徑時,也許才是數庫科技真正“成了”的那一刻。