引言
專利分析不但對(duì)發(fā)明人、中小企業(yè)、實(shí)驗(yàn)室、大學(xué)等知識(shí)創(chuàng)造者有極大的價(jià)值,而且對(duì)大企業(yè)、政府機(jī)構(gòu)也有極大的價(jià)值, 而且還可以指導(dǎo)企業(yè)通過(guò)自主研發(fā)部署專利, 在競(jìng)爭(zhēng)對(duì)手的核心技術(shù)網(wǎng)絡(luò)中秘密部署殺手锏,使企業(yè)在相關(guān)領(lǐng)域的競(jìng)爭(zhēng)中獲得有利的位置. 因此企業(yè)需要分析處理大量的專利信息(中國(guó),美國(guó),歐洲,日本等國(guó)家專利局的專利約1000萬(wàn))。專利信息量的迅速增長(zhǎng)以及查詢的復(fù)雜化,使傳統(tǒng)的OLTP(聯(lián)機(jī)事務(wù)處理)系統(tǒng)不能滿足對(duì)數(shù)據(jù)進(jìn)行深層次多維分析的要求,于是人們提出了數(shù)據(jù)倉(cāng)庫(kù)和OLAP(聯(lián)機(jī)分析處理)技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過(guò)程的,面向主題的、集成的、隨時(shí)間而變的、持久的數(shù)據(jù)集合,對(duì)分布在企業(yè)內(nèi)部各處的OLTP數(shù)據(jù)進(jìn)行抽取、凈化,為企業(yè)決策分析提供所需的基礎(chǔ)數(shù)據(jù) [1] 。OLAP則利用存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)完成快速、一致、交互的分析,然后以直觀的形式將分析結(jié)果返回給決策者。
在一個(gè)針對(duì)專利進(jìn)行決策分析的系統(tǒng)中,需要對(duì)專利信息進(jìn)行多維分析處理,并將分析結(jié)果以多維視圖的方式展現(xiàn)給決策者,企業(yè)決策者從而做出相應(yīng)的決策.因要求該系統(tǒng)具有對(duì)大量多維專利信息進(jìn)行快速分析的特點(diǎn),所以在此采用了數(shù)據(jù)倉(cāng)庫(kù)和OLAP技術(shù)作為專利信息處理系統(tǒng)的核心。
1 系統(tǒng)設(shè)計(jì)
開發(fā)基于數(shù)據(jù)倉(cāng)庫(kù)的OLAP系統(tǒng),一般有兩種方案:一是利用著名數(shù)據(jù)庫(kù)廠商現(xiàn)有數(shù)據(jù)倉(cāng)庫(kù)和OLAP產(chǎn)品(如:Oralce Express,DB2 OLAP等)來(lái)創(chuàng)建;二是利用開發(fā)工具將專利分析需求進(jìn)行多維化處理。第一種方案因只是在現(xiàn)有成熟產(chǎn)品上作二次開發(fā),所以能夠創(chuàng)建較完善的基于數(shù)據(jù)倉(cāng)庫(kù)的OLAP系統(tǒng),但不靈活,且費(fèi)用極其昂貴,所以在此,我們采用第二種方案,采用能處理大規(guī)模數(shù)據(jù)的ROLAP技術(shù),手動(dòng)構(gòu)建多維立方體,并構(gòu)造自己的OLAP多維引擎,以設(shè)計(jì)適合專利分析OLAP系統(tǒng)。
整個(gè)OLAP系統(tǒng),大致分為四層(如圖1所示):第一層是數(shù)據(jù)源,存儲(chǔ)了所有相關(guān)領(lǐng)域的專利信息,包括內(nèi)部和外部信息. 第二層是OLAP數(shù)據(jù)倉(cāng)庫(kù)層。源數(shù)據(jù)庫(kù)中的結(jié)構(gòu)未經(jīng)過(guò)系統(tǒng)化,其組織形式是面向具體應(yīng)用的。數(shù)據(jù)抽取程序?qū)⒃磾?shù)據(jù)按主題進(jìn)行歸納整理,存入OLAP數(shù)據(jù)庫(kù)中,提供適合OLAP分析的詳細(xì)、集成、準(zhǔn)確的客戶基礎(chǔ)數(shù)據(jù)。第三層是OLAP服務(wù)器層,保存了分析所需的客戶聚集數(shù)據(jù)和相關(guān)的元數(shù)據(jù),代理用戶的分析請(qǐng)求,獲取分析數(shù)據(jù)并返回給用戶。第四層是應(yīng)用層,這層讓用戶根據(jù)模型信息,提交分析請(qǐng)求,然后將獲得的數(shù)據(jù)按用戶所需要的方式展現(xiàn)。
圖1 OLAP服務(wù)器層結(jié)構(gòu)
OLAP服務(wù)器層是本系統(tǒng)的核心,其詳細(xì)結(jié)構(gòu)如圖1所示,主要由OLAP立方體計(jì)算和OLAP多維引擎兩大模塊組成.我們將詳細(xì)探討這兩方面的技術(shù)實(shí)現(xiàn),并給出優(yōu)化策略。