科研實(shí)驗(yàn)室每天需面對(duì)海量的數(shù)據(jù), 數(shù)據(jù)挖掘在科研管理工作中不應(yīng)還停留在紙上談兵或面子工程的狀態(tài),實(shí)驗(yàn)室信息化管理平臺(tái)(LIMS)數(shù)據(jù)分析模塊數(shù)據(jù)挖掘技術(shù)解決方案,重視科研數(shù)據(jù)的原始積累,增強(qiáng)科研管理項(xiàng)目決策的科學(xué)性, 為科研管理人提供更深層次的科研活動(dòng)服務(wù)力度, 優(yōu)化科研資源的配置和管理。
實(shí)驗(yàn)室信息化管理平臺(tái)數(shù)據(jù)挖掘流程步驟:
第一、定義問(wèn)題。
為使數(shù)據(jù)挖掘活動(dòng)具有清晰準(zhǔn)確的目標(biāo),需要對(duì)要解決的問(wèn)題進(jìn)行定義,要清楚地定位需要解決的問(wèn)題是什么,如評(píng)價(jià)科研成果、評(píng)價(jià)科研效率等,因?yàn)椴煌哪繕?biāo)和問(wèn)題所需要的模型是完全不同的。
第二、構(gòu)建數(shù)據(jù)挖掘庫(kù)。
在確定好需要解決的問(wèn)題后,需要選擇有效的原始數(shù)據(jù)。對(duì)于數(shù)據(jù)挖掘技術(shù)的實(shí)施來(lái)說(shuō),原始數(shù)據(jù)通常是越多越好,但并不是需要濫用, 在收集到所有的數(shù)據(jù)后,要對(duì)其進(jìn)行一定的選擇,并對(duì)數(shù)據(jù)進(jìn)行描述與匯總,利用傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)進(jìn)行元數(shù)據(jù)的搭建,形成數(shù)據(jù)庫(kù)。
第三、分析數(shù)據(jù)。
通常是利用數(shù)據(jù)分析軟件進(jìn)行數(shù)據(jù)的初步分析,因?yàn)樵紨?shù)據(jù)過(guò)于龐大,且很難找到重點(diǎn),應(yīng)借助 SPSS之類的工具進(jìn)行歸類,找出不同影響性的數(shù)據(jù)。
第四、準(zhǔn)備數(shù)據(jù)。
具體工作是選擇變量、選擇記錄、創(chuàng)建新變量、轉(zhuǎn)換變量。
第五、構(gòu)建模型。
通過(guò)數(shù)據(jù)挖掘?qū)崿F(xiàn)對(duì)某個(gè)問(wèn)題的解決,需要的工作是多方面的,因此構(gòu)建模型需要長(zhǎng)期實(shí)行,反復(fù)開展,需要對(duì)大量的算法和數(shù)學(xué)邏輯進(jìn)行參考,并在運(yùn)行后反復(fù)優(yōu)化。通常情況下會(huì)先用一部分信息構(gòu)建模型,并利用剩余的信息對(duì)模型進(jìn)行測(cè)試,甚至需要另一部分?jǐn)?shù)據(jù)進(jìn)行驗(yàn)證。
第六、模型的評(píng)價(jià)。
在對(duì)模型初步建立之后,還需要對(duì)其進(jìn)行綜合性地評(píng)價(jià),對(duì)不同的數(shù)據(jù)下得到的結(jié)果的合理性進(jìn)行專家評(píng)價(jià),使模型更有價(jià)值。在實(shí)踐中,通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)解決一定的問(wèn)題,還面臨著經(jīng)濟(jì)、人力、技術(shù)等方面的限制,所以,應(yīng)評(píng)價(jià)這種模型實(shí)施的各方面的可行性。
第七、模型實(shí)施。
在建立了初步的模型并被認(rèn)定為可行之后,就能夠開展具體的實(shí)施,以對(duì)問(wèn)題進(jìn)行及時(shí)有效地解決。
二、科研管理工作在數(shù)據(jù)挖掘技術(shù)下的轉(zhuǎn)變
1 、原始數(shù)據(jù)積累
LIMS提升科研單位的信息收集能力, 構(gòu)建更廣范的科技文獻(xiàn)、專利信息、論文信息以及科研單位自身各類信息的數(shù)據(jù)庫(kù),包括科研工作者的基礎(chǔ)信息、科研成果等,并充分使用。還應(yīng)把科研管理的數(shù)據(jù)挖掘延伸到全球科研信息,如對(duì)于某個(gè)研究所來(lái)說(shuō),其研究的方向在全球有很多科研機(jī)構(gòu)與成果,該單位就應(yīng)在全球范圍內(nèi)進(jìn)行原始數(shù)據(jù)的收集。
在數(shù)據(jù)挖掘技術(shù)的發(fā)展中,應(yīng)當(dāng)對(duì)各類信息進(jìn)行準(zhǔn)確有效地收集,同時(shí)淘汰一些失去價(jià)值的數(shù)據(jù),如過(guò)期的甚至錯(cuò)誤的科研成果等。
2、決策科學(xué)性
LIMS針對(duì)科研管理及數(shù)據(jù)挖掘機(jī)制的開拓,從具體的科研管理項(xiàng)目決策上入手, 使決策更具科學(xué)性。應(yīng)基于信息篩選的理念,進(jìn)一步細(xì)化科研管理工作,充分利用數(shù)據(jù)挖掘的優(yōu)勢(shì)思維。
LIMS平臺(tái)基于云計(jì)算的模式,對(duì)研究的領(lǐng)域、可能得到的學(xué)術(shù)成果進(jìn)行深入的分析積極地借鑒國(guó)內(nèi)外相關(guān)學(xué)術(shù)成果的現(xiàn)有文獻(xiàn),找出最合適的研究思路,并對(duì)科學(xué)課題的創(chuàng)新性和可行性進(jìn)行判斷,對(duì)其意義與必要性進(jìn)行判斷。
3、提升科研服務(wù)力度
各類科研機(jī)構(gòu)的科研項(xiàng)目,通常由科研工作者以某個(gè)機(jī)構(gòu)的研究為主進(jìn)行申請(qǐng)。和過(guò)去的科研活動(dòng)管理、信息化技術(shù)的應(yīng)用相比,科研工作者僅是根據(jù)具體的科研工作,向上級(jí)領(lǐng)導(dǎo)單位進(jìn)行申請(qǐng)書的投遞,而后者則對(duì)申請(qǐng)內(nèi)容進(jìn)行進(jìn)一步分析。在具體的實(shí)踐中,會(huì)出現(xiàn)申請(qǐng)力度不足、相關(guān)數(shù)據(jù)殘缺、有一定的錯(cuò)誤信息等,使得科研管理水平降低,有時(shí)會(huì)存在申請(qǐng)課題與實(shí)際需求差距較大,以致于最終申請(qǐng)無(wú)法通過(guò)。
LIMS平臺(tái)在數(shù)據(jù)挖掘技術(shù)的應(yīng)用過(guò)程中, 數(shù)據(jù)更加透明,也更為豐富,科研單位應(yīng)掌握數(shù)據(jù)挖掘的思維和技術(shù),對(duì)數(shù)據(jù)領(lǐng)域進(jìn)行分析、研究、準(zhǔn)確預(yù)測(cè),探索構(gòu)建科研管理、數(shù)據(jù)挖掘的模型,與此同時(shí),基于數(shù)據(jù)可視化的理念,得到成型的相關(guān)報(bào)告,這可以給工作人員提供更為全面的數(shù)據(jù)信息,并對(duì)其中的內(nèi)在聯(lián)系進(jìn)行梳理。
4、資源合理配置及優(yōu)化
科研管理工作牽涉諸多的科研資源,管理單位應(yīng)對(duì)各種資源進(jìn)行合理配置,進(jìn)一步對(duì)數(shù)據(jù)管理進(jìn)行優(yōu)化。
第一,LIMS平臺(tái)對(duì)相關(guān)數(shù)據(jù)開展廣泛的采集和初步的篩選,構(gòu)建相應(yīng)的數(shù)據(jù)管理資源庫(kù)、人才庫(kù)、科研成果庫(kù)等。
第二,對(duì)科研機(jī)構(gòu)的自身發(fā)展進(jìn)行一定的科研評(píng)判,構(gòu)建相對(duì)健全的科研模型, 包括科研資源研究模型、科研成果模型等,并對(duì)其中的參數(shù)進(jìn)行有效地計(jì)算,進(jìn)一步制定完善的管理規(guī)則。
第三,LIMS平臺(tái)利用定量化績(jī)效考核的思路,及時(shí)搭建科研資源的基礎(chǔ)配置。以決策支持管理工具為基礎(chǔ),有效地對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行管理, 基于數(shù)據(jù)挖掘的模式對(duì)科研機(jī)構(gòu)的資源開展科學(xué)配置。