網站首頁 文學常識 簡歷 公文文書 文學名著 實用文 人生哲理 作文 熱點話題作文
當前位置:文萃咖 > 實用範文 > 論文

資料探勘技術在WEB的運用論文

欄目: 論文 / 釋出於: / 人氣:2.3W

一、資料探勘的背景

資料探勘技術在WEB的運用論文

網際網路、計算機資訊科技迅猛的發展勢頭,資料從結構化儲存以及轉化為非結構化的儲存,資料儲存形式的轉變,不同資料型別的儲存變多,音訊、視訊等大格式的資訊儲存在多個應用中實現。行業中的計算機化、資訊化和網路化,使計算機和伺服器上積累了各種各樣海量的資料。傳統的人工分析已經不能滿足和適應如此大量的資料,各行各業都產生了巨大資料資訊,包括生產加工、研究、物流運輸、客戶、營銷、售後等資料,人們卻不知道怎麼利用這些資料實現價值的增長。如果能將這些資料進行挖掘分析,很可能會產生巨大的商業價值,很多有價值的資訊可以被發現。現在,越來越多的公司和企業意識到資料探勘的重要性,但是怎麼能從如此海量的資料中挖掘出有價值有用的資訊,已經成為研究的熱門話題。在傳統的資料分析基礎上,相關人員結合新開發人工智慧和資料探勘等相關的技術,資料庫孕育而生,讓我們能從海量的資料中挖掘出有價值的資訊,促使資訊化的發展,稱之為資料探勘。

二、資料探勘的過程

1、資料收集。將要進行資料分析的海量資料資源收集到資料倉庫中。把不同來源、格式、特點性質的資料在邏輯上或物理上有機地集中,抽象出分析相關的資料,進行非結構化資料的分類,篩選出不相關或者無價值的資料,減少資料集的容量。

2、資料清洗和轉換。資料清洗是為了刪除掉無用的資料資訊。資料轉換的目的最直接的是把所有資訊統一化。將完整,有效的資訊存入資料倉庫。

3、模型建立。模型建立是資料探勘的核心階段。首先,要和相關領域的專家組成團隊,進行需求分析,明確資料探勘的目的和具體的資料探勘任務。根據不同的任務,選擇相關演算法,利用這些演算法來建立模型,再用專業的模型評估工具比較模型的準確度。即使是同一種演算法,引數選取的不同,所建模型的'準確度也不一樣。

4、模型評估。從商業角度來講,模型評估是對我們所建立的預測模型的正確性進行價值評估,如若模型中模式無價值,就要重複資料探勘過程中的2~4步,即資料清洗和轉換、模型建立。

5、知識表示。將資料探勘最後的結果以最直觀的方式呈現給使用者,通常用資料圖形展示工具來表示。

6、應用整合。將資料探勘整合到現實的實際應用中。例如,CRM中有了資料探勘功能,就可以對客戶進行等級分類。

7、模型管理。根據不同資料模型的生命週期做好資料應用和管理。

三、WEB資料探勘

基於WEB內容的挖掘就是針對網頁內容進行資料探勘,通過使用者對網頁訪問的互動,留下的資料資訊進行收集分類,完成資料探勘。目前對文字內容的挖掘技術取得了一定的成果,對影象、音訊、視訊等各種多媒體資料的資料探勘技術都開始採用非結構化大資料應用技術來完成。基於WEB結構的挖掘是發現頁面、文件和WEB的結構,主要是發現WEB潛在的結構模式,利用分析這些結構我們可以得到很多潛在有價值的資訊。基於WEB使用的資料探勘,即針對使用者的訪問網頁的軌跡收集分析。WEB內容的挖掘和結構的挖掘面對的主要挖掘物件是大規模的軌跡資料,對挖掘資料進行分析可以讓管理者瞭解使用者的不同需求,從而為使用者提供個性化的服務。

四、資料探勘在WEB中個性化定製的應用

通過網站與使用者的互動,可以得到使用者訪問的內容、時間、方式、頻率等,從中發現潛在的商業價值,通過價值資料進行資料探勘以及演算法分析得出商業結論。就可以根據挖掘到的資訊對這些客戶進行特定的推銷策略,進行個性化定製。在商業領域中,通過對相似軌跡資料的客戶進行分類,分析他們的共性,幫助管理者發現不同客戶的需求和興趣,提供適宜各類人的服務。按照不同使用者的不同興趣和愛好,向用戶提供動態的瀏覽建議。對大多數使用者來說,如果可以訪問該網站可以體會到量身定做的服務,那麼資料探勘個性化定製就成功完成了。

五、資料探勘技術在WEB中的應用

網站的功能設計及其版面的內容直接影響到網站的訪問率。相關人員發現使用者的需要和興趣,對需求強烈的地方提供優化,使用資料探勘去發現頁面間的關聯,針對不同的使用者動態調整網站的設計和連結,使使用者可以便捷地訪問到自己想要訪問的頁面。將資料探勘技術的在WEB中的應用,吸引更多的使用者。隨著資料探勘技術在WEB中的應用,使用者可以通過分析挖掘的結果瞭解各種客戶的需求和喜好,得到各種定製個性化服務。隨著網際網路上軌跡資料資訊量的急速增長,不斷複雜化的資料結構,挖掘技術也面臨著一系列新的問題和挑戰。

參考文獻:

[1]胡繼平、資料探勘技術[J]、景德鎮高專學報,1998

[2]NguyenT,SrinivasanV、AccessingrelationaldatabasesfromtheWorldWideWEB、In:ProcofIEEEDataEngineering[J]、NewOrleansLouisiana,2006