Intrusion Detection in SVM's Research...
利用support vector machine來做classification and regression,已經有許多的實證研究,證明在某些領域的應用上,效果比decision tree、Neural Network、來得好!
因此我們利用由台大資工 林智仁老師所發展的LibSVM這套工具來進行研究,林智仁老師首頁:http://www.csie.ntu.edu.tw/~cjlin。此套軟體主要包含了svmtrain、svmpredict、svmscale這幾隻程式,當然還有easy.py、grid.py...等等的好用工具!
LibSVM工具簡單說明:
假設我們有train及test dataset,首先我們會先使用svmscale這隻程式,把feature給scaling到+1及-1二值之間。下列是林智仁老師在Kernel-Machine中所提到的重點。
Scaling is related to two issues:
1. whether learning results can be better
2. whether numerical difficulties in training svm are avoided
It's more difficult to see the effect of 1, so essential we are asking which of your two methods better handle the numerical problems..
If we think that larger attributes usually cause more numerical problems, the 2nd approach may be better.
For the 1st one, you may scale one set to [-1,1], and then
have another set to be [-1000,1000]..
Using the second if you decide everything should be in
[-10, 10], then one set becomes in [-0.01, 0.01] and another
in [-10,10].
待scaling完之後,便使用svmtrain來進行分類model的建立,在這個過程之中,必須指定最佳的參數給svmtrain (parameter selection的部份下篇文章再跟大家分享囉!),參數的選擇是很重要的,儘可能給予svmtrain一個best parameter,或許能得到一個比較好的結果。
最後再利用svmpredict.exe這隻程式來進行預測,進而得出預測的正確率…眾多學者、專長都喜歡看到很高的預測率。
當然囉…我也是希望論文所做出來的數據是很漂亮的…不然的話,都不知道怎麼才能順利畢業哦!
ps.接下來會有數篇相關的內容簡介,也許小弟不了解SVM這東西的精髓,所以有說錯的…希望各位大大能給予小弟一些建議或是更正。
沒有留言:
張貼留言