2007/1/8

LIBSVM model selection tool--grid.py 心得參考

看過許多關於SVM尋找最佳參數的方法,很多都是用「猜」的…沒錯就是用猜的!

不過要猜參數也要有個系統化的方法的找最佳參數,LIBSVM所提供的model selection tool-- grid.py這個工具大家可以參考使用!

為什麼說參考使用呢?因為在我們實驗室裡頭…用這個tool所找出來的參數,往往都不是最好的,哭…還跑了那麼久!

不過既然是LIBSVM所附的工具,相信有他的價值,只是就目前結果而言,我只會把這個工具當成一種尋找最佳參數的「參考」而已!

大概前二個月吧…使用LIBSVM的grid.py來找參數…使用預設的設定值

近50萬筆資料…以5-fold的設定來執行,CPU是p4-2.8,RAM 512mb!終於在這個星期跑完了!我相信我的設定是沒錯的…dataset也經過scale的步驟

跑了這麼長的一段時間,說真的,我只是想知道這個工作能幫我到哪個程度!雖然讓我失望了(還花了二個月),不過呢?我想應該可以給大家參考吧!

針對大量dataset的,之前在kernel-machine看到…有一套heroSVM!看過這套svm tool的paper,覺得速度真的很快…只可惜,目前不提供…接下來要收費才能使用那套軟體…而且似乎也沒有用在非商業環境底下可以免費使用的條款…失望了!

或許接下來我會交叉測試一下SVMlight and LIBSVM or others...看何者的效能表現好!到時候再跟各位分享囉!

ps...累啊,只因為LIBSVM用的熟…所以懶得換其他的來試…呵!

沒有留言: