如果想進壹步學習數據挖掘算法,應該多看機器學習方面的書。這方面的書很多,可以根據自己的喜好選幾本,比如《機器學習》,作者】湯姆·米切爾。看到不懂的知識,要用統計學書籍來補充。
理論知識學好了,就要從理論到實踐運用工具。根據實際需要解決的問題建立模型後,也是編程編碼的工作。還有壹些數據挖掘工具,比如基於Java的Weka(這也是Ian H. Witten主編的《數據挖掘:實用機器學習工具和技術》(第三版)壹書)等。),基於Python的Orange等。這些也可以根據自己的需求進行擴展。但是,最靈活的就是掌握幾種編程語言,開始自己編碼。效率高的話,還是C/C++。用Python做研究就夠了,有豐富的庫和社區支持。我也見過很多用Matlab進行數據挖掘的。還是那句話,編程語言只是壹個工具,效率不僅僅取決於編程語言的選擇。