說明
紀錄大衛在做機器學習時,應該要怎麼做會達到最好。
SOP 開始
- 將遺失的資料移除
- 對於沒有意義的數字可以進行移除
- 可以考慮把一些 string, numeric 變成頻率分析
- 可以自己加入一些加減乘除的變數,例如室內面積 / 浴室面積比,會有一些參考價值存在
- 每次 model 完成後畫圖
- 畫出 model accuracy
- model loss 圖,方便自己更了解問題所在
- 畫出前 100 筆資料的預測與答案
- 使用 tensorboard 來看自己的 model 訓練問題
額外輕鬆項
- bayesian optimization 來自動選擇參數,但要花許久時間,因為是不斷嘗試每個參數
- ReLu 當 activation function