Pythonで既存のデータで学習・テストをする際にカテゴリーデータは、ダミー変数(One-Hotエンコーディング)を作りますよね。
学習データやテストデータについては、機械学習モデルを作る前に、pandasのget_dummies()を使いますよね。
ですが、本番実装時に1行のデータを受けてそれをモデルに入れたいとします。ダミー変数化される前の元のカテゴリカルデータしかないデータです。
さて、困りました。どうすればいいのでしょうか?
Pythonで既存のデータで学習・テストをする際にカテゴリーデータは、ダミー変数(One-Hotエンコーディング)を作りますよね。
学習データやテストデータについては、機械学習モデルを作る前に、pandasのget_dummies()を使いますよね。
ですが、本番実装時に1行のデータを受けてそれをモデルに入れたいとします。ダミー変数化される前の元のカテゴリカルデータしかないデータです。
さて、困りました。どうすればいいのでしょうか?