機械学習の前処理シリーズ

背景

機械学習に興味あり!そのための勉強に興味あり!

これから見知ったことは更新していこうかな、と。

文字列の正規化

以下で文字を正規化できるらしい。”NFKC”の他にも色々あるようだがとりあえず…。
ただその正体は”
unicodedata.normalize“らしいよ!

pandas.str.normalize(form=‘NFKC’)

コメントを残す