機械学習の前処理シリーズ 投稿者:ひで 投稿公開日:2022年9月4日 投稿カテゴリー:未分類 投稿コメント:0件のコメント 背景 機械学習に興味あり!そのための勉強に興味あり!これから見知ったことは更新していこうかな、と。 文字列の正規化 以下で文字を正規化できるらしい。”NFKC”の他にも色々あるようだがとりあえず…。ただその正体は”unicodedata.normalize“らしいよ! pandas.str.normalize(form=‘NFKC’) 参考文献 pandasでfor文を使わない日本語テキスト前処理 pandas.Series.str.normalize おすすめ 水俣病のマイク切られた件 2024年5月8日 国会会議録検索システムっていうのがあるらしい 2024年7月8日 TypeScript 2022年9月24日 コメントを残す コメントをキャンセルコメントコメントする名前またはユーザー名を入力してください メールアドレスを入力してコメント Web サイトの URL を入力してください。(任意) 次回のコメントで使用するためブラウザーに自分の名前、メールアドレス、サイトを保存する。