からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

2018-12-08から1日間の記事一覧

RとTreeTaggerで日本語英語混合文をテキスト分析するための前処理

〇はじめに 歌詞をテキスト分析することを目標に勉強しているのですが、歌詞には英語のテキストが頻繁に出てきます。MeCabだと英単語に品詞タグをうまく付けられないようです。その回避策として組んだものです。 日本語と英語の混合文から英語のみを抜き出し…