からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

2020-07-17から1日間の記事一覧

koRpus(TreeTagger)の形態素解析結果をRMeCab::docDF()仕様に変換する

はじめに 英文(多言語)形態素解析器TreeTaggerをR言語で利用するためのパッケージkoRpusの出力を、RMeCab::docDF()の出力の仕様に加工します。 はじめに ファイル単位の出力をdocDF()仕様に変換 ・設定 ・英文形態素解析 ・品詞情報の対応表の準備 ・docDF()…