からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

2019-01-11から1日間の記事一覧

こぶつば楽曲の歌詞をテキスト分類したい②~階層型クラスター分析~

○はじめに Rを使って機械学習の分野で言うところの教師なし学習である階層型クラスター分析を行います。 テキスト中に使われている文字・単語の頻度を用いて各テキストの類似性を測り、グループに分類していきます。階層型というのは、1つずつのデータを小さ…