からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

H!P

ハロー!プロジェクトを題材とした記事です。

ハロプロ関連チャンネルのMV再生回数の推移のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、MVの再生回数をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 再生回数の可視化 データの設定 アーティストごとに集計 データ…

ハロプロ研修生の歴代メンバーの活動期間のタイムラインチャートを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、ハロプロキッズ・エッグ・研修生の歴代メンバーの活動期間をタイムラインにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 研修生の活動期間の可視化…

ハロプロメンバーカラーの色見本の作図

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズです。 この記事では、メンバーカラーの色見本をR言語で作成します。 【他の内容】 www.anarchive-beta.com 【目次】 はじめに 色見本の作成 データの読込 色見本の作図 利用例 おわりに 色見本の…

ハロプロの歴史を可視化しようシリーズ:記事一覧

H!P

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズです。 この記事は、各記事の目次ページです。 【目次】 はじめに 利用データ バーチャートレース ラインチャート その他 おわりに 利用データ このページのデータベースを利用させていただいてい…

ハロプログループの歴代メンバーの活動期間のタイムラインチャートを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズです。 この記事では、ハロプログループの歴代メンバーの活動期間をタイムラインにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに メンバーの活動期間の可視化 データの読込 デ…

ハロプログループの最小・最大活動月数の推移のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、ハロプロキッズ・エッグ・研修生期間を含めた各グループの最小活動月数または最大活動月数の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com …

ハロプログループの最小・最大月齢のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各グループの最小月齢または最大月齢の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 最小・最大月齢の推移の可視化 「…

ハロプログループの最小・最大年齢のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、最小年齢まはた最大年齢の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 最小・最大年齢の推移の可視化 データの読込 期…

ハロプログループの平均年齢のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各グループの平均年齢の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 平均年齢の推移の可視化 データの読込 期間の指定…

ハロプログループの平均活動年数のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各グループの平均活動年数の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 平均活動年数の推移の可視化 データの読込 期…

ハロプログループの平均月齢のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各グループの平均月齢の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに 平均月齢の推移の可視化 データの読込 期間の指定…

ハロプロアーティストのシングルリリース数のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各アーティストのシングルリリース数の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに シングルリリース数の推移の可視化…

ハロプロアーティストのアルバムリリース数のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各アーティストのアルバムリリース数の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに アルバムリリース数の推移の可視化…

ハロプログループのメンバー数のバーチャートレースを作ってみた

はじめに ハロー!プロジェクトの歴史を可視化しようシリーズ(仮)です。 この記事では、各グループ・ユニットのメンバー数の推移をバーチャートレースにします。 【他の記事】 www.anarchive-beta.com 【目次】 はじめに メンバー数の推移の可視化 データの…

第4章:法則と語句の重みおよび特徴語句抽出【テキストアナリティクスのノート】

はじめに 統計学One Pointシリーズの『テキストアナリティクス』の学習時のまとめです。 この記事は、4章「法則と語句の重みおよび特徴語句抽出」の内容です。本で解説されている数式をRで実装します。詳しい解説は本を読んでね。細かい内容はこれから勉強し…

こぶつば楽曲の歌詞をテキスト分類したい⑥~サポートベクターマシン~

〇はじめに この記事ではRを使って教師あり学習のサポートベクターマシンによる文書分類を行います。基本的な内容は本に沿ってやっているので、詳しい説明は参考書籍をご参照ください。 こぶしとつばきの歌詞を文字・単語に切り分け、曲ごとの出現頻度を特徴…

こぶつば楽曲の歌詞をテキスト分類したい⑤~ランダムフォレスト~

〇はじめに この記事ではRを使って教師あり学習のランダムフォレストによる文書分類を行います。ランダムフォレストとは決定木の手法を用いたアンサンブル学習です。基本的な内容は本に沿ってやっているので、詳しい説明は参考書籍をご参照ください。 こぶし…

こぶつば楽曲の歌詞をテキスト分類したい④~k近傍法~

〇はじめに この記事ではRを使って教師あり学習のk近傍法による文書分類を行います。k近傍法とは、各データの特徴量を基に、特徴の近いk個のデータの内の多い方のグループに分類する手法です。基本的な内容は本に沿ってやっているので、詳しい説明は参考書籍…

こぶつば楽曲の歌詞をテキスト分類したい③~線形判別分析~

〇はじめに この記事ではRを使って教師あり学習の線形判別分析を行います。2グループの文書を使い、訓練データから判別式を求めて、評価データを分類して分類精度を見ます。基本的な内容は本に沿ってやっているので、詳しい説明は参考書籍をご参照ください。…

こぶつば楽曲の歌詞をテキスト分類したい②~階層型クラスター分析~

○はじめに Rを使って機械学習の分野で言うところの教師なし学習である階層型クラスター分析を行います。 テキスト中に使われている文字・単語の頻度を用いて各テキストの類似性を測り、グループに分類していきます。階層型というのは、1つずつのデータを小さ…

こぶつば楽曲の歌詞をテキスト分類したい①~分析データの整形と確認~

〇はじめに 以前の記事でデータの加工をほとんどせずにテキスト分類を行ったところ、結果はお察しでした(一応この記事とこれです)。あれからひと月が経ち多少知識も増えたので再挑戦しました。 いくつかの記事に分けて、データ整形、特徴語の選択、クラスタ…

R用ハロプロのメンバーカラー色見本

〇はじめに この記事の内容を書き直した↓の記事を参照してください。www.anarchive-beta.com tidyverseに対応した内容になっています。 Rでカラーコードを指定する時用に作りました。単にカラーコード一覧として使ってもいいのですが、メンバーカラーを指定…

【テキストマイニング入門】R言語でこぶつば楽曲を線形判別分析して分類できなかった【やってみた】

〇はじめに 前回はこぶつば楽曲を分類(クラスタリング)しました。 www.anarchive-beta.com 今回は分類(カテゴライズ)です。線形判別分析(linear discriminant analysis)に挑戦します。線形判別分析とは、AかBかが分かっている訓練データを用いてAとBを分ける…

【テキストマイニング入門】R言語でこぶつば楽曲をクラスタリング【やってみた】

〇はじめに 前回はネットワークグラフとワードクラウドを作成しました。 www.anarchive-beta.com 今回はクラスター分析を行います。文書中の単語を基に類似度を測り分類していきます。 参考書籍 『Rによるテキストマイニング入門』石田基広,森北出版株式会社…

【テキストマイニング入門】R言語でネットワークグラフを作成する【やってみた】

〇はじめに 前回は文書中の単語ごとの出現頻度を計測しました。 www.anarchive-beta.com今回は視覚化していきます。前回のようにテキストを数値で捉えたものを、視覚的に捉えられる形式に加工します。具体的には、ネットワークグラフとワードクラウドを作成…

【テキストマイニング入門】R言語で文書中の単語の出現頻度表を作成する【やってみた】

〇はじめに はじめまして!実質初記事です。よろしくお願いします。まずPC環境周りの情報とか載せるべきなのでしょうがその内書き足します。レイアウト的なのもその内調べて改修予定です。(そういう事を始めに調べ出すのは、自分がやらない理由作りをする時…