からっぽのしょこ

読んだら書く!書いたら読む!読書読読書読書♪同じ事は二度調べ(たく)ない

R-パッケージ

R言語の特定のパッケージに関する記事です。

koRpus(TreeTagger)の形態素解析結果をRMeCab::docDF()仕様に変換する

はじめに 英文(多言語)形態素解析器TreeTaggerをR言語で利用するためのパッケージkoRpusの出力を、RMeCab::docDF()の出力の仕様に加工します。 はじめに ファイル単位の出力をdocDF()仕様に変換 ・設定 ・英文形態素解析 ・品詞情報の対応表の準備 ・docDF()…

rtweetパッケージで取得できるツイートデータ

はじめに rtweetパッケージで取得できるツイートデータをまとめました。 【他のネタ一覧】 www.anarchive-beta.com 【目次】 はじめに ツイートデータ その他メモ おわりに ツイートデータ rtweet::get_timeline()やrtweet::search_tweets()で取得したツイー…

Rでツイート画像を取得する

はじめに rtweetパッケージを使って、特定の単語と共にツイートされた画像を抽出して保存します。 【他のネタ一覧】 www.anarchive-beta.com 【目次】 はじめに ・ツイート画像を取得する ・ツイートの収集 ・画像の取得 複数単語分のツイートを取得した場合…

rtweetパッケージを使ったネタまとめ

はじめに R言語でTwtter APIを扱うためのrtweetパッケージを使ってあれこれします。この記事はその一覧ページです。 【目次】 はじめに あれこれ おわりに 取得できるツイートデータについては、この記事にまとめています。 www.anarchive-beta.com Twtter A…

ツイート頻度によるクラスタリング

はじめに ツイートする時間帯から生活サイクルの近い人が分かるのでは?という思い付きをR言語でやってみます。 【処理の流れ】 rtweetパッケージを使って、ツイート収集 ggplot2パッケージを使って、ツイート頻度をヒートマップ化 ggdendroパッケージを使っ…

R言語でツイートテキストのネガポジ分析

はじめに ツイートテキストに対して感情分析を行います。 感情分析とは(ざっくり言うと)、テキストに含まれている単語がそれぞれネガティブな表現なのかポジティブな表現なのかを評価し、テキスト全体がネガ・ポジどちらなのかを判定するものです。 【分析手…

R言語でツイート数をヒートマップ化する

はじめに rtweetパッケージを利用して、指定したアカウントのタイムラインインを収集し、設定した期間(年・月・日・時)ごとのツイート数を集計し、ヒートマップによる可視化を行います。 ヒートマップ 【目次】 はじめに ツイート数のヒートマップを作成 ・…

R言語でツイート数の推移をグラフにする

はじめに rtweetパッケージを利用して指定したアカウントのタイムラインを収集し、設定した期間ごとにツイート数を集計し、ツイート数を棒グラフによって可視化します。 ツイート数(日別) はじめに ・ツイート数を棒グラフで可視化 ・ツイート収集 ・年・月…

R言語でTwitterのフォロー関係をネットワークグラフにする

はじめに Twitter APIを取得したので早速遊んでみた内容をメモレベルですが記事にしました。 rtweetパッケージを使って、指定したアカウントがフォローしているアカウントを拾ってくる。更に、抽出したアカウントがフォローしているアカウントも抽出する。収…

rtweetパッケージを使ってツイートを収集しようとしたら何かエラーが出たのでその対処法など

はじめに Twitterの開発者アカウントを作成しAPIも無事取得できたのに、Rでツイートを集めようとしたら詰まってしまい、解決策を調べても日本語の記事があまり引っかからなかったので記事として残しておきます。 rtweetパッケージを使ってR言語でツイートデ…

RとTreeTaggerで日本語英語混合文をテキスト分析するための前処理(複数文書)

〇はじめに ディレクトリ内の日本語と英語が混じった文書を、MeCabとTreeTggerとで一括で処理するためのコードです。処理の詳細は前回の記事をご覧ください。といいますか、基本時に前回の内容をforでくっつけたものです。最終的に単語文書行列が作成されま…

RとTreeTaggerで日本語英語混合文をテキスト分析するための前処理

〇はじめに 歌詞をテキスト分析することを目標に勉強しているのですが、歌詞には英語のテキストが頻繁に出てきます。MeCabだと英単語に品詞タグをうまく付けられないようです。その回避策として組んだものです。 日本語と英語の混合文から英語のみを抜き出し…