ぼやかないつもりのメモ(ブログ Ver)

つぶやきとメモの記録。更新はぼちぼち。

R

作図いろいろ

R

学会発表用にいろいろと作図したので、まとめておく。結局「どれが好きか」という問題に近い感じ。最終的に発表には、points()関数とjitter()関数の合わせ技で作った図が使われました。個人的には、箱ヒゲ図+(points()関数とjitter()関数の合わせ技)が好…

2015年03月12日のつぶやき

@takeshou: RT @h_okumura: ? 中澤先生の @MinatoNakazawa 調査票の設計〜質問項目の作り方(PDF)URL2015-03-12 20:59:43 via Twitter for Android Tablets @takeshou: @teramonagi 僕もいつもググったりヘルプ見たりしてます(笑)。RStudioを使うようにな…

()が好きすぎて、羽鳥教徒になれない私

R

id:teramonagiさんの「クロス集計 in R : dplyr + tidyr=(xtabs|table)」を読んでいて、改めて、自分はパイプ系が苦手だと思い知った。結局、xtabs()関数やtable()関数の使い方の方がしっくりきてしまったのだ。せっかくなので理由も少し考えてみた。 まず以…

続々・せっかくならSweaveしたい

連日、Sweave関係で更新しているが、このエントリ以降は少し下火になるはず。Chunk内で特定の日本語が使えないのはほどほどに諦めがついたので、これについてはしばらく放置する。ただ、Chunk内のコードやアウトプットがキレイに改行されなかったのは、なん…

続・せっかくならSweaveしたい

とりあえず、今日一日で気付いたことをメモしておく。 TeXの環境は最新の状態に更新した方が良い。 C:\w32tex\share\texmf-local\tex\xelatexに「ae.sty」、「everypage.sty」、「Sweave.sty」をインストールし、プログラムとファイルの検索から「mktexlsr」…

せっかくならSweaveしたい

せっかくならHTMLよりもPDFでレポートを保存したいので、また性懲りもなくSweaveに手を出してみた。日本語の扱いが大問題なのだが、Weaveにknitr、タイプセットにXeLatexを使って、プリアンブルに「\usepackage{fontspec}」して、「\begin{document}」以降に…

RStudioでKnit HTML

(2013/12/17追記)結局HTMLで書いてまとめ直して、R on Windowsの「RStudioでKnit HTML」にアップロードしなおした。なので、今後、このエントリに変更は加えません。もちろん、コメントはいつでもウェルカムです。 「どのコードで、どの出力だったか」を簡…

データの読み込み

R

データの読み込みがうまくいっているかどうかは、Rで解析を行う際に、結構「はまる」ポイントになる。経験的には、NAと空白の扱いで混乱が生じ、その後の解析にエラーが出て進まないというパターンが多いように思える。今日、同僚がはまっていたのも、まさに…

stackとunstack

R

中澤先生のデータフレームをstack/unstackする方法のPDFをみて、感激!これを今まで知らなかったのは残念で仕方がない。とりあえず、簡単な使い方をメモしておく。元の列名とスタック後の分類で違う名前を使うことも考えて、XやYとなっているところだけちょ…

attach()の効果についての注意点

R

2011/08/04にカテゴリカル変数の順序の変更には、以下のようにすれば良いとメモしていたが、その使い方に関連して、attach()の使用に関する注意点に1つ気づいたので新たにエントリを作っておく。 Sepal.Length2 <- factor(Sepal.Length, levels=c('versicolo…

subsetの使い方

R

subsetの使い方を調べていて見つかったすごい役に立つ情報二つをメモしておく。しかし、NAを含むデータの列で、条件に合致する行とNAの行を残したいという条件の付け方は結局わからないままだ。どうしたものか…。 subset= で複数の条件を指定したい 列名ラベ…

条件式の書き方

R

いつも&&とか書いて躓いてしまうので、まとめて残しておく。 条件式の書き方 a == b : aとbは等しい a != b : aとbは等しくない a > b : aはbより大きい a >= b : aはb以上 a a a | b : aまたはb a & b : aおよびb

カテゴリカル変数の順序の変更

R

Rでカテゴリカル変数を用いた回帰分析を行うと、カテゴリカル変数の中でもっとも順序が小さいもの(変数の値のアルファベット順など)がリファレンスとされる。有名なirisデータのSepal.Lengthで考えると、値としては「setosa」、「versicolor」と「virginic…

集計済みの表データからクラスカル・ワリス検定

R

一般に自分のデータの解析を行う場合、個票データとなっていることが多いと思うが、どうしてもすでに集計され表になっているデータを解析することもある。今回は、クラスカル・ワリス検定について「カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1)」を…

qplotで色を変える

ggplot2のqplotで色を変更するのに若干手間取ったのでメモしておく。qplotでは、colorオプションで変数を指定すれば、結構ナイスな色を「自動で」選択してくれるんだけど、発表なんかではもう少しインパクトが欲しいときもある。そんなときは、「scale_color…

Rでエクセルファイルを読み込む

R

Rでエクセルファイルを読み込む方法をメモっておく。シートの指定は名前ではなく番号らしい。 library(gdata) dat <- read.xls("data.xlsx", sheet = 1) Fortunately, the files can be read with the gdata package, using the read.xls() function. This w…

qplot()だけでも便利

今さらながらggplot2を勉強中。作者のvisualising dataにあるPDFを見ながらいろいろ作図してみているが、qplot()だけでもずいぶん便利なことがわかる。しかもqplot()でおおよそのことがやれるようになった頃には、ggplot()を使ってもほとんどのことがやれそ…

IPSUR

R

Taglibro de Hで紹介されているのをみて、Introduction to Probability and Statistics Using Rをダウンロードしてみた。こういうものを無料で公開してくれる人に本当に感謝。ついでに研究室でRを使う可能性がある人にはメールでお知らせをしておいた。ちな…

R 2.11.0インストール

R

最近ずっと続いているのだが、インストーラの文字化けはそろそろどうにかして欲しい。インストール時に自分でカスタマイズする点はせいぜいMDIをSDIにしたり、ヘルプをHTML形式ではなくテキスト形式にすることくらいなのだが、それをするためだけにまず最初…

R AnalyticFlow 1.0.2

R

やや今さら感もあるけど、R AnalyticFlowのバージョン1.0.2がリリースされているのでメモ。なかなかいじる時間がとれないのが残念だけど、さっきちょっとRのスクリプトをR AnalyticFlowで読み込むと勝手にノードに分けてくれてびっくりした。よくファースト…

sin()がおかしい?

R

1月から一緒の部屋で仕事をしている同僚とRを使った統計の勉強会を始めることになった。その同僚に僕が今持っている本をいくつか見てもらいネタ本を選んでもらった結果、「R流!イメージで理解する統計処理入門―データ解析の初歩から、シミュレーション、統計…

Rの基礎文法最速マスターを望んでみる

R

プログラミング基礎文法最速マスターまとめを見て、そろそろ誰かがRについて書いてくれないかなぁと期待してみる。我ながら他力本願だと思うが、ちと今はそこまで手が回りそうにない。 (追記)Rは、はてなキーワードではR言語だったなぁと思って確認にいく…

R AnalyticFlow 1.0.1

R

R AnalyticFlowが1.0.1にバージョンアップされ、仕様の変更と問題の修正が行われている。ボックスのキャッシュなど活用する人にとっては大事なところが修正されているようなので、インストールしている人はバージョンアップした方がいいと思う。そういえば、…

pyramid

R

1月6日の個別メモに中澤先生のpyramid関数がCRANの登録に承認されたとあったので、さっきちょっと探してみると、すでにTukubaのミラーには行き渡っていてインストールも滞りなくすんだ。インストール後、『library(pyramid)』して『?pyramid』すると詳細なヘ…

read.csv("hoge.csv", strip.white = TRUE)

R

read.csv()に『strip.white = TRUE』を付けることで今までうまく読み込めなかったファイルが読み込めるようになった。かなり嬉しい。ちょっと昔の日記を見てみると『fill = T』*1が有効と書いてある。ん〜、引数を足したり減らしたりして検証しなかったんだ…

Rユーザー会に参加してきた

R

前から一度は参加したいと思っていたRユーザー会に参加してきた。R関係でめっちゃ有名な人たちやTukuba.Rな人たちと話ができたのは非常に嬉しかった。無理矢理懇親会にも参加させてもらったおかげで、「練りわさびに使われている西洋わさびがわさびじゃなく…

Rグラフィックス5章(5.1まで)

R

『library(grid)』を使った作図がいよいよ始まった。んで感想はまさに作図、いやお絵かきかな?traditionalな方法で高水準関数を使ってグラフを作るときは、図まではできあがっていて、その他の要素を追加したり改良したりする作業が多い感じだったが、Grid…

Rグラフィックス4章(最後まで)

R

ぎゃふん。という感じ。traditionalな作図に関しては何度もかじっていたので割とすんなり入ってきたが、やはり新しい話はなかなか大変。3章までは少し手を動かすだけで納得した気になれたけど、4章は「読み終えた」というだけな感じ。5章に入る前にもう一度…

データの読み込み、操作

R

今日は、大学院生からデータを読み込んでもNAの存在でうまくsdが計算できないという質問が来た。前にも一度同じ事で悩んだ気がするので検索してみると、自分で以下のように書いていたのを見つけた。Rを使うときにNAの存在でデータがうまく扱えず、だんだんR…

Rグラフィックス4章(4.5まで)

R

覚えておいた方が良さそうな物が増えてきてややパンク。またここを読み直してもいいかも。今日は身体がだるいのでこれだけ。