図書館で『データサイエンスのための統計学入門』(初版)を借りて読んでいたところ、ネット上に英語の原著のPDFがあることを見つけた。
Practical Statistics for Data Scientists
サポートページからRのコードとデータもダウンロードできる。
元のコードだと、Windowsのドキュメントのフォルダがうまく読み込めないみたい。
PSDS_PATH <- file.path('~', 'statistics-for-data-scientists')
なので、Rのコード保存先を
C:/psds
データフィル保存先を
C:/psds/data
として、
PSDS_PATH <- file.path('C:/psds')
とすると大丈夫。
データファイルについてはほとんどそのまま使えるがsp500のデータはファイル名を以下のように変更するとサンプルコードのまま使えました。
sp500_data.csv → sp500_px.csv
sp500_sectors.csv → sp500_sym.csv
*************************************
メモ《Rでの作業ディレクトリの変更》
setwd("c:/usr") # 作業ディレクトリを変更する
getwd() # 確認する
Windows では \ を指定しては駄目.例えば,setwd("c:\usr") とするとエラーが出る。setwd("c:/usr") とするか setwd("c:\\usr") とすること。
*Mac/LinuxとWindowsでパスの区切りが違う話。
Mac/Linuxではスラッシュ(r4ds/data.csv)
Windowsではバックスラッシュ(r4ds\data.csv)
*絶対パス
Windowsではドライブ文字(C:)またはバックスラッシュ二つで始まり(\\)、Mac/Linuxではスラッシュ(/)で始まる。
Mac/Linuxでは 「~」 はホームディレクトリを表す。Windowsにはホームディレクトリという概念がそもそもないので、ドキュメントディレクトリが使われる。