2021年1月31日日曜日

Practical Statistics for Data Scientists

図書館で『データサイエンスのための統計学入門』(初版)を借りて読んでいたところ、ネット上に英語の原著のPDFがあることを見つけた。

Practical Statistics for Data Scientists

サポートページからRのコードとデータもダウンロードできる。


元のコードだと、Windowsのドキュメントのフォルダがうまく読み込めないみたい。
PSDS_PATH <- file.path('~', 'statistics-for-data-scientists')
なので、Rのコード保存先を
C:/psds
データフィル保存先を
C:/psds/data
として、
PSDS_PATH <- file.path('C:/psds')
とすると大丈夫。

データファイルについてはほとんどそのまま使えるがsp500のデータはファイル名を以下のように変更するとサンプルコードのまま使えました。
sp500_data.csv → sp500_px.csv
sp500_sectors.csv → sp500_sym.csv

*************************************
メモ《Rでの作業ディレクトリの変更》

setwd("c:/usr")   # 作業ディレクトリを変更する
getwd() # 確認する

Windows では \ を指定しては駄目.例えば,setwd("c:\usr") とするとエラーが出る。setwd("c:/usr") とするか setwd("c:\\usr") とすること。

*************************************

*Mac/LinuxとWindowsでパスの区切りが違う話。

Mac/Linuxではスラッシュ(r4ds/data.csv)

Windowsではバックスラッシュ(r4ds\data.csv)


*絶対パス

Windowsではドライブ文字(C:)またはバックスラッシュ二つで始まり(\\)、Mac/Linuxではスラッシュ(/)で始まる。

Mac/Linuxでは 「~」 はホームディレクトリを表す。Windowsにはホームディレクトリという概念がそもそもないので、ドキュメントディレクトリが使われる。

R for Data Science