■
pandas
前処理
dropna, dropna(inplace=True)
dataframeは列ごとに型を持っている。方変更する場合には
astype()
メソッドを使用するsortにはsortValues()
mapは値ごとに関数適用。applyはDataFrameの行、列に対して。applyの戻りはSeries
統計量
- mean, corr, covなどintやfloatについて計算する
- describeは基本統計量を算出する
クロス集計
- クロス集計とは、質問事項を2つ以上かけ合わせて集計する手法
- groupby()にひとつや、リストで複数のカラムを指定する
numpy.hstack()
でndarrayを横に結合。 (参考)str_strip().uniquie()
でユニークにするconcat
でSeriesのリストを連結する
時系列データ
pct_change
で変化率を算出cumprod
で累積率rolling
でデータの範囲指定で関数適用resample
で頻度を変換
可視化
plot()
で折れ線グラフscatter()
で散布図hist
でヒストグラムbinsは、ビンの数設定