1. csvファイルを読み込んで平均値、標準偏差、分散を出力する(python)

広告

今回の目標は「csvファイルを読み込んでそのデータ(value)の平均値、中央値、分散、標準偏差を出力する。」というコードになります。

まず、サンプルとなるcsvファイルを作ります。Excelで作りました。

このようなフォーマットでファイルを作成しました。エンコーディングはUTF-8で統一しています。

このcsvファイルをjupyter notebookの実行ファイルと同じディレクトリにおいておきます。実行ファイルはの中身はとりあえずこんな感じ。

これだけでcsvファイルを読み込むことができます。データフレームではなく、リストの形式であれば計算しやすいですので、.values.tolist()で変換してみます。

これでリストに変換することができました。あとは計算して出力するだけです。

平均値は、データの合計を出力する関数のsum()とデータの数を出力するlen()を使用して次の1行で表すことができます。

残りの中央値、分散、標準偏差は、numpyをimportすれば一瞬で終わります。

慣習に習って import numpy as np としています。

その上で、それぞれの統計値は次のように計算することができます。

これでとりあえず目標が達成できました!

最後にまとめると、全体のコードはこんな感じになりました。

出力を確認すると、ちゃんと計算できてることがわかります。

Python3の入門オンライン講座

オンライン講座ならUdemyがおすすめです。1000~2000円で10時間程度の動画が見放題で専用アプリでダウンロードも可能です!体系的に学びたい方にいつもおすすめ!

関連記事