pythonでExcelファイルの読み込みとcsvへの変換

Excelファイルの読み込み

今回はExcelファイルを読み込んでリストにします。xlrdというライブラリを使用するのでインストールが必要です。

今まではエクセル開いて「名前をつけて保存」でCSVを選択してCSVファイルの読み書きをしていました。.xlsxファイルをそのまま読み込めれば便利ですね。

今回は「sample.xlsx」ファイルを用意しました。シートは1つだけで中身はこんな感じ。

これを読み込むコードは次のようになります。

jupyter notebookで実行すると、無事に読み込めていることが分かります。

sample2.xlsxを用意してNone(空欄)を入れてみました。

これで実行すると、出力は

となって、空白の文字列となるようです。

xlsxからcsvへの変換(xlsx2csv)

続いて、xlsxをcsvに変換してみたいと思います。読み込んでリストにして、データフレームとして保存しているだけです。

実行すると、sample_output.csvファイルが生成され、変換が成功しました。

こちらが中身です。

上手くいきましたが、シートが複数枚ある場合など注意が必要かと思われます。

CSVファイルの読み書きでしたらこちらの記事が参考になるかと思います。

pythonでcsvファイルの読み書き

pythonで機械学習をしたいなら次の本がオススメです。数式変形も丁寧で原理がわかりやすいです。何より基本中の基本から徐々にステップアップしているので初学者にも分かりやすい内容になってます。本の内容のソースコードも全てGithubに上がっているので、すぐに試せるので便利です。