pythonの基本とかプロコンとか

広告

pythonの記事を書くのはここでは初めてですが、このカテゴリでは、統計学や機械学習で学んだことを実装していきたいかと思ってます。ちなみにゆくゆくはtensorflowとか使う予定です。とりあえずpythonで何ができるのか考えます。

pythonでなんでもできるといえば、なんでもできます。特に機械学習とか統計的な解析が得意な言語かという印象があります。汎用版R言語というイメージがあります。正しいかはわかりませんが。

また、結構構造がシンプルでとっつきやすいと思います。機械学習系の強力なライブラリがあるので、あんまディープラーニングとかよくわからなくてもディープラーニングできるのが強みだと思ってます。

ちなみにプログラミング言語別で年収を見たとき、pythonは一位だったような記憶があります。どうやって計算しているのかはわかりませんが。まあ、データサイエンスやアクチュアリーなどの、数学の中でも統計学を使いこなす専門家が多いから平均年収が高いんですかね。

pythonに関して書籍を買うならみんなのpythonがいいかなと思います。辞書的に使うのであればどれもあまり変わらないような気はしますが、オライリーもいいですね。

次にpythonの環境について見ていきたいと思います。

python実行環境はもろもろ含めてAnacondaがおすすめです。わからない方はググってください。実行環境もAnacondaに入ってるjupyter notebook(旧: Ipython Notebook)が対話式で簡単なコードを書くのに便利かと思います。

環境構築の方法はもう忘れてしまったので、ググっていただいた方が良いかと思います。このサイトではプログラミングに関して高度なテクニックは使いません。大学のプログラミングの授業のレベルが理解でき、数学的な基礎知識があればわかると思います。読みやすさを意識して書きます。

ライブラリについて説明しておくと、データフレームなどの大きなデータを扱うpandasというライブラリと、CやFortranで実装された実行速度の速いnumpyというライブラリがあります。覚える必要はなく、いずれ必要になり自然と使いこなせるようになるのではと思います。

最近Atcoderなどのプログラミングコンテスト(競技プログラミング。実行測度の速さや正確性を競う大会です。)においても、データ解析系のコンテストもそこそこ開催されているので、参加してみるのもありかなと思います。

データ解析系のプロコンはkaggleが有名です。よければ参加してください!多くの人が参加して、Twitterなんかでお互いを高め合うコミュニティができれば望ましいと思ってます。

なんか宣伝っぽくなってしまってすいません。次回からは実際のコードを書いていきます。

pythonで機械学習をしたいなら次の本がオススメです。数式変形も丁寧で原理がわかりやすいです。何より基本中の基本から徐々にステップアップしているので初学者にも分かりやすい内容になってます。本の内容のソースコードも全てGithubに上がっているので、すぐに試せるので便利です。

Python3の入門オンライン講座

オンライン講座ならUdemyがおすすめです。1000~2000円で10時間程度の動画が見放題で専用アプリでダウンロードも可能です!体系的に学びたい方にいつもおすすめ!

関連記事