見出し画像

PythonとR言語の両方を比べながら統計学を学んでみませんか?

AI(人工知能)に注目が集まり、書店ではPythonの本が多く並んでいます。しかし、仕事でAIを開発する人はほんの一握りです。

「ちょっとしたデータを使って分析してみたい。」
「でもExcelだと力不足。」

このように感じている人が多いのではないでしょうか?
そんなとき、気になるのが「R言語」でしょう。統計が得意なプログラミング言語で、数行のソースコードを書くだけで高度な分析が可能です。

ただし、「高度な分析」といっても統計の考え方がわかっていないと、何をしたらいいのか見当もつかないことも。そこで、流行のPythonとR言語を使って、統計学を学ぶ本を書きました。今回は、その内容を含めて簡単に紹介します。

PythonとR言語を比較する

Pythonは多くの分野で使われている言語です。IoT端末として有名なRaspberry PIでも使われていますし、Webアプリケーションの開発にも使われています。しかし、最近の流行はなんといっても人工知能での使用です。

その背景には、Pythonで使える便利なライブラリがあります。高度な数値計算や統計、データの可視化などさまざまなライブラリを無料で使えるだけでなく、人工知能に関するライブラリも多く公開されています。もちろん、ビジネスで使うデータ分析でも十分な性能を持っています。

一方のR言語はデータ分析に特化した言語で、統計に関する処理はライブラリを導入することもなく高度な分析が可能です。もちろん、ライブラリを使うことで、便利な機能を追加できますが、ビジネスでのデータ分析であれば標準機能だけでも十分でしょう。

これらを考えたとき、どちらを学ぶのが良いのだろう?と悩む人がいます。また、次のような声もよく聞きます。

「これまでRを使っていたけれど、近年の人工知能ブームを受けてPythonも使ってみたい」
「Pythonは仕事で使っているけれど、手軽に使えるRに挑戦してみたい」

この本では、この両方の声に応えるため、PythonとR言語を比べながら、そのソースコードの書き方の違いを紹介しています。

統計学の考え方を知る

これまでプログラミング経験がある人は、PythonやRといった言語を学ぶことにそれほど抵抗はないはずです。スクリプト言語で、手軽に書けるため、少し勉強すればちょっとしたプログラムは簡単に書けるようになります。

ところが、データ分析で難しいのは、プログラミング言語について知っていても意味がないことです。便利なライブラリがあったとしても、その使い方を知らないと、どのように実装していいのかわかりません。また、結果が出ても、その読み取り方を知らないと誤った解釈をしてしまう可能性があります。

ここで大切なのはデータ分析の手法というよりも、統計学の考え方です。現在の機械学習は「統計的機械学習」と呼ばれるように、確率や統計を基礎とした技術です。つまり、統計の考え方が理解できていないとプログラムを作れないのです。

しかし、統計学を学ぼうと思っても、数学の知識がないと読めない本がたくさんあります。学生の頃に文系だった人はもちろん、理系で数学を学んでいた人でも、純粋な統計学の教科書はハードルが高いでしょう。

そこで、本書では統計学やデータ分析に関する処理をPythonやRで実装しながら、その実行結果の読み取り方も含めて数学的な背景も解説しています。

プログラムとして実際に動かしてみる

PythonやRが統計やデータ分析で便利なのはわかったけれど、環境構築が面倒だ、という声もよく聞きます。会社でちょっと試してみたいけれど、プログラムを勝手にパソコンにインストールすることは禁止されている、という会社も少なくありません。

そこで、この本ではPythonとRをWebブラウザ上で試す方法を紹介しています。必要なのはWebブラウザだけなので、パソコンだけでなくスマートフォンやタブレット端末でも試せます。

さらに、データ分析をしようと思ったときの最初のハードルとして「データがない」ことが挙げられます。「整形されたデータがなく、そのデータを用意するのが大変だ」という方が正確かもしれません。データ分析を練習したいのに、試せるデータがない、というのは残念です。

そこでこの本では、「オープンデータ」を使っています。政府や地方公共団体が持っているデータが、CSVやExcel、JSONなどさまざまな形式で公開されています。そして、これを自由に使えるのです。

書籍内で使ったデータはダウンロードできるようにしていますので、ぜひ気軽に試してみてください。

最後に

データ分析というと、ハードルが高く感じるかもしれませんが、私たちは普段からさまざまなデータに接しています。ちょっとしたアンケートを実施して結果を集計する、というのもデータ分析の1つです。

ぜひデータ分析を手軽に試してみていただければと思います。


この記事が気に入ったらサポートをしてみませんか?