サイト内検索
Translation here

2016/02/16(火)ビッグデータを扱う

お疲れさまです、野村です。
R言語という、CやらDやらが出てきている中でデータ解析に特化したものを扱ってきました。
正直よくわからない分野ですが、やりたい事は何となくわかったので備忘録がてら共有します。

What is
オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Reference(リファレンス)が充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。
[&https://machinelearningstudy.doorkeeper.jp/events/39151?utm_campaign=event_39151_31983&utm_medium=email&utm_source=registered_message]
R言語を使う理由
  • リファレンスが和訳されている
  • Pythonは訳されてない
    • 数自体はある
使ってみると思ったより楽しかった。
↑講義後になるほど、これは大事な項目だと思いました。

が、いわくR側の不具合?みたいなものがあるようです。
そもそもデータの使い方自体が間違っている可能性もあるんじゃないかと思いますが、この辺は正直Rがまだ分かってないから全然自信がない…
とりあえず分かったのは、設定の仕方に気を付ければより精度の高いデータを見つけられるとのこと。

言語のお勉強かと思っていたんですが、Excelのsolverの話が出てきました。
この辺をしっかり押さえておかないとデータ解析者が正しくデータを扱えないため。なるほど!


まとめ・雑感
データサイエンス徹底演習、という事で、正直私の苦手な分野です(-_-;)
とはいえ、やらなければならない話ではあるのでハラを括って(笑)今回のワークショップに参加した次第です。

受けてみて、とても学生の意見とは思えない内容がちらりと出てきて非常に面白かった!
まあ当然、こういう話は現場で聞いてナンボみたいなところがあるので、私からは公開できないのが歯がゆいところですが、学びが非常に多くて面白かったですよ。

今回の流れが非常にわかりやすいのは筋道立てて説明されているところも

何気にエクセルの使い方から説明しているのは良かったかもしれません。
最初は確かに何言ってんだ?と思ったものですが、グラフをガッツリ使い込んだ事はあまりないので、データの見方や考え方についても学びがありました。
何事も素直にやるのは大事ですね。


但しデータの説明をする必要がありますね。でないと聴衆が置いてけぼりになってしまう。
折角のRの話なのでデータの説明のためにもちょっとした図表があった方がよかったかもしれない。
技術者向けだったらそういうものは要らないんでしょうが、個人的にはどうも気になったところです。

そういう意味ではSolverの便利な使い方については参考になりました。とはいえ運用者が気にするべき内容なので技術者向けではないけど、
技術者も運用を知らなければ話にならない昨今、Rについては別で記事を建てます。

ざっくりですがそういう感じでした。
参加者的には概ね理解できれば後は何とかなったんですが、正直お伝えするにしてはちょっと難しいかなぁ。
私なりにまとめて説明できるレベルにまで持って行けた方がいいと思うんで、やっぱり別に記事を建てることにします。


講演者さま、ご参加された皆さま。
今日はありがとうございました!
OK キャンセル 確認 その他