Softwareentwicklung
Heutzutage werden viele Kurse Online angeboten. Ich habe mich bei Big Data University und Coursera registriert und schon Kurse besucht und abgeschlossen.
Die Kurse beinhalten auch einige Praxisübungen. Einige Firmen bieten ihren Hadoop Stack in Form von VM Images an. Durch die einfache Installation ist es möglich, Übungen am eigenen Rechner durchzuführen.
Für die Kurse von Big Data University habe ich als Testplattform InfoSphere BigInsights von IBM verwendet. Für die Kurse von Coursera, die ich gerade absolviere, verwende ich die QuickStart VM von Cloudera.
In dieser Specialization wird CDH5 von Cloudera verwendet. Einige Themen sind überschneidend mit den vorherigen Kursen, wie zB. HBase, Hive, PIG. Andere sind speziell von Cloudera, wie zB Impala, Spark. Jeder der Abschnitte besteht wiederum aus mehreren Unterabschnitten.
Neu sind auch die Themen "Machine Learning With Big Data" mit Apache Mahout und "Graph Analytics for Big Data" mit Apache Giraph.