書籍紹介
本書は、ビッグデータを分散処理するためのフレームワーク「Apache Spark」のクエリのパフォーマンスチューニングのノウハウを紹介した解説書です。Apache Sparkでのクエリのチューニングのための知識として、基本的なアルゴリズム、ログの見方、チューニングの考え方、Salted Join, Skew Joinなどのチューニングの手法を説明します。
続きを読む
短くする
電子版 ¥1,800 小売希望価格(税別)
印刷版 ¥1,800 小売希望価格(税別)
発行日:2021/10/01
発行社:インプレス NextPublishing
ページ数:38(印刷版)
ISBN:9784295600213
第1章 Apache Sparkとは
第2章 チューニングのための情報取得
第3章 基本的なアルゴリズム
第4章 チューニングの考え方
第5章 チューニングの手法
三上 威
甲南大学理学部にて応用数学を学んだ後、神戸日本電気ソフトウェア株式会社、株式会社ディー・エヌ・エーにてシステムエンジニア・データマイニングエンジニアとして従事する。フリーランスとして独立後、アーリース情報技術株式会社を設立。マーケティング領域を中心にデータ分析や基盤構築の支援・受託サービスなどを展開する。『Apache Hadoop & Spark ビッグデータプログラミング入門』『Apache Airflow ワークフロープログラミング入門』などの同人誌を製作。