Hadoop:The Tool for Processing Big Data

私たちの中で以前のブログビッグデータを処理および整理するプラットフォームは ハドゥープ。ここでは、ビッグデータを構造化するためのコアプラットフォームであり、分析目的での利用の問題を解決する Hadoop について詳しく学びます。これは、汎用ハードウェアのクラスター上でビッグデータを分散ストレージおよび分散処理するためのオープンソースソフトウェアフレームワークです。

Hadoop の主な特徴:

高いスケーラビリティ (スケールアウト)
コモディティハードウェアベース
オープンソース、低い取得コストと保管コスト

Hadoop は基本的に次の 2 つの部分に分かれています。 HDFS そして マップリデュース フレームワーク。 Hadoop クラスターは、大量の非構造化データを保存および分析するために特別に設計されています。ワークロードは、データを並行して処理する複数のクラスターノードに分散されます。

Hadoopの歴史

ダグ・カッティング Hadoop の背後にある頭脳であり、その起源は アパッチ そして ナッチ。 Nutch は 2002 年に開始され、それ自体はオープンソースの Web 検索エンジンです。 Google は、Mapreduce を世界に紹介する論文を公開しました。 2005 年初頭、Nutch 開発者は Nutch に Mapreduce を実装して機能していました。 2006 年 2 月に、Hadoop は Nutch によって独立したプロジェクトとして設立されました。 2008 年 1 月に、Hadoop は Apache で独自のトップレベルプロジェクトを作成し、この時までに Yahoo や Facebook などの大手企業が Hadoop を使い始めました。

HDFS は Hadoop の最初の側面であり、Mapreduce は 2 番目の側面です。 HDFS には、データの処理と整理に役立つアーキテクチャがあります。 HDFS、そのアーキテクチャ、機能、その他のいくつかの概念の詳細については、数日以内に公開されるブログに注目してください。

ご連絡ください。

マナサ・ヘゲレ

Ruby on Rails シニア開発者

クッキー	間隔	説明
cookielawinfo-チェックボックス分析	11ヶ月	この Cookie は、GDPR Cookie Consent プラグインによって設定されます。 Cookie は、「分析」カテゴリの Cookie に対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能的	11ヶ月	Cookie は、GDPR Cookie の同意によって設定され、カテゴリ「機能」の Cookie に対するユーザーの同意を記録します。
cookielawinfo-チェックボックス-必要	11ヶ月	この Cookie は、GDPR Cookie Consent プラグインによって設定されます。 Cookie は、Cookie に対するユーザーの同意を「必要」カテゴリに保存するために使用されます。
cookielawinfo-チェックボックス-その他	11ヶ月	この Cookie は、GDPR Cookie Consent プラグインによって設定されます。 Cookie は、カテゴリ「その他」の Cookie に対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11ヶ月	この Cookie は、GDPR Cookie Consent プラグインによって設定されます。 Cookie は、「パフォーマンス」カテゴリの Cookie に対するユーザーの同意を保存するために使用されます。
閲覧済み_cookie_policy	11ヶ月	Cookie は GDPR Cookie Consent プラグインによって設定され、ユーザーが Cookie の使用に同意したかどうかを保存するために使用されます。個人データは一切保存されません。

ビッグデータを処理するツール – Hadoop

最新のアップデートを購読する

投稿者について

管理者

コメントを残す返信をキャンセル

クイックナビゲーション

私たちのサービス

連絡先情報

最新のアップデートを購読する

投稿者について

管理者

コメントを残す 返信をキャンセル

コメントを残す返信をキャンセル