Big Data ist ein extrem großer Datensatz, der sowohl aus strukturierten als auch aus unstrukturierten Daten besteht. Sie weisen ein hohes Volumen, eine hohe Geschwindigkeit und eine große Vielfalt an Informationen auf, die kosteneffiziente, innovative Formen der Informationsverarbeitung erfordern, um einen besseren Einblick und eine bessere Entscheidungsfindung zu ermöglichen. Heutzutage hat die Datenmenge enorm zugenommen, was zu Big Data geführt hat.
Die Daten in einem Unternehmen wachsen heutzutage über MBs, TBs oder GBs hinaus. Es geht darum, was passiert, wenn die Daten mehr wachsen, als es heute der Fall ist. In der Zukunft könnten die Daten auf etwa Petabyte (1024 TB) oder Exabyte (1024 PB) oder Zettabyte (1024 EB) oder Yottabyte (1024 ZB) anwachsen. Einige der Datenfakten sind, dass die New Yorker Börse etwa 1 Terabyte an Daten pro Tag erzeugt, Facebook etwa 10 Milliarden Fotos beherbergt, was etwa ein Petabyte an Daten ausmacht, und Twitter 8 TB an Daten erzeugt.
Für die meisten geht es bei Big Data nicht nur um die Größe der Daten, sondern auch um die 4V's der Daten. Während das Datenvolumen einer der Aspekte von Big Data ist, umfasst es auch die Vielfalt der Daten und die Geschwindigkeit, mit der die Daten in das Unternehmen gelangen, sowie den Wert der Daten für das Unternehmen. Der Wert ist für jedes Unternehmen sehr wichtig. Daher wird er als die 4 Vs von Daten zusammengefasst: Volumen, Schnelligkeit, Vielfalt, Wert.
Die Verarbeitung dieser Big Data erfordert eine Plattform, um die Daten zu organisieren und ordnungsgemäß zu verarbeiten. Hadoop ist die Plattform, die bei der Organisation und Verarbeitung von Big Data hilft, die ihren Ursprung in Apache Nutch.
Bei SchienenCarma wir haben Hadoop erfolgreich eingesetzt, um große Datenmengen für unsere Kunden zu organisieren, und wir werden unsere Erfahrungen und Erkenntnisse in unseren kommenden Blogs teilen. Bleiben Sie also auf dem Laufenden.
Nehmen Sie Kontakt mit uns auf.
Manasa Heggere
Leitender Ruby on Rails-Entwickler